Ciencia sin prisa, pero con propósito

Mejoramos el descubrimiento, selección y reutilización de datos en repositorios, open data, plataformas federadas y data spaces, mediante perfiles mínimos de metadatos, anotación semántica HITL asistida por LLM y motores de búsqueda basados en graph embeddings.

KALMA aborda los retos de la compartición federada de datos proponiendo

Taxonomía y perfiles mínimos de metadatos

Definir una taxonomía de modelos (repositorios, open data, DW/DL, APIs/servicios, plataformas federadas y data spaces) y especificar perfiles mínimos de metadatos por modelo, mapeados a DCAT/DCAT-AP, DQV y ontologías de dominio.

Asistente de anotación semántica HITL

Diseñar un pipeline de análisis de datasets y sugerencia de anotaciones alineadas con ontologías del ecosistema, con validación explicable, edición guiada y métricas de calidad; uso de LLM para reducir costes de validación.

Grafo de metadatos y ranking con graph embeddings

Construir un grafo de metadatos (metadatos + ontologías + linaje + políticas + indicadores de calidad/uso) y evaluar familias de embeddings/GNN para similitud semántica y ranking multiobjetivo.

Calidad, confianza y decisión

Definir métricas de calidad por propósito de uso, integrar señales de confianza (certificaciones, SLAs/OLAs, casos validados), vincular procedencia con explicabilidad y establecer KPIs operativos (tiempo/coste de selección, tasa de adopción).