El Problema de la Dispersión
Las bases de datos relacionales fallan al intentar conectar la multidimensionalidad del arte (patrimonio histórico) (autor, estilo, lugar, tiempo, contexto). Mi objetivo: crear un modelo unificado que permita navegar el patrimonio no por listas, sino por contextos.
El patrimonio cultural español está disperso en múltiples fuentes heterogéneas, con modelos de datos poco interoperables y sin una estructura semántica que permita razonamientos complejos o exploración avanzada.
Este proyecto demuestra cómo construir un grafo de conocimiento unificado de monumentos de España, basado en una ontología propia, integrando Wikidata, Dbpedia y vocabularios institucionales, y explotarlo mediante un front-end semántico.
El objetivo no es solo mostrar datos, sino demostrar un flujo completo de ingeniería semántica: modelado ontológico, extracción masiva de entidades, normalización, enlazado, inducción de conocimiento y publicación web basada en grafos. Es, en definitiva, un proyecto de arquitectura del conocimiento.
La Ontología (El Cimiento)
La ontología parte de un estudio sistemático y se fundamenta en sus definiciones en el Tesauro de Bienes Culturales, Tesauro de Contextos Culturales y en las clases de Wikidata y Dbpedia. Lo que garantiza interoperabilidad.
Alrededor de la clase padre Sitio_de_Interés, se organiza la ontología. Esta expresa cualquier tipología ubicable y definible de monumento, resto, etc. Encontramos clases genéricas como Arquitectura Civil, Militar, Religiosa, etc. que subsumen una plétora de clases que definen tipos más concretos como Castillo o Catedral.
La ontología actúa, así, como una “columna vertebral semántica” que permite armonizar datos abiertos, datos colaborativos y vocabularios institucionales.

La dimensión temporal queda cubierta con las clases Siglo y Época Histórica, que nos permiten tratar con divisiones de periodos temporales que estudia la Historia y subsumir así las entidades.
Las clases Estilo Artístico y Cultura Arqueológica aportan divisiones y dimensiones culturales y antropológicas a las entidades.
Cada clase y entidad posee, en lo posible, vínculos a sus definiciones en colecciones exteriores (rdfs:isDefinedBy rdfs:seeAlso) además de etiquetas alternativas (skos:altLabel) para facilitar búsquedas por palabra en la propia ontología. Esto nos garantiza que las ontología esté interconectada, respaldada por definiciones aceptas ampliamente y con mayor acceso a información.

En resumen la ontología de monumentos:
- No es una ontología cerrada.
- Es una ontología de integración.
- Está alineada con:
- Tesauro de Bienes Culturales.
- Tesauro de Contextos Culturales.
- Clases de DBpedia.
- Clases de Wikidata.
Ingeniería de Datos: Estrategia de Ingesta
Wikidata posee gran cantidad de datos, pero sus clases resultan a menudo caóticas. Para extraer solo la «señal» y descartar el «ruido», optimizando costes computacionales, implementé una estrategia de slicing semántico usando Wdumper.
La extracción es dirigida por ontología y a la vez esta se completa gracias a la extracción. Filtrando solo tipologías de entidades relevantes para monumentos de España.
Esta estrategia permite trabajar con volúmenes masivos de datos manteniendo control semántico y eficiencia computacional, algo imprescindible en proyectos reales de Web Semántica.
Las extracciones son montadas en una TDB2 de Apache Jena Fuseki, y mediante consultas Insert de SPARQL los tipos y propiedades son mapeados a la ontología, obteniendo la estructura lógica deseada.
El Corazón del Sistema: Enriquecimiento y Normalización
- Normalización Geográfica: Gracias a mi grafo geográfico de Lugares de España, corregí la anarquía de la propiedad P131 de Wikidata, ubicando cada monumento en su jerarquía administrativa correcta (Provincia/Municipio).
- La vinculación de entidades con Dbpedia en español se realiza del mismo modo que el grafo de lugares de España: Por ID/Estructura: Wikidata ↔ Wikipedia ↔ DBpedia (Mapeo directo). (con método robusto basado en schema:about).
- Creación de un grafo de apoyo con los Wikilinks de Wikipedia/Dbpedia, que a través de la relación skos:related se relacionan con los Sitios de interés. Los Wikilinks son enlaces que se encuentran en los artículos de Wikipedia que dirigen a otros artículos, o entidades de Dbpedia, en nuestro caso.
- Generación de contexto Histórico (Wikilinks): No solo importé el monumento, sino su ecosistema. Al traer los Wikilinks y categorizarlos, el grafo sabe qué ‘Sucesos Históricos‘ ocurrieron en el ‘Castillo X‘ y las personas relacionadas con el lugar.
Inducción semántica de conocimiento ontológico
Con lo que tenemos ahora mismo en el grafo y en la ontología somos capaces de hacer consultas como: «¿En qué lugares hay Palacios de estilo Barroco y cuales son sus arquitectos? O mejor aún ¿Qué tipos de monumentos existentes tienen estilo Barroco?
Sin embargo, estas consultas necesitan recuperar primero las propiedades de cada entidad, lo que yo pretendo es inducirlas, es decir, elevar las propiedades de las entidades a las propias clases:
monu:Barroco monu:tieneTipo monu:Casa_Solariega , monu:Cruz_monumental , monu:Retablo , monu:Plaza_porticada …Lenguaje del código: CSS (css)
Este proceso inductivo eleva propiedades directamente a las clases desde la entidades, generando nuevas relaciones, basadas, en los «datos» y relacionando todas las clases entre si:
- tipos con estilos
- estilos con siglos
- siglos con tipos
- tipos con culturas
- culturas con siglos
- tipos con lugares
…
De este modo construimos un Motor de Recomendación Semántica, transformando datos implícitos en conocimiento explícito.
- Antes sabíamos que «La Catedral de Burgos tiene estilo Gótico«. Ahora el grafo sabe que «El Gótico se caracteriza por la presencia de Catedrales«.
- Esto permite al frontend sugerir «Tipos de monumentos probables» cuando el usuario filtra por un estilo, sin que un humano haya programado esa regla.
Esto dota al sistema de «sentido común» arquitectónico. El frontend no necesita reglas hardcodeadas; «sabe» qué esperar de un monumento barroco basándose en la evidencia de los datos acumulados, permitiendo filtros predictivos y navegación por descubrimiento.
Obtenemos una ontología que posee mayor conocimiento de la realidad directamente desde sus propias clases.

- Las clases dejan de ser solo contenedores.
- Se convierten en nodos activos de conocimiento.
- Se enriquecen automáticamente desde los datos.
- Aparece una ontología viva, no estática.
Uso del grafo como motor de inferencias
Gracias al grafo de monumentos pude realizar el experimento que menciono en Toponimia Histórica (ver en acción) en el que logré situar con plausibilidad 2.594 posibles emparejamientos, en los lugares históricos donde originalmente fueron creados o erigidos los monumento o Sitios de interés.

Prueba de que el grafo no solo describe, sino que permite formular hipótesis históricas., y nos permite:
- Razonamiento histórico.
- Reubicación semántica.
- Hipótesis plausibles.
- Uso del grafo como motor de inferencias.
Explorador semántico: Visualizando la Inteligencia
Construido para poner a prueba algunas de las capacidades del grafo. La filosofía de la interfaz es la de partir de un Tipo, Siglo, Estilo, Cultura o Edad Histórica y a través de una cadena de consultas SPARQL y gracias a las propiedades inducidas, obtener a parte de los propios Sitios de interés, siglos, estilos, culturas, provincias, arquitectos, personas, eventos históricos, vinculados a esa clase inicial. Estas nuevas clases relacionadas sirven para filtrar la clase principal.
El usuario construye consultas semánticas complejas sin escribir SPARQL. Lo que nos permite una auténtica navegación por grafo de conocimiento.
Se utilizan consultas SPARQL en cadena para cargar todas las relaciones semánticas de la clase y las entidades. Y constituye una interfaz de consulta ontológica de pleno derecho.


Cada nueva clase o lugar fruto de la inducción puede usarse como filtro dentro del resultado principal:
Románico + Centro Histórico

Románico + Guerra de los Dos Pedros

Existe una vista de detalle de cada Sitio de interés haciendo clic o doble clic en él:

Una línea de tiempo nos permite desplegar los monumentos por fechas y filtrar por tipos, provincias y estilos:

También un editor SPARQL donde realizar consultas y explorar el grafo de monumentos de España:

En la sección Paseo por el tiempo uso un bucle de consultas sparql para cargar de forma automática y secuencial monumentos por siglos, estilos, culturas, provincias…generando una experiencia de sucesión temporal gracias al grafo y demostrando su consistencia temporal.

Recomendaciones para una mejora y ampliación del grafo:
- Sería posible y deseable transformar, mapear e incluir los datos de monumentos y lugares que poseen las Comunidades Autónomas, e incluso los Ayuntamientos para aumentar y mejorar su alcance.
- Añadir elementos arquitectónicos y cualidades artísticas (bóveda de cañón…)
- Extracción de entidades de las descripciones para aumentar la densidad del grafo.
- Implementar y mejorar la navegación por temas.
Qué demuestra este proyecto
Este proyecto demuestra capacidad para:
- Diseñar ontologías complejas.
- Integrar múltiples fuentes RDF heterogéneas.
- Ejecutar procesos masivos de entity linking.
- Normalizar modelos semánticos inconsistentes.
- Inducir nuevo conocimiento ontológico.
- Diseñar front-ends basados en grafos.
- Publicar documentación ontológica profesional (LODE, WIDOCO).
- Crear infraestructuras reales de grafos de conocimiento.
Aplicaciones profesionales
- Portales de patrimonio cultural semánticos.
- Turismo cultural inteligente.
- Catálogos históricos enriquecidos.
- Sistemas de recomendación culturales.
- Integración con GIS y GeoSPARQL.
- Investigación en humanidades digitales.
- Proyectos de digitalización institucional.
Estadísticas
Grafo:
| Sitios de interés | 142.884 |
| Con coordenadas geográficas | 118.712 |
| Con imagen | 52.959 |
| Con estilo artístico | 30.380 |
| Con cultura arqueológica | 22.853 |
| Con siglo | 15.350 |
| Con año de construcción | 15.129 |
| Con época histórica | 6.027 |
| Con arquitecto | 3.181 |
| Vinculados con Dbpedia | 16.598 |
| Categorías | 12.777 |
| Wikilinks | 34.922 |
| Triples | 1.2878.447 |
Ontología:
| Clases | 220 |
| Propiedades de objeto | 77 |
| Propiedades de datos | 27 |
Inducciones:
| Nuevas afirmaciones | 165.849 |
De los Datos al Conocimiento Estratégico
La construcción del Grafo de Monumentos de España demuestra que la Web Semántica es mucho más que una tecnología de archivo; es un motor de descubrimiento capaz de transformar datos aislados en activos inteligentes. Al procesar más de 12 millones de tripletas y aplicar razonamiento inductivo, hemos convertido un listado plano en un ecosistema navegable que «entiende» contextos históricos y geográficos.
Estas mismas metodologías de Ingeniería del Conocimiento, normalización de datos heterogéneos y enriquecimiento semántico son directamente aplicables a otros sectores, desde la gestión de catálogos complejos en e-commerce hasta la integración de datos corporativos o sistemas de recomendación inteligente.
Si tu organización necesita romper silos de información, diseñar ontologías a medida o transformar grandes volúmenes de datos en un Knowledge Graph explotable, hablemos. Ofrezco servicios profesionales de consultoría e implementación técnica para llevar tus datos al siguiente nivel de inteligencia.
Deja una respuesta