Obiettivi
ReAD – Representation of Architectural Data nasce con l’obiettivo di promuovere la conoscenza, la tutela e la valorizzazione del patrimonio architettonico, grazie all’applicazione di tecnologie legate all’intelligenza artificiale. Il progetto, nello specifico, intende lavorare su fonti testuali e iconografiche non strutturate con lo scopo renderle disponibili all’interno del web semantico, attraverso la creazione di tecnologie computazionali in grado di estrarre automaticamente informazioni significative e quindi collegarle in un knowledge graph machine readable, semanticamente coerente.
I sistemi computazionali che verranno sviluppati, i dati estrapolati e le ontologie relative saranno resi pubblici per essere immediatamente riutilizzati dalle imprese operanti nel territorio della Regione Lazio.
Cos'è ReAD
ReAD risponde alla necessità di tutelare, preservare e valorizzare il patrimonio culturale. Il patrimonio architettonico del territorio risulta essere straordinariamente ricco ed eterogeneo per stili, caratteristiche morfologiche e strutturali.
L’obiettivo di ReAD è di mettere in luce tale ricchezza attraverso tecnologie informatiche che permettano l’estrazione automatica di dati strutturati da fonti non strutturate (corpus testuali in linguaggio naturale e immagini) e l’accessibilità a tali informazioni all’interno del semantic Web sotto forma di knowledge graph e Linked Open Data.
Conoscenza
Le fonti testuali e visive diventano serbatoi di dati strutturati: vengono modellati semanticamente e disseminati in formato LOD, rendendoli riutilizzabili nei processi di gestione
Diagnostica
Le informazioni relative allo stato di conservazione di un bene sono estratte per sviluppare un modello che definisca le fasi del processo diagnostico di un bene culturale
Valorizzazione
La creazione di nuovi paradigmi per la promozione e la fruizione basati su tecnologie ICT rende possibile l’accesso e il riutilizzo dei dati in ambiente aperto e semantico
Gestione
La catalogazione innovativa e massiva dei beni culturali si incontra con la creazione di modelli ontologici su misura per la descrizione del patrimonio utilizzando fonti diverse
Obiettivi finali
Tecnologie
Tecnologia di Natural Language Processing e Machine learning che analizzi corpora iconografici e testuali per estrarre dati strutturati trasformandoli in LOD.
Ontologie
Modelli ontologici open source basati su standard tecnologici e di dominio, in grado di descrivere in maniera coerente e semanticamente strutturata i dati estratti.
Metodologia
Una metodologia riproducibile sia per la creazione dei sistemi semantici di data extraction, che per la modellazione di ontologie di domini molto specifici.
Obiettivi intermedi
DATASET
La creazione di un dataset pubblico di immagini annotate, composto da fotografie e da disegni di architettura, che possa essere utilizzato da altri enti di ricerca o da aziende per sperimentare nuove tecnologie per la descrizione del patrimonio immobiliare
ONTOLOGIE
L’ampliamento dell’ontology network del patrimonio culturale italiano (ArCo-Architettura della Conoscenza), mettendo a disposizione delle imprese nuovi dati strutturati in formato Linked Open Data (LOD) sui beni architettonici, riutilizzabili in domini diversi da quello culturale
VOCABOLARIO
La creazione automatica di un vocabolario controllato, elaborato in base ai dati descrittivi associati alle immagini catalogate e volto all’annotazione e alla descrizione delle immagini stesse per un’identificazione semantica delle fonti
DIGITALIZZAZIONE
L’incentivazione della digitalizzazione dei documenti testuali e grafici dell’architettura, che da materiale inerte e scarsamente significativo all’interno del web semantico diventa fonte imprescindibile di informazioni per la scoperta e la preservazione del patrimonio culturale
FORMAZIONE
La formazione di addetti alla ricerca, rivolta allo sviluppo di competenze in grado di produrre soluzioni di interesse per le imprese, permettendo a nuovi ricercatori di entrare in contatto con le esigenze delle imprese del Lazio