In questo contributo presentiamo Text-2-Knowledge (T2K), una piattaforma software sviluppata congiuntamente dall’Istituto di Linguistica Computazionale (CNR) e dal Dipartimento di Linguistica dell’Università di Pisa per l’acquisizione di tipi diversi di informazione semantico-lessicale da documenti testuali. Attraverso l’uso combinato di tecniche statistiche e di strumenti avanzati per il TAL, T2K è in grado di analizzare il contenuto linguistico dei documenti, individuare i termini potenzialmente più significativi, ricostruire una “mappa” multidimensionale dei concetti espressi da questi termini, sviluppare un’ontologia del dominio di interesse. Per scopi espositivi, il funzionamento di T2K sarà illustrato con i risultati di esperimenti di estrazione e strutturazione di terminologia metalinguistica condotti su un corpus di testi del settore della Linguistica Computazionale.
Text-2-Knowledge: una piattaforma linguistico-computazionale per l’estrazione di conoscenza da testi
LENCI, ALESSANDRO;
2009-01-01
Abstract
In questo contributo presentiamo Text-2-Knowledge (T2K), una piattaforma software sviluppata congiuntamente dall’Istituto di Linguistica Computazionale (CNR) e dal Dipartimento di Linguistica dell’Università di Pisa per l’acquisizione di tipi diversi di informazione semantico-lessicale da documenti testuali. Attraverso l’uso combinato di tecniche statistiche e di strumenti avanzati per il TAL, T2K è in grado di analizzare il contenuto linguistico dei documenti, individuare i termini potenzialmente più significativi, ricostruire una “mappa” multidimensionale dei concetti espressi da questi termini, sviluppare un’ontologia del dominio di interesse. Per scopi espositivi, il funzionamento di T2K sarà illustrato con i risultati di esperimenti di estrazione e strutturazione di terminologia metalinguistica condotti su un corpus di testi del settore della Linguistica Computazionale.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.