Negli ultimi anni, molte delle metodologie tipiche del Natural Language Processing (Chiari 2007; Jurafsky & Martin 2009) sono state applicate allo studio del greco antico (Papantoniou & Tzitzikas 2020). Nell’ambito della morfologia, ad esempio, ricordiamo la creazione del lemmatizzatore GLEM (Bary et al. 2017). Quest’ultimo usa le parti del discorso per disambiguare parole che potrebbero appartenere allo stesso lemma e, contemporaneamente, è in grado di crearne di nuovi grazie a una componente di apprendimento dotata di memoria ricorsiva. In ambito sintattico, invece, ricordiamo la creazione dell’Ancient Greek and Latin Dependency Treebank (Bamman e Crane 2011). Questo strumento contiene i testi di Omero, Esiodo, Eschilo e l’Aiace di Sofocle per il greco; e i testi di Cesare, Cicerone, Girolamo, Ovidio, Petronio, Properzio, Sallustio e Virgilio. Di questi testi offre un’analisi morfologica e lessicografica di tipo quantitativo. Lo scopo, dunque, è quello di dare una base empirica, e non più soltanto intuitiva, ai dati filologici. In questo lavoro vorremmo presentare alcune delle applicazioni di questi nuovi strumenti all’interno della linguistica storica e della filologia classica. Nel primo settore vorremmo ricordare la creazione di corpora annotati, come quello creato da Keersmaekers (2020b) per facilitare l’analisi linguistica dei papiri greci e GLAUx (Keersmaekers 2021). Questo corpus dovrebbe analizzare sedici secoli della storia letteraria greca, prendendo in considerazione diversi generi letterari. Molta attenzione in questo corpus è posta sull’analisi sintattica e su quella dei ruoli semantici dei singoli token (Keersmaekers 2020a). Accanto ai corpora appena citati, vorremmo presentare in questa sede HoDeL (The Homeric Dependency Lexicon), il quale utilizza l’Ancient Greek and Latin Dependency Treebank come base per creare un lessico annotato di tutti i verbi e i loro argomenti (Zanchi 2021). Nel settore della filologia, invece, intendiamo evidenziare come i treebank possano diventare un nuovo strumento utile allo studioso per la creazione di un commento o di un’edizione critica di un dato testo (Bamman et al. 2009; Bamman & Crane 2010). Infine, ci sembra interessante esaminare quegli studi in cui questi nuovi strumenti sono stati usati per risolvere casi dubbi della paternità di un’opera. È il caso, ad esempio, nello studio sugli excerpta di Polibio (Gorman & Gorman 2016), sulla Epistola VII di Platone (Perry 2021) e sul Reso, solitamente attribuito a Euripide (Manousakis & Stamatatos 2018). Lo scopo del lavoro è quello di sottolineare i vantaggi dell’applicazione del Natural Language Processing sia all’analisi linguistica che a quella filologica, focalizzandoci sulle specificità delle due discipline (Boschetti 2009) e sulle possibilità offerte dalla loro compenetrazione (Gerdes 2013; Mambrini 2016).
Linguistica storica, filologia classica e i nuovi orizzonti del NATURAL LANGUAGE PROCESSING
Giulia Greco
2023-01-01
Abstract
Negli ultimi anni, molte delle metodologie tipiche del Natural Language Processing (Chiari 2007; Jurafsky & Martin 2009) sono state applicate allo studio del greco antico (Papantoniou & Tzitzikas 2020). Nell’ambito della morfologia, ad esempio, ricordiamo la creazione del lemmatizzatore GLEM (Bary et al. 2017). Quest’ultimo usa le parti del discorso per disambiguare parole che potrebbero appartenere allo stesso lemma e, contemporaneamente, è in grado di crearne di nuovi grazie a una componente di apprendimento dotata di memoria ricorsiva. In ambito sintattico, invece, ricordiamo la creazione dell’Ancient Greek and Latin Dependency Treebank (Bamman e Crane 2011). Questo strumento contiene i testi di Omero, Esiodo, Eschilo e l’Aiace di Sofocle per il greco; e i testi di Cesare, Cicerone, Girolamo, Ovidio, Petronio, Properzio, Sallustio e Virgilio. Di questi testi offre un’analisi morfologica e lessicografica di tipo quantitativo. Lo scopo, dunque, è quello di dare una base empirica, e non più soltanto intuitiva, ai dati filologici. In questo lavoro vorremmo presentare alcune delle applicazioni di questi nuovi strumenti all’interno della linguistica storica e della filologia classica. Nel primo settore vorremmo ricordare la creazione di corpora annotati, come quello creato da Keersmaekers (2020b) per facilitare l’analisi linguistica dei papiri greci e GLAUx (Keersmaekers 2021). Questo corpus dovrebbe analizzare sedici secoli della storia letteraria greca, prendendo in considerazione diversi generi letterari. Molta attenzione in questo corpus è posta sull’analisi sintattica e su quella dei ruoli semantici dei singoli token (Keersmaekers 2020a). Accanto ai corpora appena citati, vorremmo presentare in questa sede HoDeL (The Homeric Dependency Lexicon), il quale utilizza l’Ancient Greek and Latin Dependency Treebank come base per creare un lessico annotato di tutti i verbi e i loro argomenti (Zanchi 2021). Nel settore della filologia, invece, intendiamo evidenziare come i treebank possano diventare un nuovo strumento utile allo studioso per la creazione di un commento o di un’edizione critica di un dato testo (Bamman et al. 2009; Bamman & Crane 2010). Infine, ci sembra interessante esaminare quegli studi in cui questi nuovi strumenti sono stati usati per risolvere casi dubbi della paternità di un’opera. È il caso, ad esempio, nello studio sugli excerpta di Polibio (Gorman & Gorman 2016), sulla Epistola VII di Platone (Perry 2021) e sul Reso, solitamente attribuito a Euripide (Manousakis & Stamatatos 2018). Lo scopo del lavoro è quello di sottolineare i vantaggi dell’applicazione del Natural Language Processing sia all’analisi linguistica che a quella filologica, focalizzandoci sulle specificità delle due discipline (Boschetti 2009) e sulle possibilità offerte dalla loro compenetrazione (Gerdes 2013; Mambrini 2016).I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.


