Nel contributo vengono descritte le scelte teoriche e metodologiche effettuate nella realizzazione di un corpus di italiano parlato da stranieri, il corpus LIPS - Lessico di Italiano Parlato da Stranieri. Innanzitutto sono descritti i criteri di selezione del corpus che è derivato dalle prove di esame orale della CILS - Certificazione di Italiano Lingua Straniera dell'Università per Stranieri di Siena. Sono illustrati i metadati che accompagnano ogni singola prova e le modalità di archiviazione. Il contributo prende dunque in esame i criteri di trascrizione per parlato e le motivazioni che hanno determinato la scelta di una trascrizione di tipo ortografico. In seguito sono illustrate le procedure di lemmatizzazione e i criteri che sono stati utilizzati in questa fase della ricerca. Il contributo propone infine una riflessione sulle scelte teoriche e metodologiche su cui è possibile fondare la creazione di un corpus di non nativi.
Il corpus LIPS (Lessico dell’italiano parlato da stranieri): problemi di trattamento delle forme e di lemmatizzazione
GALLINA, FRANCESCA;
2009-01-01
Abstract
Nel contributo vengono descritte le scelte teoriche e metodologiche effettuate nella realizzazione di un corpus di italiano parlato da stranieri, il corpus LIPS - Lessico di Italiano Parlato da Stranieri. Innanzitutto sono descritti i criteri di selezione del corpus che è derivato dalle prove di esame orale della CILS - Certificazione di Italiano Lingua Straniera dell'Università per Stranieri di Siena. Sono illustrati i metadati che accompagnano ogni singola prova e le modalità di archiviazione. Il contributo prende dunque in esame i criteri di trascrizione per parlato e le motivazioni che hanno determinato la scelta di una trascrizione di tipo ortografico. In seguito sono illustrate le procedure di lemmatizzazione e i criteri che sono stati utilizzati in questa fase della ricerca. Il contributo propone infine una riflessione sulle scelte teoriche e metodologiche su cui è possibile fondare la creazione di un corpus di non nativi.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.