Materiali didattici - A.A. 2011-2012

Lezioni del 16-17-20/4
Dato linguistico": individuazione, raccolta, descrizione, analisi. Nozione di 'dato linguistico', differenze tra descrizione, analisi e spiegazione dei dati linguistici. Raccolta di dati e elicitazione di dati: strumenti e tecniche per costituire il proprio
corpus di analisi. Questionari, registrazioni, video, immagini. Regole di trascrizione del parlato. Raccolta di dati finalizzata alla descrizione di una lingua e raccolta di dati finalizzata a specifiche ricerche.
Download file
Mappe

Lezioni del 23-24-27/4
Fondamenti della Corpus Linguistics e un po' di storia. Corpus-based vs corpus-driven Linguistics. Cos'è un corpus: rappresentatività, bilanciamento, campionamento. Tecniche di sampling e costruzione di un corpus. Sample e Monitor corpora, corpora generali e specifici. Nozioni di chiusura e saturazione. Dimensioni di un corpus.
Download file

Lezioni del 4-7-8/5
Acquisizione dei dati e codifica di primo e secondo grado. Fondamenti di XML finalizzati all'annotazione. TEI e problema della standardizzazione. Mark-up e annotazione: un confronto. Tipi di annotazione: una panoramica. Tipi di corpora: una classificazione preliminare. Corpora generali, specializzati, sample e monitor corpora, corpora multilingui e diacronici. Analisi approfondita dei principali corpora per l'inglese e l'italiano.
Download file

Lezioni del 14-15-18/5
Analisi dei corpora per l'italiano. Map Task Corpus, in italiano e inglese. Corpora diacronici: Perseus e Titus. Corpora paralleli: alcuni esempi. Differenze tra corpus e database: i database come strumenti per la ricerca comparativo-tipologica. Odin database, Ethnologue, Wals, LTD. Il Web come corpus: un'introduzione. Vantaggi, dimensioni e problemi.
Download file

Lezioni del 21-22/5
Web come corpus: esperimenti e ricerche possibili. Problemi di rappresentatività e problemi nel reperimento di dati. WebCorp, Webascorpus, e altri strumenti per utilizzare il Web come corpus. Diversi all approcci possibili alla costruzione di un corpus a partire dal web. Crawlers. Repositories di testi online: liberliber, progetto Gutenberg, bibliotecaitaliana. Concordancing tools: descrizione approfondita di AntConc, CasualConc, TextEdit. Cenni sulla significatività statistica e sul test chi-quadro, con esempi.
Download file

Unless otherwise stated, the content of this page is licensed under Creative Commons Attribution-ShareAlike 3.0 License