Contenuti A.A. 2012/2013

Lezioni del 17-18-19 aprile
Nozione di 'dato linguistico', definizione semiotica di dato, ruolo dei dati in linguistica, tipi di dati dati linguistici. Dati primari e secondari. Come ottenere dati non ancora prodotti? Metodo introspettivo, scoperta e elicitazione di dati: tecniche principali. Metodi e strumenti per costituire il proprio corpus di analisi. Questionari, registrazioni, video, immagini. Metodo (scientifico?): differenze tra descrizione, analisi e spiegazione dei dati linguistici.
Download PDF

Lezioni del 24 aprile, 2-3 maggio
Le basi della Corpus Linguistics. La filosofia della Corpus Linguistcs, approcci corpus-based e corpus-driven, primato del Lexis, prosodia semantica. Inquadramento storico della Corpus Linguistics. Definizione di corpus, a cosa serve un corpus, esempi preliminari di ricerca sul corpus Repubblica. Oxford Text Archive. Rappresentatività, bilanciamento, sampling, domande guida nella costruzione di un corpus. Aspetti più tecnici per la costruzione di un corpus: Sample corpus, monitor corpus - esempi. Chiusura o saturazione di un corpus. Sampling: sampling frame, sampling units, simple e stratified random sampling. Dimensioni dei testi, dimensioni dei corpora. Problemi frequenti nella trasformazione di un archivio di dati (elicitati) in un corpus di dati, problemi etici, copyright, liberatorie, problemi di codifica.
Download PDF

Lezioni del 8-9-10 maggio
Mark-up e annotazione. Protocollo Text Encoding Initiative. Informazioni di base sulla sintassi di XML, esempi. DTD: come crearla o come sceglierne una esterna. Diversi tipi di annotazione: fonologica, morfologica, lessicale, sintattica, semantica, pragmatica, annotazione di errori: esempi. Illustrazione di risorse pertinenti. Come si costruisce un corpus: riassunto degli step e degli elementi tecnici da considerare. Tipologia dei corpora: nozioni centrali. Sample e Monitor corpora, corpora paralleli e comparabili, corpora diacronici, accesso diretto e indiretto ai dati. Analisi dettagliata del BNC.
Download PDF

Lezioni del 15-16-17 maggio
Corpora per l'italiano, corpora per altre lingue, corpora paralleli e comparabili: esempi concreti di utilizzo dei corpora. Database: descrizione e esempi. Il web come corpus: problemi, misure, storia, vantaggi.
Download PDF

Lezioni del 22-23-24 maggio
Il web come corpus: WebCorp e altri strumenti per analizzare i dati del web come se fossero un corpus. Luoghi dove trovare testi per costruire un corpus. Concordancing tools online e software da scaricare. Significatività statistica: teoria e pratica. Il Test del Chi Quadro.
Download PDF

Unless otherwise stated, the content of this page is licensed under Creative Commons Attribution-ShareAlike 3.0 License