- Oggetto:
- Oggetto:
Corpus Linguistics
- Oggetto:
Corpus Linguistics
- Oggetto:
Anno accademico 2024/2025
- Codice attività didattica
- STU0819
- Docente
- Eugenio Goria (Titolare del corso)
- Corso di studio
- laurea magistrale in Scienze linguistiche
- Anno
- 1° anno, 2° anno
- Periodo
- Primo semestre
- Tipologia
- Affine o integrativo
- Crediti/Valenza
- 6
- SSD attività didattica
- L-LIN/01 - glottologia e linguistica
- Erogazione
- Tradizionale
- Lingua
- Inglese
- Frequenza
- Facoltativa
- Tipologia esame
- Scritto ed orale
- Prerequisiti
- Good knowledge of the main topics in contemporary linguistics, with specific reference to the notions provided in the framework of the course "Approfondimenti di linguistica".
Before taking the exam in corpus linguistics, students from the programme in "Scienze Linguistiche" must have passed the exam "Approfondimenti di Linguistica"
- Oggetto:
Sommario insegnamento
- Oggetto:
Obiettivi formativi
This course is part of the programme in general and applied linguistics, and aims to integrate the notions provided by other courses of the same programme with an advanced discussion of the use of corpora in linguistic description and analysis. It will discuss in detail the theoretical and methodological foundations of corpus-based analysis, as well as their impact in various fields of linguistics.
Questo insegnamento fa parte del curriculum in linguistica teorica e applicata e mira a integrare le nozioni fornite negli altri insegnamenti del corso di laurea con una discussione avanzata dell'utilità dei corpora per la descrizione e l'analisi linguistica. Saranno presentati in dettaglio i fondamenti teorici e metodologici dell'analisi linguistica corpus-based e si discuterà il loro impatto sui vari ambiti della linguistica.
- Oggetto:
Risultati dell'apprendimento attesi
The students will acquire knowledge concerning the different types of existing corpora, the various software used to perform a corpus-based research, types of queries and methods for quantitative analysis.
The students will need to be able to apply this knowledge in the analysis of a case-study, showing critical skills in the choice of the most appropriate data, the type of quantitative analysis to be performed, and in the discussion of the results.
Gli studenti e le studentesse acquisiranno conoscenze relative ai diversi tipi di corpora esistenti, ai software utilizzabili per effettuare ricerche al loro interno, ai tipi di queries e ad alcune metodologie di analisi quantitativa dei dati estratti.
Al termine del corso, gli studenti e le studentesse dovranno essere in grado di applicare queste conoscenze nell'analisi di case-studies, mostrando capacità critica nella scelta dei dati, del tipo di statistica da utilizzare, e nella discussione dei risultati.
- Oggetto:
Programma
1. Introduction to corpus lingusitics
- Definition of corpus
- Types of corpora
- Applications of corpus linguistics
- corpus based vs corpus driven
2. Searching a corpus
- Software for corpus based research
- Concordances, collocations and N-grams
- Text searches, wildcards, regex
- Searching annotated corpora
- CQL searches
3. Corpora and quantitative analysis
- Quantitative and qualitative analysis
- R and other tools for quantitative linguistics
- Introduction to quantitative analysis
- Descriptive statistics
- Inferential statistics
1. Introduzione alla linguistica dei corpora
- Definizioni di corpus
- Tipi di corpora
- Applicazioni della linguistica dei corpora
2. Consultare un corpus
- software in uso in linguistica dei corpora
- Concordanze, collocazioni, N-grams
- Ricerche testuali, wildcards, regex
- Corpora annotati
- CQL
3. Analisi quantitativa
- Ricerca quantitativa e qualitativa
- R e altri strumenti per l'analisi linguistica
- Introduzione alla statistica
- Statistica descrittiva
- Elementi di statistica inferenziale
- Oggetto:
Modalità di insegnamento
The course is characterised by a strong interaction within the classroom, hence attendance is warmly encouraged. After the first introductory lessons, the course will be arranged as a series of tutorials and assisted training sessions where the students will work in R on their own laptop computer in order to familiarise with the most common techniques in quantitative linguistics.
L'insegnamento è caratterizzato da un'interazione sistematica tra il docente e la classe, perciò la frequenza è caldamente incoraggiata. Dopo la prima settimana di lezioni, l'insegnamento sarà organizzato sotto forma di tutorial di difficoltà crescente con sessioni pratiche in cui gli studenti e le studentesse lavoreranno sui propri computer, con lo scopo di familiarizzare sia con la sintassi di R che con le principali tecniche di analisi quantitativa di dati lingusitici.
- Oggetto:
Modalità di verifica dell'apprendimento
Students regularly attending the lessons will present a paper written in English where they analyse a linguistic phenomenon of their choice applying one of the methods for quantitative analysis presented during the course. They may either use their own data (e.g. from their thesis project, internships, ...) or extract it from a corpus. The evaluation of the paper will be complemented by a short oral examination (in English) on the topics discussed during the course.
Students who are not attending the lessons will present a paper where they analyse a linguistic phenomenon of their choice applying one of the methods for quantitative analysis presented in Levshina (2015). They may either use their own data or extract it from a corpus. The evaluation of the paper will be complemented by a short oral examination on the topics discussed during the course. A preliminary consultation during office hours is advised.
In both cases, the final papers will need to have a length of 4-5000 words (including references) corresponding approximately to 10-12 pages. Even though the use of English will not impact on the evaluation, it is advised to use a reference textbook for academic English.
The papers need to be sent via email necessarily 5 working days before the date of the oral examination.
Gli studenti e le studentesse frequentanti presenteranno un paper in lingua inglese in cui analizzano un fenomeno linguistico a loro scelta, adottando una delle metodologie di analisi quantitativa presentate a lezione. I dati potranno essere estratti da corpora o dati già in possesso dei candidati e delle candidate (ad esempio per progetti di tesi, tirocinio, ecc.). L'esame sarà completato da una breve discussione orale (in inglese) dei risultati ottenuti.
Gli studenti e le studentesse non frequentanti presenteranno un paper in lingua inglese in cui analizzano un fenomeno linguistico a loro scelta, adottando una delle metodologie di analisi quantitativa presentate in Levshina (2015). I dati potranno essere estratti da corpora o dati già in possesso dei candidati e delle candidate (ad esempio per progetti di tesi, tirocinio, ecc.). L'esame sarà completato da una breve discussione orale (in inglese) dei risultati ottenuti. Si suggerisce un colloquio con il docente prima di iniziare a preparare la tesina.
In entrambi i casi, i paper finali dovranno avere una lunghezza di 4-5mila parole (inclusa bibliografia) corrispondenti indicativamente a 10-12 pagine. Anche se l'uso dell'inglese non farà parte della valutazione, si consiglia di far riferimento a un manuale di inglese accademico.
I paper devono essere inviati necessariamente 5 giorni lavorativi prima della data in cui si vuole sostenere l'orale.
Testi consigliati e bibliografia
- Oggetto:
- Libro
- Titolo:
- Corpus Linguistics: Method, Theory and Practice
- Anno pubblicazione:
- 2011
- Editore:
- Cambridge University Press
- Autore:
- Mc Enery & Hardie
- ISBN
- Capitoli:
- 1-5
- Obbligatorio:
- Si
- Oggetto:
- Libro
- Titolo:
- How to do Linguistics with R. Data exploration and statistical analysis
- Anno pubblicazione:
- 2015
- Editore:
- John Benjamins
- Autore:
- Natalia Levshina
- ISBN
- Obbligatorio:
- Si
- Oggetto:
Note
- Oggetto:
Insegnamenti che mutuano questo insegnamento
- Corpus Linguistics (STU0819)Corso di laurea magistrale in
Lingue dell'Asia e dell'Africa
per la comunicazione e la cooperazione internazionale - Linguistica dei corpora (STU0702)Corso di laurea magistrale in Scienze linguistiche
- Corpus Linguistics (STU0819)Language Technologies and Digital Humanities
- Corpus Linguistics (STU0819)
- Registrazione
- Aperta
- Apertura registrazione
- 01/09/2024 alle ore 00:00
- Oggetto: