Vai al contenuto principale
Oggetto:
Oggetto:

Linguistica dei corpora

Oggetto:

Corpus Linguistics

Oggetto:

Anno accademico 2022/2023

Codice dell'attività didattica
STU0702
Docente
Eugenio Goria (Titolare del corso)
Corso di studi
laurea magistrale in Scienze linguistiche
Anno
1° anno 2° anno
Periodo didattico
Primo semestre
Tipologia
Affine o integrativo
Crediti/Valenza
6
SSD dell'attività didattica
L-LIN/01 - glottologia e linguistica
Modalità di erogazione
Tradizionale
Lingua di insegnamento
Italiano
Modalità di frequenza
Facoltativa
Tipologia d'esame
Orale
Prerequisiti

Conoscenza dei principali temi e metodi della linguistica contemporanea, con particolare riferimento alle nozioni fornite nell'ambito dell'insegnamento "Approfondimenti di linguistica"


Good knowledge of the main topics in contemporary linguistics, with specific reference to the notions provided in the framework of the course "Approfondimenti di linguistica"

Oggetto:

Sommario insegnamento

Oggetto:

Obiettivi formativi

Questo insegnamento si inserisce nell'area di lingusitica generale, teorica e applicata, del cdl in Scienze linguistiche e mira ad approfondire la conoscenza fornita dagli altri corsi dello stesso ambito con un insieme di conoscenze teoriche e soprattutto metodologiche relative all'uso dei corpora come strumento per la descrizione e l'analisi linguistica. Vengono dunque discusse in dettaglio le caratteristiche degli approcci corpus-based alla descrizione dei fenomeni linguistici e il loro impatto in diversi ambiti della linguistica.

This course is part of the programme in general and applied linguistics, and aims to integrate the notions provided by other courses of the same programme with an advanced discussion of the use of corpora in linguistic description and analysis. It will discuss in detail the theoretical and methodological foundations of corpus-based analysis, as well as their impact in various fields of linguistics.

 

Oggetto:

Risultati dell'apprendimento attesi

Gli studenti e le studentesse dovranno possedere conoscenza e comprensione dei vari tipi di corpora esistenti, dei vari software disponibili per la loro consultazione, dei diversi tipi di ricerca possibili e  delle metodologie di analisi quantitativa presentate a lezione. 

L'insegnamento ha un carattere fortemente applicativo, pertanto al termine delle lezioni, gli studenti e le studentesse dovranno essere in grado di mettere in pratica le conoscenze acquisite nell'analisi di fenomeni lingusitici concreti, mostrando capacità critica nella scelta dei dati da utilizzare, nell'impostazione di un'analisi quantitativa e nella presentazione dei risultati.

 

The students will acquire knowledge concerning the different types of existing corpora, the various software used to perform a corpus-based research, types of queries and methods for quantitative analysis. 

The students will need to be able to apply this knowledge in the analysis of a case-study, showing critical skills in the choice of the most appropriate data, the type of quantitative analysis to be performed, and in the discussion of the results.

 

Oggetto:

Modalità di insegnamento

L'insegnamento sarà caratterizzato da una forte componente interattiva durante tutta la sua durata. I primi due punti del programma saranno affrontati in modalità tradizionale tramite lezioni frontali. I punti 3 e 4 saranno invece oggetto di una serie di esercitazioni guidate e prove pratiche in aula.

Durante tutta la durata del corso, un giorno a settimana sarà dedicato alla parte pratica.

The course is characterised by a strong interaction within the classroom, hence attendance is warmly encouraged. While parts 1 and 2 will adopt a more traditional approach, parts 3 and 4 will be arranged as a series of tutorials and assisted training sessions.

Throughout the whole course, one day of the week will be dedicated to the training part.

 

 

Oggetto:

Modalità di verifica dell'apprendimento

Studenti e studentesse frequentanti.

Si considera frequentante chi abbia partecipato ad almeno 3/4 delle esercitazioni laboratoriali.

Ciascuno studente e ciascuna studentessa dovrà scrivere una relazione di fine corso in cui affronta l'analisi di un problema linguistico a scelta, applicando una delle metodologie di analisi quantitativa viste a lezione e utilizzano dati propri o estratti da un corpus fra quelli presentati.

L'esame si conclude con un breve colloquio sulle letture assegnate e sui temi presentati a lezione.

 

Studenti e studentesse non frequentanti

Chi non può frequentare preparerà

- i due manuali in bibliografia

- un articolo a scelta fra quelli proposti

Students regularly attending the lessons (=attending at least 3/4 of the training sessions) will present a paper where they analyse a linguistic phenomenon of their choice, either using their own data or extracting it from a corpus, applying one of the methods for quantitative analysis discussed during the lessons.

The evaluation of the paper will be complemented by a short oral examination on the topics discussed during the course.

 

Students who are not attending the lessons will prepare

- the two manuals

- an article of their choice among the ones indicated in the course bibliography

 

Oggetto:

Programma

1. Introduzione alla linguistica dei corpora

  • Definizioni di corpus
  • Tipi di corpora
  • Applicazioni della linguistica dei corpora
  • Approcci corpus-based e corpus-driven

2. La struttura dei corpora

  • Corpus-design
  • Cenni di raccolta dati e questioni etiche
  • Sistemi di trascrizione
  • Sistemi di annotazione

3. Consultare i corpora

  • Software per la consultazione di corpora
  • Concordanze, collocazioni e N-Grams
  • Ricerche per stringhe di testo, wildcards, espressioni regolari
  • Ricerche su corpora annotati
  • Ricerche con CQL

4. Corpora e linguistica quantitativa

  • Quantitativo e qualitativo nell'analisi linguistica
  • Risorse per l'analisi quantitativa
  • Analisi quantitativa di dati lingusitici
  • Statistica descrittiva
  • Elementi di statistica inferenziale
  • Elementi di analisi multivariata

 

Introduction to corpus lingusitics

  • Definition of corpus
  • Types of corpora
  • Applications of corpus linguistics
  • corpus based vs corpus driven

2. The structure of a corpus

  • Corpus design
  • Data collection and ethical issues
  • Transcription
  • Annotation

3. Searching a corpus

  • Software for corpus based research
  • Concordances, collocations and N-grams
  • Text searches, wildcards, regex
  • Searching annotated corpora
  • CQL searches

4. Corpora and quantitative analysis

  • Quantitative and qualitative analysis
  • R and other tools for quantitative linguistics
  • Introduction to quantitative analysis
  • Descriptive statistics
  • Notions of inferential statistics

 

 

Testi consigliati e bibliografia



Oggetto:
Libro
Titolo:  
Corpus Linguistics: Method, Theory and Practice
Anno pubblicazione:  
2011
Editore:  
Cambridge University Press
Autore:  
Mc Enery & Hardie
Obbligatorio:  
Si


Oggetto:
Libro
Titolo:  
Italiano parlato e variazione linguistica Teoria e prassi nella costruzione del corpus KIParla
Anno pubblicazione:  
2022
Editore:  
Pàtron
Autore:  
Ballarè Silvia, Goria Eugenio, Mauri Caterina
Obbligatorio:  
Si


Oggetto:
Articolo
Titolo:  
Qualitativo/quantitativo: ripensare la distinzione
Titolo rivista:  
Parlare insieme. Studi per Daniela Zorzi
Anno pubblicazione:  
2016
Autore:  
Pallotti, Gabriele
Obbligatorio:  
Si
Oggetto:

Manuali di statistica per la linguistica con R

Gries, Stefan Th.. Statistics for Linguistics with R: A Practical Introduction, Berlin, Boston: De Gruyter Mouton, 2021. https://doi.org/10.1515/9783110718256

Levshina, Natalia How to do linguistics with R. Amsterdam: Benjamins, 2015. http://doi.org/10.1075/z.195.website

Baayen, R. (2008). Analyzing Linguistic Data: A Practical Introduction to Statistics using R. Cambridge: Cambridge University Press. doi:10.1017/CBO9780511801686

Applicazioni della linguistica dei corpora

Aijmer, K., & Rühlemann, C. (Eds.). (2014). Corpus Pragmatics: A Handbook. Cambridge: Cambridge University Press. doi:10.1017/CBO9781139057493

Levshina, N. (2021). Corpus-based typology: Applications, challenges and some solutions. Linguistic Typology. Advance online publication. doi:10.1515/lingty-2020-0118.

Newman, J., Baayen, H. & Rice, S. (2011). Corpus-based studies in Language Use, Laguange Learning and Language Documentation. Amsterdam - New york: Rodopi.

 

Linguistics with R manuals

Gries, Stefan Th.. Statistics for Linguistics with R: A Practical Introduction, Berlin, Boston: De Gruyter Mouton, 2021. https://doi.org/10.1515/9783110718256

Levshina, Natalia How to do linguistics with R. Amsterdam: Benjamins, 2015. http://doi.org/10.1075/z.195.website

Baayen, R. (2008). Analyzing Linguistic Data: A Practical Introduction to Statistics using R. Cambridge: Cambridge University Press. doi:10.1017/CBO9780511801686

 



Oggetto:

Note

Gli studenti e le studentesse di Scienze linguistiche possono sostenere l'esame solo dopo aver superato l'esame di Approfondimenti di linguistica.

-

 

Oggetto:
Ultimo aggiornamento: 15/09/2022 16:33
Location: https://linguistica.campusnet.unito.it/robots.html
Non cliccare qui!