Vai al contenuto principale
Oggetto:
Oggetto:

Corpus Linguistics

Oggetto:

Corpus Linguistics

Oggetto:

Anno accademico 2024/2025

Codice attività didattica
STU0819
Docente
Eugenio Goria (Titolare del corso)
Corso di studio
laurea magistrale in Scienze linguistiche
Anno
1° anno, 2° anno
Periodo
Primo semestre
Tipologia
Affine o integrativo
Crediti/Valenza
6
SSD attività didattica
L-LIN/01 - glottologia e linguistica
Erogazione
Tradizionale
Lingua
Inglese
Frequenza
Facoltativa
Tipologia esame
Scritto ed orale
Prerequisiti
Good knowledge of the main topics in contemporary linguistics, with specific reference to the notions provided in the framework of the course "Approfondimenti di linguistica".

Before taking the exam in corpus linguistics, students from the programme in "Scienze Linguistiche" must have passed the exam "Approfondimenti di Linguistica"

Oggetto:

Sommario insegnamento

Oggetto:

Obiettivi formativi

This course is part of the programme in general and applied linguistics, and aims to integrate the notions provided by other courses of the same programme with an advanced discussion of the use of corpora in linguistic description and analysis. It will discuss in detail the theoretical and methodological foundations of corpus-based analysis, as well as their impact in various fields of linguistics.

Questo insegnamento fa parte del curriculum in linguistica teorica e applicata e mira a integrare le nozioni fornite negli altri insegnamenti del corso di laurea con una discussione avanzata dell'utilità dei corpora per la descrizione e l'analisi linguistica. Saranno presentati in dettaglio i fondamenti teorici e metodologici dell'analisi linguistica corpus-based e si discuterà il loro impatto sui vari ambiti della linguistica.

Oggetto:

Risultati dell'apprendimento attesi

The students will acquire knowledge concerning the different types of existing corpora, the various software used to perform a corpus-based research, types of queries and methods for quantitative analysis. 

The students will need to be able to apply this knowledge in the analysis of a case-study, showing critical skills in the choice of the most appropriate data, the type of quantitative analysis to be performed, and in the discussion of the results.

Gli studenti e le studentesse acquisiranno conoscenze relative ai diversi tipi di corpora esistenti, ai software utilizzabili per effettuare ricerche al loro interno, ai tipi di queries e ad alcune metodologie di analisi quantitativa dei dati estratti.

Al termine del corso, gli studenti e le studentesse dovranno essere in grado di applicare queste conoscenze nell'analisi di case-studies, mostrando capacità critica nella scelta dei dati, del tipo di statistica da utilizzare, e nella discussione dei risultati.

Oggetto:

Programma

1. Introduction to corpus lingusitics

  • Definition of corpus
  • Types of corpora
  • Applications of corpus linguistics
  • corpus based vs corpus driven

2. Searching a corpus

  • Software for corpus based research
  • Concordances, collocations and N-grams
  • Text searches, wildcards, regex
  • Searching annotated corpora
  • CQL searches

3. Corpora and quantitative analysis

  • Quantitative and qualitative analysis
  • R and other tools for quantitative linguistics
  • Introduction to quantitative analysis
  • Descriptive statistics
  • Inferential statistics

 

 

1. Introduzione alla linguistica dei corpora

  • Definizioni di corpus
  • Tipi di corpora
  • Applicazioni della linguistica dei corpora

2. Consultare un corpus

  • software in uso in linguistica dei corpora
  • Concordanze, collocazioni, N-grams
  • Ricerche testuali, wildcards, regex
  • Corpora annotati
  • CQL 

3. Analisi quantitativa

  • Ricerca quantitativa e qualitativa
  • R e altri strumenti per l'analisi linguistica
  • Introduzione alla statistica
  • Statistica descrittiva
  • Elementi di statistica inferenziale

Oggetto:

Modalità di insegnamento

The course is characterised by a strong interaction within the classroom, hence attendance is warmly encouraged. After the first introductory lessons, the course will be arranged as a series of tutorials and assisted training sessions where the students will work in R on their own laptop computer in order to familiarise with the most common techniques in quantitative linguistics.

L'insegnamento è caratterizzato da un'interazione sistematica tra il docente e la classe, perciò la frequenza è caldamente incoraggiata. Dopo la prima settimana di lezioni, l'insegnamento sarà organizzato sotto forma di tutorial di difficoltà crescente con sessioni pratiche in cui gli studenti e le studentesse lavoreranno sui propri computer, con lo scopo di familiarizzare sia con la sintassi di R che con le principali tecniche di analisi quantitativa di dati lingusitici.

Oggetto:

Modalità di verifica dell'apprendimento

 

Students regularly attending the lessons will present a paper written in English where they analyse a linguistic phenomenon of their choice applying one of the methods for quantitative analysis presented during the course. They may either use their own data (e.g. from their thesis project, internships, ...) or extract it from a corpus. The evaluation of the paper will be complemented by a short oral examination (in English) on the topics discussed during the course.

 

Students who are not attending the lessons will present a paper where they analyse a linguistic phenomenon of their choice applying one of the methods for quantitative analysis presented in Levshina (2015). They may either use their own data or extract it from a corpus. The evaluation of the paper will be complemented by a short oral examination on the topics discussed during the course. A preliminary consultation during office hours is advised.

In both cases, the final papers will need to have a length of 4-5000 words (including references) corresponding approximately to 10-12 pages. Even though the use of English will not impact on the evaluation, it is advised to use a reference textbook for academic English.

The papers need to be sent via email necessarily 5 working days before the date of the oral examination.

 

Gli studenti e le studentesse frequentanti presenteranno un paper in lingua inglese in cui analizzano un fenomeno linguistico a loro scelta, adottando una delle metodologie di analisi quantitativa presentate a lezione. I dati potranno essere estratti da corpora o dati già in possesso dei candidati e delle candidate (ad esempio per progetti di tesi, tirocinio, ecc.). L'esame sarà completato da una breve discussione orale (in inglese) dei risultati ottenuti.

Gli studenti e le studentesse non frequentanti presenteranno un paper in lingua inglese in cui analizzano un fenomeno linguistico a loro scelta, adottando una delle metodologie di analisi quantitativa presentate in Levshina (2015). I dati potranno essere estratti da corpora o dati già in possesso dei candidati e delle candidate (ad esempio per progetti di tesi, tirocinio, ecc.). L'esame sarà completato da una breve discussione orale (in inglese) dei risultati ottenuti. Si suggerisce un colloquio con il docente prima di iniziare a preparare la tesina.

 

In entrambi i casi, i paper finali dovranno avere una lunghezza di 4-5mila parole (inclusa bibliografia) corrispondenti indicativamente a 10-12 pagine. Anche se l'uso dell'inglese non farà parte della valutazione, si consiglia di far riferimento a un manuale di inglese accademico.

I paper devono essere inviati necessariamente 5 giorni lavorativi prima della data in cui si vuole sostenere l'orale.

Testi consigliati e bibliografia



Oggetto:
Libro
Titolo:  
Corpus Linguistics: Method, Theory and Practice
Anno pubblicazione:  
2011
Editore:  
Cambridge University Press
Autore:  
Mc Enery & Hardie
ISBN  
Capitoli:  
1-5
Obbligatorio:  
Si


Oggetto:
Libro
Titolo:  
How to do Linguistics with R. Data exploration and statistical analysis
Anno pubblicazione:  
2015
Editore:  
John Benjamins
Autore:  
Natalia Levshina
ISBN  
Obbligatorio:  
Si


Oggetto:

Note

 

 

 

 

Oggetto:

Insegnamenti che mutuano questo insegnamento

Registrazione
  • Aperta
    Apertura registrazione
    01/09/2024 alle ore 00:00
    Oggetto:
    Ultimo aggiornamento: 02/09/2024 14:37
    Location: https://linguistica.campusnet.unito.it/robots.html
    Non cliccare qui!