Vai al contenuto principale
Oggetto:
Oggetto:

Linguistica dei corpora

Oggetto:

Corpus Linguistics

Oggetto:

Anno accademico 2023/2024

Codice attività didattica
STU0702
Docente
Eugenio Goria (Titolare del corso)
Corso di studio
laurea magistrale in Scienze linguistiche
Anno
1° anno, 2° anno
Periodo
Primo semestre
Tipologia
Affine o integrativo
Crediti/Valenza
6
SSD attività didattica
L-LIN/01 - glottologia e linguistica
Erogazione
Tradizionale
Lingua
Italiano
Frequenza
Facoltativa
Tipologia esame
Orale
Prerequisiti

Conoscenza dei principali temi e metodi della linguistica contemporanea, con particolare riferimento alle nozioni fornite nell'ambito dell'insegnamento "Approfondimenti di linguistica"

Good knowledge of the main topics in contemporary linguistics, with specific reference to the notions provided in the framework of the course "Approfondimenti di linguistica"

Oggetto:

Sommario insegnamento

Oggetto:

Obiettivi formativi

Questo insegnamento si inserisce nell'area di lingusitica generale, teorica e applicata, del cdl in Scienze linguistiche e mira ad approfondire la conoscenza fornita dagli altri corsi dello stesso ambito con un insieme di conoscenze teoriche e soprattutto metodologiche relative all'uso dei corpora come strumento per la descrizione e l'analisi linguistica. Vengono dunque discusse in dettaglio le caratteristiche degli approcci corpus-based alla descrizione dei fenomeni linguistici e il loro impatto in diversi ambiti della linguistica.

This course is part of the programme in general and applied linguistics, and aims to integrate the notions provided by other courses of the same programme with an advanced discussion of the use of corpora in linguistic description and analysis. It will discuss in detail the theoretical and methodological foundations of corpus-based analysis, as well as their impact in various fields of linguistics.

Oggetto:

Risultati dell'apprendimento attesi

Gli studenti e le studentesse dovranno possedere conoscenza e comprensione dei vari tipi di corpora esistenti, dei vari software disponibili per la loro consultazione, dei diversi tipi di ricerca possibili e  delle metodologie di analisi quantitativa presentate a lezione. 

L'insegnamento ha un carattere fortemente applicativo, pertanto al termine delle lezioni, gli studenti e le studentesse dovranno essere in grado di mettere in pratica le conoscenze acquisite nell'analisi di fenomeni lingusitici concreti, mostrando capacità critica nella scelta dei dati da utilizzare, nell'impostazione di un'analisi quantitativa e nella presentazione dei risultati.

 

The students will acquire knowledge concerning the different types of existing corpora, the various software used to perform a corpus-based research, types of queries and methods for quantitative analysis. 

The students will need to be able to apply this knowledge in the analysis of a case-study, showing critical skills in the choice of the most appropriate data, the type of quantitative analysis to be performed, and in the discussion of the results.

Oggetto:

Programma

 Introduzione alla linguistica dei corpora

  • Definizioni di corpus
  • Tipi di corpora
  • Applicazioni della linguistica dei corpora
  • Approcci corpus-based e corpus-driven

2. La struttura dei corpora

  • Corpus-design
  • Cenni di raccolta dati e questioni etiche
  • Sistemi di trascrizione
  • Sistemi di annotazione

3. Consultare i corpora

  • Software per la consultazione di corpora
  • Concordanze, collocazioni e N-Grams
  • Ricerche per stringhe di testo, wildcards, espressioni regolari
  • Ricerche su corpora annotati
  • Ricerche con CQL

4. Corpora e linguistica quantitativa

  • Quantitativo e qualitativo nell'analisi linguistica
  • Risorse per l'analisi quantitativa
  • Analisi quantitativa di dati lingusitici
  • Statistica descrittiva
  • Elementi di statistica inferenziale
  • Elementi di analisi multivariata

Introduction to corpus lingusitics

  • Definition of corpus
  • Types of corpora
  • Applications of corpus linguistics
  • corpus based vs corpus driven

2. The structure of a corpus

  • Corpus design
  • Data collection and ethical issues
  • Transcription
  • Annotation

3. Searching a corpus

  • Software for corpus based research
  • Concordances, collocations and N-grams
  • Text searches, wildcards, regex
  • Searching annotated corpora
  • CQL searches

4. Corpora and quantitative analysis

  • Quantitative and qualitative analysis
  • R and other tools for quantitative linguistics
  • Introduction to quantitative analysis
  • Descriptive statistics
  • Notions of inferential statistics

Oggetto:

Modalità di insegnamento

L'insegnamento sarà caratterizzato da una forte componente interattiva durante tutta la sua durata. I primi due punti del programma saranno affrontati in modalità tradizionale tramite lezioni frontali. I punti 3 e 4 saranno invece oggetto di una serie di esercitazioni guidate e prove pratiche in aula.

Durante tutta la durata del corso, un giorno a settimana sarà dedicato alla parte pratica.

 

The course is characterised by a strong interaction within the classroom, hence attendance is warmly encouraged. While parts 1 and 2 will adopt a more traditional approach, parts 3 and 4 will be arranged as a series of tutorials and assisted training sessions.

Throughout the whole course, one day of the week will be dedicated to the training part.

 

Oggetto:

Modalità di verifica dell'apprendimento

Studenti e studentesse frequentanti.

Si considera frequentante chi abbia partecipato ad almeno 3/4 delle lezioni e abbia completato le esercitazioni assegnate.

Ciascuno studente e ciascuna studentessa dovrà scrivere una relazione di fine corso in cui affronta l'analisi di un problema linguistico a scelta, applicando una delle metodologie di analisi quantitativa viste a lezione e utilizzano dati propri o estratti da un corpus fra quelli presentati.

L'esame si conclude con un breve colloquio sulle letture assegnate e sui temi presentati a lezione.

 

Studenti e studentesse non frequentanti

Chi non può frequentare preparerà

- i due manuali in bibliografia

- una raccolta di articoli concordata a ricevimento

Students regularly attending the lessons (=attending at least 3/4 of the training sessions) will present a paper where they analyse a linguistic phenomenon of their choice, either using their own data or extracting it from a corpus, applying one of the methods for quantitative analysis discussed during the lessons.

The evaluation of the paper will be complemented by a short oral examination on the topics discussed during the course.

 

Students who are not attending the lessons will prepare

- the two manuals

- a collection of articles previously discussed during office hours

Testi consigliati e bibliografia



Oggetto:
Libro
Titolo:  
Corpus Linguistics: Method, Theory and Practice
Anno pubblicazione:  
2011
Editore:  
Cambridge University Press
Autore:  
Mc Enery & Hardie
Obbligatorio:  
Si


Oggetto:
Libro
Titolo:  
Italiano parlato e variazione linguistica Teoria e prassi nella costruzione del corpus KIParla
Anno pubblicazione:  
2022
Editore:  
Pàtron
Autore:  
Ballarè, Mauri, Goria
Obbligatorio:  
Si
Oggetto:

Inserire qui il testo in italiano. Non eliminare l’indicazione “Italiano” tra le parentesi quadre; è necessaria per la creazione dell’etichetta di visualizzazione del testo in italiano. Una volta inseriti i testi eliminare queste indicazioni in modo che non risultino visibili agli studenti.

Inserire qui il testo in inglese. Non eliminare l’indicazione “English” tra le parentesi quadre; è necessaria per la creazione dell’etichetta di visualizzazione del testo in inglese. Una volta inseriti i testi eliminare queste indicazioni in modo che non risultino visibili agli studenti.



Oggetto:

Note

 

Inserire qui il testo in italiano. Non eliminare l’indicazione “Italiano” tra le parentesi quadre; è necessaria per la creazione dell’etichetta di visualizzazione del testo in italiano. Una volta inseriti i testi eliminare queste indicazioni in modo che non risultino visibili agli studenti.

Inserire qui il testo in inglese. Non eliminare l’indicazione “English” tra le parentesi quadre; è necessaria per la creazione dell’etichetta di visualizzazione del testo in inglese. Una volta inseriti i testi eliminare queste indicazioni in modo che non risultino visibili agli studenti.

Oggetto:

Insegnamenti che mutuano questo insegnamento

Registrazione
  • Aperta
    Apertura registrazione
    01/09/2023 alle ore 00:00
    Chiusura registrazione
    30/06/2024 alle ore 01:00
    Oggetto:
    Ultimo aggiornamento: 15/09/2023 11:45
    Location: https://linguistica.campusnet.unito.it/robots.html
    Non cliccare qui!