Il progetto
Il progetto di ricerca "Reading the Italian Novel at a Distance (1830-1930)” (RIND) si basa su un approccio interdisciplinare che combina metodi che hanno prodotto risultati innovativi negli studi letterari e linguistici recenti: linguistica computazionale e dei corpora, studi letterari quantitativi, data science, statistica e translation studies. Basato sull'approccio seminale di Franco Moretti, il progetto mira a condurre esperimenti di distant reading su un corpus di 1000 romanzi italiani e raccolte di racconti, incluse traduzioni in italiano da altre lingue, pubblicati tra il 1830 e il 1930. Il corpus sarà bilanciato per tenere conto della distribuzione di autori/traduttori e del loro genere, della data di pubblicazione, della lunghezza del testo e della distinzione tra letteratura canonica e paraletteratura. Saranno condotte snalisi quantitative su larga scala sia da una prospettiva sincronica che diacronica con l'impiego di metodi statistici e computazionali. Le analisi si concentreranno su due obiettivi principali: rilevare come i personaggi letterari esprimono i loro pensieri ed emozioni e identificare i cambiamenti sociali nei romanzi presi in analisi. Il primo obiettivo farà uso di approcci quantitativi e dei metodi di estrazione automatica dei dati per studiare fenomeni pragma-linguistici che emergono a livello testuale, al di là dei confini di parole e frasi. Il secondo obiettivo si servirà di elenchi di lemmi per comprendere come mestieri e professioni, gradi militari, titoli religiosi, edifici (residenziali, commerciali, industriali, religiosi, rurali, urbani, ecc.) e altri contesti riflettano i cambiamenti sociali. Entrambi gli obiettivi sono innovativi, poiché finora sono stati fatti pochi tentativi di utilizzare metodi quantitativi e automatici per analizzare il discorso riportato e produrre una periodizzazione della prosa letteraria pubblicata in Italia secondo criteri diversi da quelli adottati dalla critica letteraria. Inoltre, il confronto tra testi scritti in italiano e traduzioni da altre lingue farà luce sull'influenza dei modelli stranieri sulla prosa letteraria italiana. Il progetto attinge principalmente a tre discipline:
- linguistica, per identificare tratti morfologici e sintattici che portano a schemi pragmatici e liste lessicali, comprendenti campi semantici, con lo scopo di tracciare una periodizzazione degli aspetti presi in analisi;
- statistica (inclusi metodi di apprendimento statistico e machine learning) per classificare i testi mediante l'individuazione di topic e l'analisi del contenuto, basati sulword embedding, per estrarre serie temporali di dati e ideare metodi di visualizzazione dei dati (grafici e diagrammi);
- teoria letteraria e letteratura comparata, per interpretare i risultati sullo sfondo della storia della letteratura italiana, europea e mondiale tra il Realismo e il Modernismo.