How to Extract Knowledge from Texts. Data-mining and Topic Modeling Applied to a Dantean Collection

Authors

DOI:

https://doi.org/10.54103/2035-7680/29226

Keywords:

Dante Alighieri; allegory; data-mining; topic modelling; information retrieval

Abstract

This paper intends to illustrate an academic methodology applied to a digital Dante repertory – the Database Allegorico Dantesco (DAD) – developed within the framework of my doctoral research and containing hundreds of texts related to the allegorism of the Divine Comedy. By addressing specific computer theories to the archived works and by resorting to the joint use of several digital instruments, a study procedure will be described that, by referring to statistical principles of applied sciences, will allow for objective results in relation to the theoretical discussions developed around Dante’s allegory in the 20th-21st centuries. Specifically, it will be shown how it is possible to subject the corpus of selected texts, since they have already been transcribed in XML for archiving in the DAD, to topic modelling in order to identify groups of semantemes referable to authors, motifs and recurring themes in the allegorical readings of the poem to be used as guidelines for a direct and in-depth examination (close reading) of the object of the research. In this way the digital tools will be actively used for the automated extraction of different types of data (data mining) corresponding to thematic nuclei to be developed in order to trace a critical profile of the allegorism of the Comedy. 

Downloads

Download data is not yet available.

Author Biography

Matteo Maselli, University of Macerata

Matteo Maselli è Dottore di ricerca in Umanesimo e Tecnologie presso l’Università di Macerata, dove ha lavorato su un progetto dedicato all’allegorismo dantesco e alle Digital Humanities. Si è formato all’Università di Bologna, dove attualmente è cultore della materia in Critica Letteraria e Letterature Comparate, e ha studiato alla Oxford University e all’University of Notre Dame. 

References

Alighieri, Dante. Convivo, a cura di Franca Brambilla Ageno, Le Lettere, 1995.

---. Convivo, a cura di Giancarlo Fioravanti e Claudio Giunta, Mondadori, 2019.

Ascoli, Albert Russell. “Tradurre l’allegoria: ‘Convivio’ II, i.” Critica del testo, vol. XIV, 2011, pp. 153-175.

Battaglia Ricci, Lucia. “Dante e la tradizione letteraria medievale.” Una proposta per la Commedia, Giardini, 1983, pp. 135-136.

Bellomo, Saverio. “How to read the early commentaries.” Interpreting Dante. Essays on the tradition of Dante commentary, a cura di Paola Nasti e Claudia Rossignoli, University of Notre Dame Press, 2013, pp. 84-109.

Bonera, Matteo, e Anna Bardazzi. Data Visualization as a Tool to Experience the Legacy of Dante's Divine Comedy and its Influence on the Cultural Heritage, www.thevisualagency.it. Consultato il 17 Ago. 2023

Cerroni, Monica. “Li versi straniI.” Forme dell’allegoria nella Commedia di Dante. ETS, 2003.

Curtius, Ernst Robert. Letteratura europea e Medio Evo latino, a cura di Roberto Antonelli, Quodlibet, 2022.

Dronke, Peter. Dante e le tradizioni latine medievali. Il Mulino, 2022.

---. “Il secolo XII.” Letteratura Latina Medievale. Un manuale, a cura di Claudio Leonardi. SISMEL-Edizioni del Galluzzo, 2003, pp. 231-302.

Pompeo, Giannantonio. Dante e l’allegorismo. Olschki, 1969.

Hollander, Robert. “Dante ‘Theologus-Poeta’.” Studies in Dante, Longo, 1980, pp. 39-89.

Kriesel, James C. “Allegories of the Corpus.” The Cambridge Companion to Dante's ‘Commedia’, a cura di Zygmunt G. Baranski e Simon Gilson, Cambridge University Press, 2019, pp. 110-126.

Marchesi, Simone, et al.. “Literary Visualization. Towards a Visual Annotation of Dante’s Comedy.” Bibliotheca Dantesca, vol. 5, 2022, pp. 298-301.

Maselli, Matteo. “Database Allegorico Dantesco (DAD).”Umanistica Digitale, vol. 13, 2022, pp. 165-170.

---. “Struttura e funzioni di un database dantesco. Proposta per un’inedita risorsa digitale.” L’altro Dante: processi di attualizzazione della Commedia, a cura di Mario Cimini, Carabba, 2022, pp. 241-260.

Mazzali, Ettore. “La dottrina e le componenti del poema.” Dante, la vita, il pensiero, le opere, Accademia, 1979, pp. 91-150.

Mocan, Mira. Immagine, figura, astrazione. Le geometrie del testo nella “Commedia” di Dante.Salerno, 2022.

Newman, Mark. “The Structure and Function of Complex Networks.” SIAM Review, vol. 45, 2003, pp. 167-256.

Padoan, Giorgio. La “mirabile visione” di Dante e l’Epistola a Cangrande. Longo, 1977.

Scott, John A. “Dante’s Allegory.” Romance Philology, vol. XXVI, 1973, pp. 558-591.

Smalley, Beryl. Lo studio della Bibbia nel Medioevo. Edizioni Dehoniane, 2008.

Van Peteghem, Julie. “Exploring Dante’s Sources Online: Interactive Reading, Visualizations, and the Study of Dantean Intertextuality in the Digital Age.” Bibliotheca Dantesca, vol. 5, 2022, pp. 229-252.

Published

2025-06-29

How to Cite

Maselli, Matteo. 2025. “How to Extract Knowledge from Texts. Data-Mining and Topic Modeling Applied to a Dantean Collection”. Altre Modernità, June, 243-62. https://doi.org/10.54103/2035-7680/29226.