Giorgia Meloni, Meloni o la Meloni? La codifica degli antroponimi femminili in biografie generate da ChatGPT e pubblicate su Wikipedia

Autori

  • Anna-Maria De Cesare Technische Universität Dresden

DOI:

https://doi.org/10.54103/2532-1803/22388

Parole chiave:

testi generati; ChatGPT;, Wikipedia; antroponimi femminili; articolo determinativo

Abstract

L’obiettivo generale dello studio è indagare la rappresentazione linguistica delle donne all’interno di testi generati da ChatGPT, confrontandola con quella dei testi scritti da esseri umani. A questo fine esaminiamo la forma e frequenza d’uso di tre tipi di antroponimi riferiti alle donne (Giorgia Meloni, Meloni, la Meloni) attraverso un’analisi di testi biografici generati automaticamente da GPT-3.5 e pubblicati su Wikipedia. L’analisi è condotta utilizzando un corpus creato appositamente per questa indagine, che comprende biografie relative a 34 personalità femminili di rilievo. I risultati ottenuti mostrano che ci sono differenze sostanziali nel modo in cui le biografie generate da ChatGPT e quelle pubblicate su Wikipedia si riferiscono alle donne. Uno dei dati più interessanti riguarda la più bassa frequenza d’uso degli antroponimi del tipo la Meloni nelle biografie generate. Questo dato apre importanti domande sia in merito ai fattori che spiegano i dati riscontrati sia sul ruolo che i testi generati potrebbero avere in futuro sull’assetto dell’italiano contemporaneo.

The goal of this study is to investigate the linguistic representation of women within ChatGPT’s generated texts as compared with that of texts written by human beings. To this end, we examine the form and frequency of use of three types of anthroponyms referring to women (Giorgia Meloni, Meloni, la Meloni) through an analysis of biographical texts automatically generated by GPT-3.5 and published on Wikipedia. The analysis is conducted using a corpus created specifically for this investigation, which includes biographies related to 34 prominent female personalities. The results obtained show that there are substantial differences in how the biographies generated by ChatGPT and those published on Wikipedia relate to women. One of the most interesting outcomes concerns the lower frequency of use of anthroponyms of the type la Meloni in the generated biographies. This finding opens important questions both about the factors explaining the data found and about the role that the generated texts might play in the future on the structure of contemporary Italian.

Riferimenti bibliografici

Accademia della Crusca (2023), “L’Accademia risponde a un quesito sulla parità di genere negli atti giudiziari posto dal Comitato Pari opportunità del Consiglio direttivo della Corte di Cassazione, Accademia della Crusca”, https://accademiadellacrusca.it/Media?c=54099131-d9f9-4f94-b999-e7aa4646b317 [consultato il 13.8.2023]

Barbaresi A. (2021), “Trafilatura: A Web Scraping Library and Command-Line Tool for Text Discovery and Extraction”, in Proceedings of ACL/IJCNLP 2021: System Demonstrations, pp. 122-131.

Burr E. (1997), “Neutral oder Stereotyp. Referenz auf Frauen und Männer in der italienischen Tagespresse”, in Dahmen W. et al. (a c. di), Sprache und Geschlecht in der Romania. Romanistisches Kolloquium X., Tübingen, Narr, pp. 133-179.

Cicero F. (2023), “L’italiano delle intelligenze artificiali generative”, in Italiano LingueDue 15/2: 733-761.

Cirillo C. (1998), “Corti or la Corti? Definite article + surnames for women”, in The Italianist 18: 272-288.

D’Achille P. (2016), “Architettura dell'italiano di oggi e linee di tendenza”, in Lubello S. (a c. di), Manuale di linguistica italiana, De Gruyter, Berlin, pp. 165-189.

De Cesare A.-M. (2022a), “La codifica linguistica dei referenti umani nella Costituzione svizzera: tra disparità e uguaglianza di genere”, in Ferrari A., Lala L. & Pecorari F. (a c. di), L’italiano dei testi costituzionali. Indagini linguistiche e testuali tra Svizzera e Italia, Edizioni dell’Orso, Alessandria, pp. 245-270.

De Cesare A.-M. (2022b), “Répétitions et variations des textes générés: Une analyse linguistique basée sur un corpus d’articles financiers rédigés en français”, in CHIMERA: Romance Corpora and Linguistic Studies 8, 79–108.

De Cesare A.-M. (2023), “Assessing the quality of ChatGPT’s generated output in light of human-written texts. A corpus study based on textual parameters”, in CHIMERA. Romance Corpora and Linguistic studies 10: 179-210.

De Cesare A.-M. & Casoni M. (a c. di), (2021). La rappresentazione delle donne nelle pratiche didattiche, nei discorsi, nelle lingue, N. speciale di Babylonia 3/2021. https://babylonia.online/index.php/babylonia/issue/view/16

De Cesare A.-M., Eliasson E. & Weidensdorfer T. (2023), “La coesione testuale (basata sulle strutture verbali) nella scrittura generata in ambito finanziario. Italiano e francese a confronto”, in De Cesare A.-M., Ferrari A. & Pecorari F., Lala L. (a c. di), Forme della scrittura italiana contemporanea in prospettiva contrastiva. La componente testuale, Cesati, Firenze, pp. 71-86.

Fan A. & Gardent C. (2022), Generating Full Length Wikipedia Biographies. The Impact of Gender Bias on the Retrieval-Based Generation of Women Biographies. https://arxiv.org/abs/2204.05879

Ferrara E. (2023), “Should ChatGPT be Biased? Challenges and Risks of Bias in Large Language Models”, in First Monday 28/11, pp. 1-39. https://doi.org/10.5210/fm.v28i11.13346

Fogarasi M. (21983), Grammatica italiana del Novecento. Sistemazione descrittiva, Bulzoni, Roma.

Formato F. (2019), Gender, Discourse and Ideology in Italian, Mcmillan, Palgrave.

Gomez Gane Y. (a c. di) (2017), «Quasi una rivoluzione». I femminili di professioni e cariche in Italia e all’estero, Accademia della Crusca, Firenze.

Hall R. A. (1964), “Moot points in Italian Grammar. 3. Definite Article + Family Name (masc.)”, in Italica 41/2, pp. 162-167.

Herczeg G. H. (1972), “Contributi all’uso dell’articolo determinativo in italiano”, in Acta Linguistica Academiae Scientiarum Hungaricae 22: 119-39.

Korzen I. (1996), L’articolo italiano fra concetto ed entità. Vol. I-II, Museum Tusculanum Press, Copenaghen.

Lepri S. (2011), News. Manuale di linguaggio e di stile per l’informazione scritta e parlata, Rizzoli Etas, Milano.

Lepschy A. L. & Lepschy G. (1981), La lingua italiana, Bompiani, Milano.

Lepschy A. L., Lepschy G. & Sanson, H. (2001), “Lingua italiana e femminile”, in Quaderns d’Italià 6: 9-18.

Marcato G. (2010), “Antroponimi”, in Simone R. (dir.), Enciclopedia dell’italiano, Treccani, Roma, pp. 84-87.

Marcato G. & Thüne E.-M. (2002), “Italian. Gender and female visibility in Italian”, in Hellinger M. & Bußmann H. (eds), Gender Across Languages. The Linguistic Representation of Women and Men. Vol. 2, Benjamins, Amsterdam-Philadelphia, pp. 187-217.

Monti J. (2020), “Gender issues in Machine Translation: an unsolved problem? ”, in von Flotow L. & Kamal H. (a c. di), Routledge Handbook on Translation, Feminism and Gender, London, Routledge.

Nissim M. & Pannitto L. (2022), Che cos’è la linguistica computazionale? Carocci, Roma.

Ondelli S. & Viale M. (2010), “L’assetto dell’italiano delle traduzioni in un corpus giornalistico. Aspetti qualitativi e quantitativi”, in Rivista internazionale di tecnica della traduzione 12: 1-62.

Pescia L. (2010), “Il maschile e il femminile nella stampa scritta del Canton Ticino (Svizzera) e dell’Italia”, in Sapegno M. S. (a c. di), Che genere di lingua? Sessismo e potere discriminatorio delle parole, Carocci, Roma, pp. 57-74.

Pescia L. (2021), “La femminilizzazione degli agentivi nell’era digitale: la rappresentazione linguistica delle donne e google translate”, in De Cesare A.-M. & Casoni M. (a c. di), La rappresentazione delle donne nelle pratiche didattiche, nei discorsi, nelle lingue, N. speciale di Babylonia 3/2021, pp. 102-109. https://doi.org/10.55393/babylonia.v3i.133

Renzi L. (1988), “L’articolo”, in Renzi L. (a c. di), Grande grammatica italiana di consultazione, vol. 1, il Mulino, Bologna, pp. 357-423.

Rescigno A. A., Monti J. Way A. & Vanmassenhove E. (2020), “A case study of natural gender phenomena in translation. A comparison of Google translate, Bing Microsoft Translator and DeepL for English to Italian, French and Spanish”, in Association for Machine Translation in the Americas, pp. 62-90.

Sabatini A. (1993), Il sessismo nella lingua italiana. Commissione Nazionale per la parità e le pari opportunità tra uomo e donna, Presidenza del Consiglio dei Ministri, Roma.

Schwarze C. (1988), Grammatik der italienischen Sprache, Niemeyer, Tübingen.

Serianni L. 2000 [1988], Italiano. Grammatica, sintassi, dubbi, Garzanti, Milano.

Setti R. (2003), “L’articolo prima di un prenome”, Accademia della Crusca, 4.4.2003. https://accademiadellacrusca.it/it/consulenza/larticolo-prima-di-un-prenome/98 [consultato il 14.8.2023]

Tavosanis M. (2018), Lingue e intelligenza artificiale, Carocci, Roma.

Tavosanis M. (2021), “L’ideologia linguistica e le pratiche di Wikipedia in lingua italiana”, in Alamán A. P., Ruggiano F. & Walsh O. (a c. di), Le ideologie linguistiche: lingue e dialetti nei media vecchi e nuovi, Berlin, Lang, pp. 413-434.

Dowloads

Pubblicato

2024-01-30