FONTI DI GOOGLE PER LA LESSICOGRAFIA: PROVA DI MONITORAGGIO

  • Ludovica Maconi

Abstract

L’articolo ha come obiettivo la verifica di quanto possa mutare il corpus di Google Libri, utilizzato (cosa ormai abbastanza comune) come fonte per retrodatazioni lessicali. Su un campione di 1000 retrodatazioni raccolte in Google nel 2011, la maggioranza dei riferimenti, ancora disponibile nel 2015, non è più rintracciabile nel 2017. In compenso, si sono aggiunti testi nuovi, che talvolta raffinano i risultati ottenuti. Nel 2015 gli aggiornamenti hanno riguardato circa il 40% del campione di riferimento, ma solo per il 10% si è trattato di aggiornamenti importanti, tali da modificare il secolo di prima attestazione delle parole. A distanza di poco più di un anno, gli aggiornamenti sono stati minimi ed è emersa forte la criticità della sparizione di fonti.

 

A check of Google Books’sources used by lexicographers

The purpose of this article is to verify how the Google Books corpus can change, commonly used as a source for lexical antedating. In a sample of 1000 antedatings collected from Google in 2011, most of the references that were still available in 2015 are no longer present in 2017. However, new texts have been added, which sometimes refine the results. In 2015, about 40% of the reference sample was upgraded, but only 10% were major upgrades, which changed the century of first citation. After a year, the updates were minimal and showed the criticality of the disappearance of sources.

Pubblicato
2017-07-11
Sezione
LINGUISTICA E STORIA DELLA LINGUA ITALIANA