Ensayos con Google Ngram Viewer

En una nota anterior mencionaba la utilidad de las series de datos para analizar tendencias culturales, y en particular el atractivo de una herramienta de Google, el Ngram Viewer, que permite obtener de manera muy simple cifras seriadas y nítidos diagramas procedentes de una búsqueda automática en Google Libros, su vastísimo repositorio de libros digitalizados.

El ensayo atrajo varios comentarios que agradezco, de Vae victis (@Inigus) sobre la selección implícita que conlleva la digitalización de libros en bibliotecas académicas; y de mi colega bloguero Víctor Gayol, sobre la falta de transparencia en la recopilación de datos y el carácter «tosco» de los resultados estadísticos, que pone en cuestión su utilidad para publicaciones formales.

Por otro lado, Aude Argouse, en su blog sobre el «papel sellado», retoma esta herramienta y procede a presentar las tendencias de las palabras «papel sellado», «papier timbré» y «stempepapier» (que son equivalentes en distintos idiomas). Los resultados son curiosos y dan para algunas reflexiones. Permiten también a la autora señalar algunas limitaciones, como la imposibilidad de presentar en la misma gráfica los resultados de distintos cuerpos lingüísticos, de diferenciar los resultados por países, y algo que ya había advertido, los «falsos positivos» (o «falsos negativos») de la búsqueda en libros antiguos, donde la grafía no es la actual (por ejemplo habría que buscar por «papel fellado» en español antiguo).

Retomando la idea, aquí presento algunos resultados particulares del uso de este «visor», que muestran sus posibilidades. El primero tiene que ver con la introducción del uso general en español de «México» (con «x») en lugar de Méjico, que es lo correspondería por la pronunciación. Se trata, desde luego, de un arcaísmo y también de una «cortesía gramatical», aunque ambas formas siguen considerándose apropiadas.

Ngram MéjicoPuede verse asimismo la tendencia en el cambio ya no sólo de grafías, sino del empleo de distintas palabras para designar una misma realidad. Para tomar un ejemplo que me resulta cercano, presento el uso alternativo de «tarasco/purépecha». Esta última opción es la considerada «correcta», aunque algunos historiadores, entre los que me cuento, seguimos empleando la primera, y tenemos razones para ello. He utilizado en este caso el corpus en inglés, porque el total predominio de «tarasco» en español resulta menos contrapunteado.

Ngram tarasco

Finalmente, presento la evolución en la la recepción de algunos pensadores contemporáneos que tuvieron gran influencia en la historia y las ciencias sociales, como Michel Foucault, Louis Althusser, Jacques Derrida y Pierre Bourdieu.

Ngram Foucault

Ya había hecho un ejercicio parecido en mi nota anterior, contrastando a Karl Marx y Max Weber.

Como comentaba, tendría mis dudas para emplear estas gráficas en trabajos académicos formales, aunque es posible «afinar» las búsquedas y  Google ya resolvió algunos posibles problemas que podrían haber derivado en falacias estadísticas, como se explica aquí. También hay que tener en consideración que de hecho todas las estadísticas, cuadros y gráficas, a pesar del aspecto técnico y «científico» que tanto nos impresionan, tiene un proceso de «construcción» que incluye cierto grado de subjetividad.  Esto incluye los censos contemporáneos de población y vivienda, y desde luego los limpios y bonitos cuadros de la demografía de épocas antiguas, donde los datos son irregulares y poco confiables (lo cual no impide que los empleemos y construyamos argumentos a partir de ellos). Diría que respecto de Google Ngram Viewer, el juicio sobre su confiabilidad y aceptabilidad académicas está aún pendiente. Sin duda habría que discutirlo tanto del punto de vista técnico como conceptual,  porque su posible empleo resulta sugerente y atractivo.

Deja un comentario