Explorando tendencias culturales con series de datos en Google Libros

Siempre me han interesado las cuantificaciones para estudiar situaciones y procesos que no pueden apreciarse sino mediante el estudio de regularidades y patrones colectivos. Una de las vías más interesantes es el seguimiento de términos y conceptos, porque evidentemente toda nueva realidad debe de ser pensada y nombrada. En este sentido, el masivo “corpus” de Google Libros es una excelente fuente, porque permite una búsqueda en el tiempo para apreciar cuando un término (por ejemplo, “despotismo ilustrado”) comenzó a ser de uso común. La compilación y procesamiento cuantitativo de registros de este género es también de interés serial porque hace posible ver la aparición, desarrollo y posible declive del empleo de términos en el tiempo. Se le conoce como “minería de textos”, una metáfora que me agrada por sus alusiones metalúrgicas. Es incluso un posible campo de estudios en sí,  llamado provisionalmente culturomics (o, muy feamente en español, “culturomía”).

La herramienta más a propósito para estos fines son los n-gramas, esto es la búsqueda de secuencias o “cadenas” de información, en este caso en un texto (hay otros empleos posibles). Desde luego, hacerlo “a mano” es muy laborioso, pero afortunadamente Google ofrece gratuitamente y en línea su Ngram Viewer, que  permite hacer búsquedas que generan automáticamente gráficas muy presentables. Es como hacer un verso sin ningún esfuerzo.

Caben algunas advertencias (como siempre debe hacerse con cualquier estadística) antes de confiar alegremente en los resultados.  Aunque podría pensarse que Google Libros representa el universo de todos los impresos, esto no es exactamente así. Sus ejemplares digitalizados provienen de bibliotecas públicas de prestigio, esto es de repositorios que adquieren y almacenan los libros considerados “de interés”, lo cual establece un filtro de entrada. Las obras que se venden en puestos callejeros, los comics, muchos “bestsellers” (¿en cuántas bibliotecas universitarias estará la “saga” completa de Harry Potter?) probablemente estén subrepresentados; lo que tenemos aquí sería una compilación primordialmente de literatura “culta” y “académica”.

Asimismo, ya he comprobado que  el escaneo de Google tiende a confundirse con las letras impresas de libros muy antiguos. Para tiempos modernos, también puede haber algunos casos de homonimias y “falsos positivos”. Ah, y  las búsquedas deben hacerse separando las variables por comas, no entrecomilladas.

Finalmente, este “visor” hace las búsquedas por corpus lingüísticos particulares; no está del todo “al día” en la indexación (en español llega sólo hasta 2008); y en su vertiente “automática” sólo incluye cadenas de alta frecuencia (esto es, que aparecen al menos en 40 libros distintos).  Hay por otro lado opciones para “afinar” las búsquedas con algunos descriptores avanzados, que se explican aquí; y es posible consultar los datos “en bruto”, si se tienen aficiones “culturómicas” y se cuenta con una conexión a red muy eficiente.

Con todas estas precauciones, el N-gram Viewer es interesante y atractivo. Para no alargarme, dejaré los experimentos para otra nota que publicaré en breve en este blog. Por lo pronto, les dejo un ejemplo sobre las n-gramas cruzadas de las menciones en español a dos autores de importante influencia en humanidades y ciencias sociales.

N-Gram Marx-Weber

Los porcentajes corresponden a las frecuencias respecto del conjunto de textos.

Vale la pena señalar que el empleo de esta herramienta digital parece estar siendo progresivamente aceptada en publicaciones académicas formales, aunque ha sido también motivo de diversas objeciones. Y, desde luego, son gráficas que admiten distintas interpretaciones, porque las cifras en sí siempre serán solamente un punto de partida para la reflexión.

Anuncios

El nuevo Google Maps: una revisión

Google Maps siempre me ha parecido fascinante. Es muy conveniente para averiguar direcciones, formas de llegar a un punto (en automóvil, transporte público, e incluso a pie), distancias, lugares cercanos de interés (comercios, museos, parques) y en general, para tener una idea del sitio con la opción “street view” o “vista de  calle”.  Por otro lado, resulta muy atractivo para quienes, como en mi caso, somos aficionados a los “viajes virtuales” por países y ciudades que podremos (o no) recorrer “presencialmente” algún día. Y, también, en ocasiones me ha sido de utilidad para encontrar algún lugar mencionado en antiguos documentos, o comprender mejor cierto conflicto sobre  tierras después de estudiar un panorama de la orografía.

La nueva imagen de Google Maps (centro de Guanajuato)
La nueva imagen de Google Maps (centro de Guanajuato)

Siempre he seguido de cerca la paulatina expansión del servicio, que cada tanto agrega nuevos países, rutas e incluso recorridos por el interior de zonas arqueológicas, museos y otros edificios históricos. Por esta razón, recibí con mucho interés el anuncio de una nueva versión de GM (que, obviamente, tiene su app para Android). No sé si porque está en “periodo de prueba” o como recurso publicitario, hay que solicitar  ser dado de alta desde una cuenta google, lo cual en mi caso ocurrió en unos tres días.  Y efectivamente, hay mucho de nuevo; algunas cosas me parecieron bien, otras no tanto. Para ponerlas en orden:

* Aunque es algo menor, los mapas tienen ahora una presentación más atractiva, moderna y colores menos “restallantes”.

El nuevo cuadro de búsqueda
El nuevo cuadro de búsqueda

En el mismo sentido colabora la ubicación de los comandos de búsqueda y dirección, que ahora ocupan menor espacio en la pantalla, a la vez que tienen más opciones.

* Como antes, es posible “girar” el mapa y cambiar el ángulo de visión. La mayor parte de los comandos se realiza con el “ratón”, lo cual entre otras cosas ha derivado en la desaparición del  “hombrecito amarillo”, que arrastrábamos para obtener la “vista de calle” de un lugar. Cuesta un poco habituarse, pero supongo será cosa de práctica.

* Algo que atraerá a los bicicleteros: ahora hay opciones específicas para rodar en los  caminos más adecuados y seguros 🙂 No está aun disponible más que en unos pocos países, pero se ve que ahí viene, literalmente, sobre ruedas.

Según GM, no es buena idea transitar por el área de La Raza un viernes a las 8 de la mañana. Mejor tomar el metro...
Según GM, no es buena idea transitar por el área de La Raza un viernes a las 8 de la mañana. Mejor tomar el metro…

* También (otra vez, todavía solo para algunas ciudades) GM propone rutas para moverse en automóvil desde A hacia B, e incluso informa del estado del tráfico “en vivo” y estima el tiempo del recorrido. Es algo que técnicamente cabía en lo posible, pero que no deja de ser sorprendente.

Museo Regional de Querétaro, desde (evidentemente) la calle Francisco I Madero
Museo Regional de Querétaro, desde (evidentemente) la calle Francisco I Madero

* El recorrido “a nivel de piso” ahora es más fluido, sin los “saltos” que eran anteriormente muy típicos (y algo fastidiosos). El nombre de las calles y carreteras aparece “sobre escrito” virtualmente, para que el usuario no pierda el rumbo.

*Los mapas ahora  incluyen a pie de página, a manera de carrusel, las mejores fotografías que los usuarios han dado de alta en Panoramio, la plataforma de fotos de Google. El efecto (ver arriba) es muy interesante.

Zihuatanejo - vista de hoteles
Zihuatanejo – vista de hoteles

* La nueva versión contiene mucha más información (y mejor presentada) sobre establecimientos comerciales. Esto desde luego tiene que ver  con la necesidad de Google de hallar la forma de “desquitar” los grandes costos que seguramente ha tenido fotografiar el mundo, incluyendo suburbios, montañas, carreteras y sitios despoblados. Es algo comprensible y no resulta molesto, porque se activa a petición del usuario (por ejemplo, al escribir “Zihuatanejo, hotel”).

*Hay una mayor integración con Google+, la red no tan exitosa de esta corporación, de manera que en los resultados aparecen los sitios preferidos e incluso los comentarios de mis “amigos G+” sobre sitios, atracciones y comercios. La intención es obvia. Además, parece ser que Google Maps “recuerda” las búsquedas anteriores, y puede “configurar” los resultados automáticamente, de manera que concuerden con los intereses del usuario. (Sí, ya sé que es algo que tiene sus bemoles en cuanto a privacidad se refiere, pero esa es otra discusión…)

* Una consecuencia de la abundancia de recursos es que ahora se requiere (si se desea utilizarlos) un equipo razonablemente moderno, y una buena conexión a internet. De otra manera, las imágenes pueden tardar su rato en aparecer nítidamente en pantalla.

La antigua (y desaparecida) vista global de Street View (México en 2011)
La antigua (y desaparecida) vista global de Street View (México en 2011)

* Lo que no me convence es que anteriormente, al “arrastrar” con el “ratón” a nuestro “amigo amarillo”, aparecían claramente remarcados en azul todos los sitios del mapa  donde estaba disponible la “vista de calle”. Ahora es algo que se descubre solamente al intentar obtenerla en un lugar específico, lo cual deja al usuario limitado a un lento y enfadoso procedimiento de “ensayo y error”.  También resultaba muy interesante ver la densidad de la cobertura por región, país e incluso continente. Esta es una opción que realmente echo en falta.

Afortunadamente, si al usuario no le gusta la nueva versión, Google tiene la respuesta: es posible volver fácilmente al antiguo modelo, ya sea por una vez o definitivamente. Por ahora, al menos, es una decisión que dejaré pendiente mientras recorro el mundo a golpe de “clicks”.

Google y las elecciones en México

Para satisfacción de algunos y desconsuelo de otros, las elecciones mexicanas de 2012 (presidente, senado, diputados, varios gobernadores y presidencias municipales) están en camino de ser historia.  Técnicamente aun no concluyen.  Aunque la votación fue el pasado domingo 1 de julio y se han anunciado resultados parciales, falta todavía el cómputo final que aparecerá en un par de días, y desde luego resolver las posibles irregularidades y múltiples impugnaciones, lo cual llevará su tiempo.

El tema dará mucho de qué hablar durante los próximos días y meses (notoriamente, las visibles  diferencias entre el México del norte y el del sur), pero entre los “saldos” que ya pueden apreciarse está el papel de las redes sociales y otros medios “virtuales” en la movilización (y en algunos casos, manipulación) electoral.  Un aspecto,  la presencia  de Google,  me interesa aquí en particular (más allá del previsiblemente simpático “doodle”).

En efecto, el organismo responsable de organizar las elecciones, esto es, el Instituto Federal Electoral, realizó un acuerdo de colaboración con el gigante de las búsquedas cibernéticas.  En primer lugar para ubicar las casilla de votación mediante su aplicación “Google Maps”

como puede apreciarse con la 111, de la ciudad de Campeche, cuya ubicación está marcada con un icono en forma de urna electoral azul. Y en caso necesario, para mayor facilidad, pueden verse la calle y el edificio, que parecer ser una escuela pública

El icono reaparece en este caso  astutamente sobrepuesto en la barda perimetral de la escuela (aunque es poco visible, y aquí lo he rodeado de un círculo rojo)

Por otro lado, el acuerdo ha incluido el traslado del Programa de Resultados Electorales Preliminares del IFE.

como puede apreciarse en el link puesto (junto al de otros medios e  instituciones) en el portal de la institución o, directamente, aquí.

Al acudir al sitio, pueden apreciarse los resultados parciales en Google Maps a  las 02.00 horas del lunes 2 de julio (y sí, hasta esa hora nos quedamos muchos despiertos, siguiendo la votación).

También podía verse la distribución regional de la votación de cada partido (en este caso la de Acción Nacional, aunque los matices de colores no se sabe bien a bien qué representan);

y por cada municipio, como en este ejemplo, Chilpancingo, Gro., pudiéndose hace un click para obtener las cifras. En la columna de la izquierda aparecen los resultados estatales, útiles para cuestiones comparativas.

Nótese que todos estos ejemplos que he incluido son resultados parciales que obviamente van a cambiar  en el curso de las siguientes horas.

Dejando de lado su interés inmediato, que es el electoral, estos materiales también serán muy útiles para quienes se dediquen a estudiar esta votación, analizarla y sacar las correspondientes conclusiones, tanto académicas como políticas. En lo personal me hubiera gustado tener el mapa de conjunto del país con el color del vencedor en cada municipio, porque la visualización de conjunto da una falsa impresión de uniformidad.

Google no se contentó con su acuerdo con el IFE.  En asociación con el  Centro de  Estudios Sobre Internet y Sociedad, del  Tecnológico de Montererrey,  ha establecido un canal en youtube donde se anima a los usuarios a compartir videos de sus observaciones del proceso electoral.  Al día de hoy podían verse muchos que denunciaban irregularidades varias.

Estas iniciativas pueden verse como parte del programa de continua expansión de Google, pero también como una respuesta frente a la popularidad creciente del uso de Facebook y Twitter (ya se sabe, Google+, su red social, parece no estar yendo a ninguna parte). De manera interesante, la opción  de Google en México ha sido acercarse a las instituciones (ahora el IFE, una universidad privada), como antes lo hizo con el Instituto Nacional de Antropología e Historia.

Viéndolo en perspectiva, lo que todas estas compañías procuran es ocupar un “nicho” de interés que les dé ventaja sobre sus competidores, y asimismo conseguir que sus productos se “cotidianicen”, se  inserten como vehículos “naturales” de las relaciones entre personas,  y como parte imprescindible de nuestra vida diaria. No tengo en sí nada en contra de ello, mientras la correlación entre sus beneficios y nuestras conveniencias sea justa y adecuada.

Las maravillas patrimoniales del mundo, según Google

Con cierto bombo y platillo Google presentó hace algunos días  su plataforma Maravillas del Mundo (World Wonders Project), en colaboración con la UNESCO, el World Monuments Funds y Cyark Project. La plataforma procura poner a disposición de cada computadora conectada a Internet los lugares declarados patrimonio de la humanidad, tanto por razones históricas como ambientales.  Para ello reúne la conocida tecnología Street View, modelos 3D y otros recursos, como fotografías y videos tanto de sus asociados como aquéllos que han publicado (en Panoramio)  los propios usuarios de Google.

Uno de los propósitos declarados es el educativo. En este sentido, ofrece a los profesores de educación primaria y media una serie de sugerencias didácticas, y presenta varios “paquetes pedagógicos” para cada sitio, con información y posibles actividades en clase.  Seguramente habrá críticas y objeciones (entre ellas, que aun no hay nada para Latinoamérica), pero sin duda se agradece la buena intención.

Así planteado, esta plataforma resulta muy atractiva. Su exploración, sin embargo, no presenta muchas novedades. En realidad, bien podía haberse llamado “lo mejor de Google Street View”,  puesto que las diferentes imágenes ya estaban disponibles. Tampoco ofrece algo que hace tiempo esperamos: recorrer el interior de muchos de los monumentos que figuran en este catálogo de famosos sitios. En algunos casos es posible, pero en su mayor parte aun no es así, ya sea por reticencias de las autoridades responsables de estos tesoros patrimoniales o bien por dificultades técnicas (el “triciclo” utilizado por Google para fotografiar callejones e interiores de edificios debe tener algunos comprensibles problemas donde hay escalones….)

La otra cuestión es que el título inevitablemente trae a la memoria la “jerarquía” de los espacios patrimoniales, y en particular las estériles pero enconadas competencias para definir cuáles son las “maravillas del mundo moderno”. Es algo que atrae protestas y desconfianzas, porque cada país considera más importantes las suyas. Ocurre que en estas “maravillas según Google” existen ciertos sesgos:  para Asia hay una gran cantidad de  fascinantes sitios en Japón, se incluye el centro antiguo de Jerusalén…y nada más.  Inglaterra, Italia y España están muy bien representados, mientras que de Alemania (un país en el que Google ha enfrentado infinidad de problemas legales)  solo hay dos sitios.  En Norteamérica,  México tiene más espacio que Estados Unidos, mientras Sudamérica está pobremente incluida, con  sólo tres lugares en Brasil.  Hay algo de Australia, pero África ni siquiera aparece.  Seguramente no es que en Google no hayan sido conscientes de estas desigualdades en el contenido de su plataforma, pero parecen haber decidido que ya era tiempo de presentar lo disponible al público, y de paso ocupar un “nicho” virtual antes de que alguien más lo hiciera.

Desde luego, no hay que subestimar la ambición de Google de documentar y fotografiar el mundo.  En cierta manera,  “Maravillas del mundo” es una formal declaración de ambiciones iconográficas universales. Y en este caso, no tengo mayores objeciones.

Adiós a Knol

Google acaba de anunciar el fin de Knol (entre otros proyectos que no fueron a ninguna parte).

La imagen de Knol: al museo de los logos perdidos
La imagen de Knol: al museo de los logos perdidos

Después de tres años, esta “enciclopedia de expertos” nunca había levantado vuelo, a pesar de que técnicamente era ingeniosa y tenía buena presentación. A diferencia de Wikipedia, los artículos (o “knoles”) tenían autor, solamente él podía modificarlos o, en su caso, aceptar las contribuciones de terceros.  La calificación de calidad y pertinencia no la hacía algún editor. Eran los propios lectores quienes,  mediante sus comentarios, enlaces y sus más o menos numerosa consultas, ordenaban los artículos por su popularidad, en una manera similar al Page Rank, el sistema de las búsquedas de Google. Nunca hubo un plan general, sino que cada autor podía hacer cuantos artículos quisiera.

Los resultados concretos de este proyecto fueron muy limitados.  Hubo buenos artículos sobre medicina, pero proliferaron textos mediocres, los que defendían posiciones políticas y religiosas particulares (no había aquí la obligación de un punto de vista “neutral”)  e incluso los que de manera muy poco velada promovían servicios comerciales (por ejemplo, varias notas sobre destinos turísticos en México). Tampoco había siempre referencias de apoyo, notas bibliográficas o vínculos hacia contenidos afines. Fue una plataforma atractiva para algunos autores, pero no llegó a convertirse en una comunidad intelectual, porque el formato no favorecía que así fuese.  Algunos textos (véase por ejemplo los publicados por Carlos García Mora) fueron ciertamente de interés, pero se trató de casos aislados.  En realidad, tenía mucho más sentido (y visibilidad) publicar en un blog.

Knol continuará visible hasta el 30 de abril de 2012.  Los autores han recibido la opción de migrar sus contenidos a Annotum, una plataforma para publicaciones académicas basada en WordPress, propiedad de otra compañía.

El fin de Knol muestra una vez más que una cosa es manejar cables, fierros y códigos y otra muy distinta convocar, atraer y mantener la adhesión y la colaboración de las personas, sobre todo aquellas dedicadas a generar nuevos conocimientos. En perspectiva, Wikipedia, con todas sus exasperantes problemas y caóticas limitaciones, sigue siendo la única opción viable, que una y otra vez sobrevive a los sucesivos intentos por desplazarla como fuente de conocimiento universalmente consultada.

Google ha decidido que no nos interesa el pasado de la información

J usto cuando alimentaba poco a poco la idea de que había al menos una gran corporación que me resultaba más o menos amigable, Google ha modificado su algoritmo de búsqueda para privilegiar los textos editados en fecha más reciente en la web,  y enviar al fondo de sus listados  los resultados “históricos”.

Como se menciona en su blog oficial (las traducciones al español son mías)

Cuando busco [olímpicos], probablemente quiero información sobre la próxima olimpiada de verano, no la de 1900.

y como si fuese poco,

Cuando no se especifican palabras claves, suponemos que usted espera ver los eventos  más recientes, no los de hace 50 años.

El único consuelo es que, al parecer, todavía hay algún resquicio para quien considera que los artículos más recientes no son siempre necesariamente los mejores

Hay muchos casos en que los resultados de hace unos pocos años pueden aún serle útiles…Búsquedas diferentes tienen diferentes necesidades de “frescura” (freshness). La mejora del algoritmo fue diseñada para comprender mejor como diferenciar entre el tipo de búsquedas y el nivel de frescura que usted necesita, y asegurarnos de que usted obtiene el máximo de respuestas al minuto.

No me queda clara la forma en que Google discriminará automáticamente entre unas y otras necesidades de “frescura”, o entre los divergentes intereses de búsqueda de, por ejemplo, un historiador y un periodista.  Este cambio puede relegar valiosos escritos del pasado al olvido cibernético.  Habrá que ver lo que ocurre en la práctica. Mientras, creo que volveré a darle otro vistazo a Bing, el buscador de Microsoft.

El INAH y su asociación con Google: beneficios y políticas institucionales

El Instituto Nacional de Antropología e Historia continúa incesantemente ampliando su muy notable presencia en web,  en particular mediante su asociación con Google. Acaba ahora de presentar una  capa o nivel para la aplicación Google Earth, con la cual además de ofrecer un nuevo servicio, puede enlazar entre sí un amplio conjunto de desarrollos anteriores (paseos “virtuales”, micrositios de cada museo o sitio arqueológico, maquetas en 3D realizadas por distintas personas en un concurso, infografías, un canal en youtube).  Como una imagen resulta más clara que una larga descripción técnica, véase el siguiente video.

El único pero es que se da como obvio que el usuario conoce que debe instalar  “Google Earth” en su computadora, y asimismo obtener un pequeño archivo KML, disponible por ahora en la página principal del INAH.

La oferta de recursos de este proyecto  seguramente va a crecer, dado que el INAH ha  ha anunciado que próximamente el triciclo de Google Street View filmará en “imágenes circulares”, a nivel del suelo, muchas zonas arqueológicas.

La evolución aquí presentada es interesante, además, en términos de política institucional. En efecto, el INAH se ha asociado con Google, con buenos resultados.  Por su parte, otra gran institución nacional, la Universidad Nacional Autónoma de México, ha optado por vincularse con Microsoft.  Es algo que tiene ya un par de años y cuya manifestación inmediata fue la oferta a las decenas de miles de estudiantes universitarios de programas de esta corporación, a precio reducido. El siguiente desarrollo fue la reciente entrega del manejo del sistema de correo universitario a Microsoft, abandonando el propio.

La nueva pantalla de ingreso a Correo UNAM
La nueva pantalla de ingreso a Correo UNAM

Como ocurre con todas las decisiones de este género, todas tienen sus pro y sus contras. No es cuestión de declaraciones de principios, sino de resultados, riesgos y beneficios concretos.  Habrá que ver, con el tiempo, que resulta de las  opciones adoptadas por ambas instituciones.