jueves 28 marzo 2024

Documento o dato: el ojo que todo lo ve

por Daniel Iván

En lo que quizás nunca se hayan equivocado las visiones distópicas del futuro que hoy vivimos es en la naturaleza hegemónica, totalitaria y violenta de quienes pretenden para sí el control de la información; la mayor parte del tiempo para su propio beneficio económico y/o político.

Ese control, como premisa del poder, no es necesariamente nuevo ni necesariamente contingente; forma parte de la naturaleza misma de la preeminencia como ejercicio, del poder como afán y cotidianidad. Por lo menos desde el siglo XIX y desde la invención del periodismo, la “verdad” no es únicamente “un hecho comprobable en la medida de lo posible” sino un flujo perceptual, una carga de opinión cuyas polaridades, nos guste o no, lo definen todo. Desde el siglo XIX la comunicación nos dejó claro que, más allá de lo que nos haya dicho nuestra mamá, la verdad es posible de ser sesgada, la historia susceptible de ser manipulada y las conclusiones pueden ser variadas según vire, natural o artificialmente, el carrito de madera de la opinión pública (que todo lo sabe, claro está). Sin embargo, la información como tal ha cambiado de muy diversas maneras. Tal vez la más contundente es la evolución del documento-como- echo transformándose en el documento-como-dato; una transformación imposible de imaginar en el mundo análogo y únicamente posible en la digitalia; y, al mismo tiempo, una transformación que reconecta lo análogo con lo digital de un modo definitivo.

La prueba documental como base para el análisis, la comprobación o, si se quiere, como artilugio para aplicar a mansalva el método científico, ha sido la piedra fundacional de la sociología y de la ciencia política, de la historia como disciplina e incluso de algunos afanes artísticos menores, como la fotografía, el cine o el video. El documento se nos anuncia con una serie de características sine qua non que, aun así, son muy precarias: es usualmente tangible, es usualmente verificable y es usualmente (peligrosa, artificialmente) neutral. El documento “es lo que es”; no opina ni se apasiona, no se inclina ni tiene preferencias. Es factual, y en eso radica su naturaleza de “punto de partida”, según nos hacen creer sus entusiastas adoradores.

Sin embargo, esta posición del documento está siendo severamente cuestionada por la inteligencia artificial y, particularmente, por las posibilidades analíticas de los algoritmos. Si bien la subjetividad de quien documenta y las particularidades sociales del momento que se está documentando han sido todas constantes como criterios en el cuestionamiento de lo documental –y también, por supuesto, de la idea general y pedestre de “lo objetivo”–, lo cierto es que la Inteligencia Artificial está avanzando vertiginosamente en la posibilidad de dotar a las máquinas de herramientas suficientes para la lectura analítica de datos no alfanuméricos basados únicamente en datos gráficos. Es decir, el análisis de documentos en su naturaleza objetual.

Los algoritmos están ya en la capacidad de ver imágenes y de arrojar datos a partir de lo que ven. Esta capacidad lleva ya varios años en desarrollo y está marcando un cambio de paradigmas en lo que se refiere a la interacción de la Inteligencia Artificial con la realidad análoga. Esto, aunado al hecho de que la fotografía y el video se han convertido en un hecho preeminente en la documentación del hecho humano no únicamente por la presencia omnímoda de dispositivos móviles equipados con cámara (el estimado más reciente es de más de mil millones de teléfonos móviles y mil millones de fotos diarias subidas a Facebook por esa única vía, sin contar la relativamente nueva capacidad de transmitir video en vivo) sino por la masiva digitalización de imágenes análogas que se lleva a cabo por los usuarios llanos e incluso por instituciones formales en las más diversas plataformas de Internet (por ejemplo, la colección de fotografías “vintage” de la red social fotográfica “Flickr” –conocida como “The Commons”– cuenta ya con 117 instituciones científicas, archivísticas y museográficas de varios países de lengua inglesa1). Es decir, el hecho fotográfico y videográfico de la historia humana está ya en la digitalia, en una indiscutible plenitud.2

Las máquinas están aprendiendo rápidamente a leerlo. Y quizás no nos sorprenda saber que suelen ver mucho más de lo que nosotros nos permitimos ver.

Uno de los primeros ejemplos contundentes y exitosos, aunque de una naturaleza extrañamente policiaca e inquietante, ha sido el desarrollo de la tecnología Deep-Face de Facebook, que hasta el momento ha sido capaz de reconocer rostros en fotografías tomadas en las más diversas condiciones de luz y desde los más diversos ángulos. Aunado a esto, la multitud de rostros etiquetados en esa red social y otros datos disponibles únicamente en las bases de datos ligadas a su “ecosistema social” hace que no sea nada difícil agregar un nombre, ubicación geográfica, historial académico y toda otra multitud de datos (que nosotros hemos dado alegremente) a casi cada rostro. Y no importa si, por ejemplo, la resolución de nuestro rostro es muy precaria o si, de hecho, la resolución aceptada por Instagram o Facebook es todavía muy mala: el pasado febrero, Google Brain publicó un avance al que llaman “súper resolución”: un algoritmo con la capacidad de extrapolar una imagen de altísima resolución a partir de una imagen pixelada o de baja resolución.

Algo muy parecido está comenzando a ocurrir con la geolocalización, los mapas a pie de calle y otros desarrollos que ya llevan tiempo con nosotros: actualmente, una fotografía tomada en un lugar público únicamente necesita de un signo o señalización visible, y de una sombra en un ángulo verificable, para que una computadora nos indique con precisión el lugar y la hora del día en el que una fotografía fue tomada; aun incluso cuando el usuario se haya tomado la molestia de desactivar las coordenadas del GPS y/o los datos EXIF de su cámara.

Quizás todavía más inquietantes sean las llamadas “lecturas ambientales”. Hace algunos años, una empresa llamada Jetpac desarrolló un algoritmo que era capaz de leer y analizar en las millones y millones de fotografías de Instagram para concluir la clase de “ambiente” que tenía un lugar. Digamos que en las fotografías de un restaurante aparecían mayoritariamente mujeres vistiendo lápiz labial: el algoritmo concluiría que el sitio era “formal”, aun si en las fotografía la ropa de las personas no era visible. Digamos que en la mayoría de las fotografías hubiera únicamente hombres: el algoritmo concluiría que el restaurante era un restaurante gay. Si bien a primera vista estas nos podrían parecer generalizaciones o prejuicios, el análisis estadístico de Jetpac demostró que el algoritmo tenía un nivel de lectura muy preciso y racional. Por supuesto, Jetpac fue comprada por Google en el 2014.

La pregunta no es antojadiza: ¿estas capacidades de lectura frente a una fuente documental humana constituyen el primer análisis perceptual máquina/humano? Y de ser así: ¿es este análisis más preciso, más desapasionado, más neutral, que cualquiera que antes haya podido salir de la mente humana? Es decir: ¿estamos llegando por primera vez a la objetividad?

El pensamiento es inquietante: usted y yo, en la verdad documentada de nuestra existencia, somos ahora, también, un dato cada vez más preciso destinado a trascendernos.

Notas:

1 Principalmente de Inglaterra, Irlanda, Australia y los Estados Unidos. Si bien la ausencia de instituciones latinoamericanas o en lengua española es notable, lo cierto es que el mundo de habla hispana está muy bien representado fotográficamente, ya que el acervo incluye documentos de guerra, viaje, misiones diplomáticas, etcétera.

2 Esto, circunscribiéndonos a las fechas de los primeros desarrollos de la fotografía y la reprografía y sus documentos disponibles. Tomando en cuenta que muchas instituciones y personas están digitalizando libros, dibujos, objetos y otros documentos ligados con la historia antigua, clásica, etc., el margen de la “historia disponible” es, por supuesto, mucho mayor.

También te puede interesar