viernes 29 marzo 2024

Inteligencia artificial vs. locutores

por Germán Martínez Martínez

“El desarrollo pleno de la inteligencia artificial podría significar el fin de la humanidad”, dijo el físico Stephen Hawking, en entrevista para la BBC al final de 2014. En su alarma han acompañado, precedido y continuado al científico: colegas suyos, escritores de ficción especulativa y, crecientemente, trabajadores que comienzan a verse desplazados. En enero de 2015, con el empresario Elon Musk y otros, Hawking lanzó la carta abierta sobre “Prioridades de investigación para una inteligencia artificial vigorosa y benéfica”. El consuelo de muchos es suponernos irremplazables, por creer que la calidad intelectual o artística de nuestro oficio sería imposible a una máquina. Basta prestar atención para descubrir que el entorno ya muestra algo distinto.

El científico Stephen Hawking previno sobre los riesgos de la inteligencia artificial.

Hay múltiples funciones, aplicaciones y servicios de conversión de texto a audio. Desde publicaciones extranjeras que contienen excelentes lecturas de artículos por humanos —cuya escucha toma más tiempo que leerlos—, hasta softwares que van de un desempeño robótico a otros que realizan lecturas acertadas, comprensibles. En México varios periódicos ofrecen este tipo de opciones para sus columnas políticas. Cuando menos uno cuenta con grabaciones humanas.

Ha sido notoria la mejoría de esta tecnología en pocos años. En contraste, el periódico que ha preferido la lectura humana brinda un servicio apreciable, pero, al mismo tiempo, un espectáculo de imprecisión y enredo. Al locutor —quizá actor, por el dramatismo de su labor al principio— le tomó meses decir correctamente el nombre de un columnista: repetía una forma inventada contra la ortografía del nombre. No es infrecuente que en un solo artículo acumule errores, a veces en un mismo párrafo: su excepción es leer bien —resulta interesante el carácter de sus fallas. En cambio, para los softwares de este tipo, los errores son la excepción.

Male Vocalist Singing Into Microphone In Recording Studio

La cuestión no es anecdótica. Hay grabaciones mal editadas que revelan la interacción del locutor con alguien más. Es probable que el equipo cuente, cuando menos, con un editor y un productor. Las pifias incluyen acentos fuera de lugar, dejando palabras, por un instante, irreconocibles. A veces esto lleva a decir vocablos inexistentes, en otras alguna conjugación condicional se vuelve futuro imperativo. Seguir las reglas de la ortografía sería guía suficiente para no desbarrar con los acentos. El software se conduce por esas normas y sus excepciones. El locutor transforma singulares en plurales y viceversa. También omite letras de palabras, volviéndolas ininteligibles o dándoles sentido opuesto. En ocasiones, los intercambios son de unas sílabas por otras. Inventa palabras a partir de falta de familiaridad con algunas que no son coloquiales, pero tampoco especializadas. El conjunto de los desatinos casi siempre mueve a confusión, más que a sonrisa.

Es común en “entrenamientos de medios” —habituales para políticos y comunicadores— que se trate de hacer pasar énfasis por expresividad. Así, el lector de artículos de opinión cae en desvaríos como decir “S.A. de C.V” con gran emoción. Esas exaltaciones revelan que, a momentos, el locutor no sabe lo que dice, enuncia frases sin entenderlas. Las constantes pausas indebidas —incluso en palabras— lo confirman, pues se desatiende el significado. Esto puede provenir de la lectura, la edición o ambas. Es previsible, en contraste, que la inteligencia artificial pase de la neutralidad a entonar según el texto, pues algunos softwares ya atienden a preguntas y exclamaciones. La comparación es grave: las máquinas parecen comprender.

Desde hace décadas se han imaginado enfrentamientos entre máquinas y humanos. 2001 Odisea del espacio, película de Stanley Kubrick.

 Las lecturas del locutor repiten tendencias del habla mexicana. Ante palabras, expresiones y apellidos extranjeros de diversos idiomas —o que le parecen ajenos, pero son español—, recurre a su propia pronunciación del inglés. Con frecuencia esto es improcedente, pues se trata de lenguas como el francés y hasta cuando sí es inglés, la elocución no se ajusta a algún estándar del idioma —ni siquiera en nombres de autores famosos. Esto es natural en cualquier hablante no nativo. Para nuestra desventaja —como las voces de Waze— las tecnologías de lectura de texto en voz alta pueden adoptar pronunciaciones y acentos localizados.

El problema de las pronunciaciones abruma a todos. Hay nombres de autores europeos que tienen su manera de ser dichos en la universidad nacional. El fenómeno se repite entre quienes se atribuyen “mundo”: en la universidad privada de mayor prestigio social de la Ciudad de México, desde la petulancia de la ignorancia, algunos estudiantes corregían mi alusión a un sociólogo alemán, buscando instruirme a decirlo con exagerada pronunciación chilanga del inglés. Yo he aprendido a pronunciar en su lengua original muchos apellidos y, sin duda, digo multitud de ellos defectuosamente. Aunque esto no sea trascendente, a un software se le pueden cargar miles de pronunciaciones en su idioma o en la adaptación nacional más difundida para mejor comprensión de los escuchas.

Los gazapos son responsabilidad compartida, que la limitación de tiempo no justifica. El equipo y el locutor revelan desconocimiento desde el nombre de ciertas instituciones —igualmente ignoran frases hechas. Tampoco parecen saber nombres de personajes ficticios clásicos. En contraste, a esto programas se le puede introducir más información de la que cualquier humano podría memorizar. Que ningún miembro del equipo corrija, que quizá ni siquiera detecten los errores, revela deficiencias educativas comunes que impiden comprender simples textos de divulgación. El problema no es menor, pero no estamos exclusivamente ante yerros de un equipo, ni sólo frente a evidencia del fracaso educativo mexicano, sino ante nuestras limitaciones de cara a una tecnología que nos puede superar en algo tan humano como leer y hablar.

Una de las instituciones que se ocupan de la reflexión sobre las posibilidades y peligros de la inteligencia artificial.

Menos difundida fue otra declaración de Hawking, de la misma entrevista, en que explicaba una razón de su temor: la inteligencia artificial “podría comenzar a valerse por sí misma y rediseñarse a ritmo cada vez mayor”. Me he referido a softwares de conversión de texto en palabra hablada, pero los casos están por doquier: es probable que por inteligencia artificial se produzcan diagnósticos más certeros que los de médicos experimentados. Ante deficiencias y limitaciones —que todos padecemos— ningún trabajo está asegurado. ¿Qué pasará cuando la inteligencia artificial no sólo diga adecuadamente el nombre de un escritor, sino que sea capaz de hacer sociología con un manejo de datos y teorías imposible para un ser humano o cuando pueda comprender nuestra mente, tarea en que fallamos cada día?

También te puede interesar