Quién iba a decir a los escritores que iban a ser los programadores del futuro en lugar de los ingenieros. Y es que, cuando hablamos de Inteligencia Artificial con algoritmos de Machine Learning, estamos haciendo referencia a una computadora, que por medio de un algoritmo creado por un ingeniero, aprende sola para resolver problemas de forma inteligente. Y es aquí donde llega la clave.
La gracia está en que, cuando queremos dotar a esos sistemas de inteligencia artificial de lo que llamamos servicios cognitivos, como son las capacidades cognitivas humanas, es decir, la vista, el reconocimiento de objetos, hablar, leer, comprender, traducir, explicar, responder a un humano, etcétera, debemos entrenar esos algoritmos de Machine Learning con los mismos datos que entrenamos a los humanos.
Por ejemplo, para que una Inteligencia Artificial aprenda a traducir debemos darle muchos textos escritos en los dos idiomas que queremos que traduzca, y el algoritmo de Machine Learning programado por el ingeniero hará que la Inteligencia Artificial aprenda, pero gracias a las traducciones hechas por muchos humanos antes. Y aprenderá bien o mal, con prejuicios, sesgos o defectos en función de cómo sea el algoritmo creado por el ingeniero y lo buenos o malos que sean los textos que le demos como datos de entrada.
Por supuesto, llevar a una inteligencia artificial que ha aprendido con libros a traducir frases sueltas sacadas de contexto puede generar los problemas de sesgos de género de los que ya os he hablado antes por aquí. En este caso en concreto, la culpa no es del humano traductor que hizo, con cuidado y esmero, la traducción del libro con el que la máquina aprendió a traducir después.
El problema se genera porque el humano traductor, para decidir si era un juez o una jueza —caso de uno de los ejemplos sesgados en la traducción— tuvo un libro entero para saber mucho más de ese personaje, y conocer si era hombre o mujer. Pero la inteligencia artificial no, y no puede extrapolar géneros a la hora de traducir frases sueltas, lo que lleva a que la culpa sea, en este caso, del ingeniero que eligió mal los datos para entrenar a la inteligencia artificial, o no supo diseñar un algoritmo con estos límites, o directamente que debía haber entrenado con otros datos diferentes su algoritmo.
Pero lo curioso de esto, querido lector y escritor, es que el humano traductor que generó los datos con los que aprendió esa inteligencia artificial no sabía, ni por asomo, que un día las decisiones que él tomó en su trabajo entrenarían a una inteligencia artificial que le sustituiría en muchas de sus facetas. Sin embargo, hoy ya lo sabemos. Cada dato que generamos en la red será utilizado para entrenar las inteligencias artificiales del futuro.
Así, los textos de nuestro querido y admirado Arturo Pérez-Reverte en El Capitán Alatriste sirvieron para entrenar a nuestro querido Maquet, aunque aún lejos de llegar a ser capaz de escribir como su profesor. Pero todos los textos que escribimos y volcamos en la red sirven para entrenar a una u otra inteligencia artificial, sea esta la que sea.
Por ejemplo, los equipos de Microsoft crearon una inteligencia artificial para reconocer a famosos y así, sin yo saberlo, utilizando las fotos mías que había en la red, este servicio me convirtió en una celebridad, y con cualquier foto nueva me reconocía con facilidad, incluso medio disfrazándose. Como si fuera mi madre, que me reconoce de espaldas y de noche por como silbo.
Otro ejemplo famoso de datos utilizados para entrenar el servicio cognitivo de visión artificial y aprender a reconocer bien los objetos en tres dimensiones fue el famoso Mannequin Challenge, que seguro que muchos de vosotros habéis hecho, visto, o criticado, que de todo hay en la viña del Señor. Y como ese, el reto de la foto de los 10 años tuya, donde subías una foto tuya de hace diez años y otra en la actualidad, consiguiendo de esa forma entrenar a una inteligencia artificial a ser capaz de envejecer y rejuvenecer personas diez años de forma acertada y realista.
Esta última inteligencia artificial ha resultado ser una mina de oro en Hollywood, ya que en casi todas las películas hoy en día se usa en mayor o menor intensidad. ¿Qué hubiera sido de la famosa película El irlandés sin poder contar con esta tecnología que permite rejuvenecer personas? ¿Quién te iba a decir a ti, que subiste a la red esas fotografías, que estabas entrenando a una inteligencia artificial que ha hecho de oro a muchos en la industria del cine?
En el mundo de la programación hay también una auténtica revuelta, ya que GitHub, el servicio donde los programadores han publicado sus códigos, sus programas, sus algoritmos, etcétera, para compartir con la comunidad conocimiento, han sido usados para entrenar a una inteligencia artificial, que se llama Copilot y que comercializa ahora GitHub como un servicio de pago para que esta inteligencia artificial ayude a los nuevos programadores a sugerirles líneas de código.
Así que todos los datos que publiques en la red, incluido estos artículos que estamos subiendo a Zenda Libros, son indexados por Google o Bing, y utilizados para entrenar sus inteligencias artificiales basadas en datos masivos. Así, igual que comercializan servicios de traducción en forma de APIs que han sido entrenados con datos de los humanos traductores —sin ver ni un € por su trabajo de alimentar a la AI—, los artículos que publicas en tu blog, o en un periódico, o aquí, son indexados para entrenar a sus inteligencias artificiales y generar servicios.
Pero encima, si no tenemos cuidado, no solo estamos alimentando una inteligencia artificial que va a hacer lo mismo que nosotros —escribir los textos, como hicimos con Maquet— o aprender a razonar, o responder preguntas sobre textos con los servicios de comprensión lectora que ya tenemos, o cualquier otra cosa, sino que además somos responsables, sin saberlo, de que aprendan bien o mal.
Por ejemplo, si generamos artículos con sesgo de género por defecto, estaremos entrenando a una inteligencia artificial haciéndole pensar que un género es prioritario sobre otro. Es decir, supongamos que escribimos un artículo y el título es “Mejores tenistas de 2021”, pero luego solo hablamos de tenistas hombres. De esta forma tan simple habremos generado un artículo con sesgo de género por defecto, haciendo pensar que “tenistas” son hombres. Y está mal, porque estamos educando erróneamente a una inteligencia artificial.
Y esto se transmite. Este artículo será indexado por Google o Bing. Y el sesgo de género creado en él hará que sus algoritmos de inteligencia artificial, usados para responder a las búsquedas de información de las personas, responda con sesgo de género también a las consultas.
Es decir, imaginemos que una persona quiere ver quiénes han sido, en el mundo del tenis, los mejores en el año 2021, sin importar si es hombre o mujer. Lo que obtendrá serán resultados de… hombres. Hay que navegar unos cuantos enlaces hasta llegar a la primera referencia a tenis femenino.
Por supuesto, la trampa del género por defecto no solo se genera porque el escritor del artículo publicado en un medio digital haya caído inadvertidamente en este. No, se genera también cada vez que alguien hace una búsqueda de sesgo de genero por defecto, ya que eso genera también datos en el buscador. Me explico:
Supongamos que queremos buscar los mejores tenistas masculinos de 2021 en Bing —por cambiar a otro motor de búsqueda— y hacemos una búsqueda con sesgo de género por defecto con un “Mejores tenistas 2021”. Es con sesgo de género porque nosotros sabemos que buscamos hombres, pero no se lo decimos al algoritmo del buscador. Y cuando nos muestran los resultados, vamos y hacemos clic en un resultado de hombres, en vez de hacer una nueva búsqueda.
Lo que sucede cuando elegimos un resultado en una búsqueda son sesgo de género y navegamos hacia él es que hemos entrenado a la inteligencia artificial con que esa cadena de búsqueda, que es la pregunta, se relaciona con ese enlace, que es la respuesta. Mientras que si hacemos una nueva búsqueda refinando los términos le enseñamos que ninguno de los resultados, para nosotros, es correcto.
Así que cada vez que escribes un artículo con un título con sesgo de género estás educando mal a las inteligencias artificiales que se entrenan con datos masivos. Cada vez que haces una búsqueda con sesgo de género estás entrenando mal a las inteligencias artificiales que se van a usar en tu vida en el futuro. Cada vez que pones un enlace en un documento con un hipervínculo en el que hay sesgo de género, mal educas a las inteligencias artificiales… y van a afectarte en tu presente y tu futuro porque todo, todo, todo, todo va a llevar inteligencia artificial en sus programas.
Y recuerda, a las inteligencias artificiales las educan los datos que les demos de comer, y no los algoritmos de Machine Learning que hacen los programadores, así que vosotros, escritores, publicadores de contenido, traductores, humanos que subís textos a vuestros blogs, sois también responsables de que nuestras inteligencias artificiales aprendan bien y no sean maleducadas o afecten negativamente a las personas.
Zenda es un territorio de libros y amigos, al que te puedes sumar transitando por la web y con tus comentarios aquí o en el foro. Para participar en esta sección de comentarios es preciso estar registrado. Normas: