En Directo

Última hora sobre Juana Rivas y la entrega del menor a su padre, Francesco Arcuri

Tecnología

Te están utilizando para entrenar inteligencias artificiales y ni siquiera lo sabes

Los famosos capchas no sirven solo para comprobar que seas humano, al resolverlos estás entrenando una inteligencia artificial

Persona tecleando en el teléfonoArchivo

Ignacio Crespo.@SdeStendhal
Graduado en Medicina. Disfruto hablando de ciencia allí donde me dejan: aquí, en mi blog S de Stendhal y en programas de radio como A Ciencia Cierta o Coffee Break. Conferenciante, monologuista científico y organizador de Ogmios.

Madrid Creada: 21.04.2023 09:48

Última actualización: 21.04.2023 09:48

Sí, así es. Hace años que estás entrenando inteligencias artificiales para Google y ni siquiera lo sospechabas. No es una conspiración ni un escándalo, pero conviene que sepas que, mientras creías estar demostrando tu humanidad, estabas haciendo algo muy distinto. Hablamos de los captchas, esas pequeñas pruebas a las que nos somete de vez en cuando internet para asegurarse de que no somos una máquina. En ellas, por ejemplo, nos piden que identifiquemos las letras de una “palabra” o, en sus versiones más modernas, que encontremos qué fotos incluyen determinados objetos. Google, por ejemplo, nos somete a ellos siempre que intentemos entrar en nuestra cuenta desde una ubicación atípica. De hecho, es muy probable que hayas completado entre decenas y centenares de captchas.

El programa que utiliza Google para presentarnos estos “acertijos” a prueba de máquinas se llama reCAPTCHA y, aunque tenga segundas intenciones, hay que reconocer que funciona. CAPTCHA significa “Completely Automated Public Turing test to tell Computers and Humans Apart”, que al castellano se traduciría como “prueba de Turing pública y totalmente automatizada para distinguir entre ordenadores y humanos”. O, dicho de otro modo: una prueba demasiado difícil para que no puedan superarla programas informáticos mediocres que busquen hacer spam o tomar el control de cuentas.

La clave no es tanto diseñar pruebas que ninguna máquina pueda superar, sino disuadir a la mayor parte de ataques que, evidentemente, emplean programas bastante mediocres. Esa es su principal función, desde luego, y precisamente, como funcionan, nos llevan acompañando desde hace décadas. Aclarado esto, es hora de hablar sobre el otro lado de esta tecnología.

No has escrito un libro, pero casi…

Como decíamos antes, los primeros captchas eran distintos y, aunque todavía podemos encontrar sus versiones antiguas en alguna que otra página, la mayoría han evolucionado. Al principio era fácil desenmascarar programas que intentaban hacerse pasar por humanos. Si les presentábamos unas letras irregulares y algo deformadas, la amplísima mayoría de programas era incapaz de identificarlas. Algo que, a nosotros, pobres humanos acostumbrados a la mala caligrafía de nuestros congéneres (y de nosotros mismos), hacíamos sin despeinarnos lo más mínimo.

**Capchas del reCAPCHA donde te pide encontrar semáforos, hidrantes y buses**ReCAPTCHAGOOGLE

A medida que la informática se sofisticó, hizo falta complicar la prueba, pero quedémonos un momento con aquellas letras. Google se dio cuenta de que podía sacar provecho de esta autentificación si, en lugar de mostrar letras cualesquiera, mostraba las de los incontables libros que había escaneados en el archivo de Google Books. De ese modo, empezaron a mostrar dos conjuntos de letras, uno cuya correcta transcripción conocían y que realmente valía para autentificarte como humano y otro de algún libro que todavía no había sido transcrito.

Al mostrar un mismo fragmento sin transcribir a distintas personas y pedirles que identificaran las letras, Google podía hacerse una idea bastante precisa de lo que realmente decían. Así fue como, en unos años y sin que nos diéramos cuenta, Google transcribió sus millones de libros y 13 millones de artículos antiguos del New York Times en tan solo 3 años. Y sí, tú fuiste parte de todo eso.

La autoescuela de las IAs

Así es como llegó el 2011, con toda una biblioteca digital y un montón de posibilidades abiertas. ¿En qué podían aprovechar ahora toda esa mano de obra humana? ¿Qué otros beneficios podían extraer de un captcha? Pues bien, resulta que la inteligencia artificial ya tenía cierto cuerpo y había negocio en el reconocimiento de imágenes. Que una inteligencia artificial sea capaz de identificar un objeto no es baladí.

Por un lado, es un problema complejo (aunque cada vez menos) y, por otro, tiene una gran cantidad de aplicaciones atractivas para la industria. Por ejemplo, el reconocimiento facial de nuestros teléfonos o las inteligencias artificiales que convierten las imágenes en palabras para que los invidentes puedan comprenderlas. Aunque, de entre todas sus potenciales aplicaciones, la conducción autónoma era la reina.

Para que un coche se conduzca solo a la perfección es necesario que sepa reconocer los objetos que le rodean: otros coches, peatones, la carretera, un coche que pueda cruzarse, etc. Y cuando decimos que ha de reconocer un coche significa que ha de reconocer un coche de cualquier forma que se presente. No hace tanto que hubo un accidente porque un coche autónomo no reconoció otro vehículo que estaba sobre su costado en medio de la carretera. ¿Por qué no cambiar las palabras por imágenes de Google Maps?

Google tiene una gran baza para el desarrollo de inteligencias artificiales y es la descomunal cantidad de información que posee y con la que, por lo tanto, puede entrenar a las IAs. Ahora imagina que a esto le sumemos miles de millones de personas enseñándole a la IA qué está viendo en distintas imágenes. Cuando reCAPTCHA nos muestra 9 imágenes de objetos diferentes o una imagen dividida en 16 recuadros para que encontremos objetos en ellas, sabe parte de la información, pero tal vez no toda y, de ese modo, reúne datos valiosos para el entrenamiento.

Así que sí, esos famosos captchas eran mucho más de lo que parecían y, de algún modo, te han hecho partícipe de esta explosión de las inteligencias artificiales que estamos viviendo. Una práctica perfectamente legal en la que Google ha sabido jugar sus cartas y en la que casi todos hemos jugado un papel.

QUE NO TE LA CUELEN:

Las inteligencias artificiales no son consciencias informáticas con voluntad y ambiciones. Son líneas de código que realizan operaciones matemáticas para almacenar datos, encontrar tendencias y devolver respuestas ajustadas a lo que les hayamos enseñado que esperamos de ellas.

REFERENCIAS (MLA):

Choi, C.Q. (2021) Artificial Intelligence beats captcha, IEEE Spectrum. IEEE Spectrum. Available at: https://spectrum.ieee.org/artificial-intelligence-beats-captcha (Accessed: April 20, 2023).
ReCAPTCHA (no date) Google. Google. Available at: https://www.google.com/recaptcha/about/ (Accessed: April 20, 2023).
von Ahn, L. et al. (1970) CAPTCHA: Using hard ai problems for security, SpringerLink. Springer Berlin Heidelberg. Available at: https://link.springer.com/chapter/10.1007/3-540-39200-9_18 (Accessed: April 20, 2023).

Accede a tu cuenta para comentar

Te están utilizando para entrenar inteligencias artificiales y ni siquiera lo sabes

Los famosos capchas no sirven solo para comprobar que seas humano, al resolverlos estás entrenando una inteligencia artificial

No has escrito un libro, pero casi…

La autoescuela de las IAs

QUE NO TE LA CUELEN:

REFERENCIAS (MLA):

Noticias destacadas

Una turista se graba nadando en un mar de espuma que para su disgusto resulta ser otra cosa bien distinta

Mazón: "Soy licenciado en Derecho y no tengo ningún máster, míster ni móster"

Quién es Paqui Granados, la asesora de Maracena: este es su rol en el caso de Juana Rivas y Francesco Arcuri

Detenido un dirigente socialista en una investigación por la gestión de los centros de menores