1

ReCaptcha: el mundo entero digitaliza libros

 

Captcha es un sistema de verificación para distinguir seres humanos de ordenadores. ReCaptcha permite que los usuarios colaboren en el proceso de digitalizar libros.

 

Muchas veces hemos tenido que rellenar esos pequeños y fastidiosos cuadraditos con letras distorsionadas, para demostrar que no somos máquinas. Este sistema fue creado con el fin de acabar con los programas automatizados para generar spam. La herramienta es conocida como Captcha.

En la actualidad, una de sus versiones más populares es ReCaptcha, que solicita a los navegantes que identifiquen dos palabras antes de registrarse en una página, modificar su usuario o realizar una descarga. Se calcula que en un día se completan 200 millones de ReCaptcha en todo el mundo. Teniendo en cuenta que  resolver cada uno lleva aproximadamente 10 segundos, se pierden 150.000 horas completando esta operación.

Pero, como no podía ser de otra forma, alguien pensó cómo convertir ese tiempo perdido en algo útil. Este es el caso de Luis von Ahn, uno de los responsables de la creación de los Captcha y, ahora, de los ReCaptcha. Entre los objetivos de gigantes de Internet como Google y Amazon se encuentra el desafío de conseguir la digitalización de todos los libros y documentos creados antes de la era virtual. Esto implica el escaneo de los documentos y el procesamiento de cada página para identificar su contenido. La cuestión radica en que las maquinas no siempre son capaces de interpretar todas las palabras, sobre todo cuando se trata de libros muy antiguos que están dañados por el paso del tiempo. Estos términos sólo pueden ser identificados correctamente por un ser humano. Es aquí donde entra en juego la participación de los usuarios.

 

La fuente es la multitud

Todo parte de un concepto inglés que se denomina “Crowdsourcing”. Si lo traducimos al español, el resultado podría ser algo así como “la fuente es la multitud” o “la fuente es la masa”.  ¿Qué quiere decir esto? Que existen un montón de tareas que antes eran desarrollados por una persona específica, o por un grupo reducido de individuos, que ahora pueden realizarse de manera masiva y colaborativa, con la participación de miles o millones de usuarios. Esta metodología de trabajo es especialmente frecuente en la red, donde las organizaciones de bien público e instituciones sin fines de lucro la utilizan para recibir la colaboración de internautas distribuidos alrededor de todo el mundo.

ReCaptcha combina el concepto de Crowdsourcing con la idea de aprovechar un recurso que está disponible. O sea, utilizar el tiempo que cada navegante invierte para resolver un Captcha para, a su vez, ayudar a digitalizar libros. ¿De qué forma? La herramienta le presenta a los usuarios dos palabras, una que reconoce y otra que no. De esta manera, si el navegante ingresa correctamente la palabra que el sistema ya logró identificar, se pasa a una segunda etapa en la que el usuario debe reconocer el término que la herramienta aún no ha descifrado. Así, la comunidad online trabaja en la digitalización de textos sin siquiera habérselo propuesto. Internet da nacimiento a nuevas formas de trabajo conjunto y colaborativo, para mejorar cada vez más nuestra calidad de vida.

De aquí en adelante

Pero, como siempre en este mundo digital, los nuevos proyectos surgen de manera constante. El próximo paso es revolucionar el concepto de la traducción. ¿Cómo? Mediante Duolingo, un sistema que permite a los usuarios aprender o practicar un idioma de manera gratuita, al mismo tiempo que ayudan en la traducción de textos a otras lenguas.

Esta suerte de plataforma de “traducción social” se basa en la colaboración de los usuarios que pueden, por ejemplo, otorgar una puntuación a una traducción generada por otro navegante. De este modo se produce un sistema autoadministrado, donde los usuarios obtienen un beneficio al mismo tiempo que colaboran con un trabajo colectivo. Los creadores de Duolingo aseguran que, si logran reunir a un millón de usuarios, tendrán la capacidad suficiente para traducir la versión inglesa de Wikipedia al español en tan sólo 80 horas.

La red se ha convertido en el referente por excelencia para la gestión de trabajo colectivo. Es una herramienta de colaboración que permite aprovechar al máximo los recursos disponibles. De esta forma, los usuarios ubicados en distintas partes del planeta, sin siquiera conocerse e incluso sin saberlo, colaboran en la realización de tareas que benefician a toda la comunidad. Los navegantes utilizan su energía disponible de manera colectiva, casi sin percibir el esfuerzo, pero disfrutando los resultados.

 Por: Silvina Moschini | CEO Intuic

Adolfo Manaure

Entusiasta seguidor de la tecnología y las innovaciones que cambian el mundo. Director Editorial y COO en The HAP Group.