Utilizando el poder de millones de mentes humanas | Luis von Ahn | TEDxRíodelaPlata
-
0:02 - 0:05Quiero empezar haciéndoles una pregunta:
-
0:06 - 0:09¿Cuántos de Uds. han tenido
que llenar un formulario en Internet -
0:09 - 0:13en el cual han tenido que ingresar
unas letras distorsionadas así como estas? -
0:15 - 0:18OK. ¿Cuántos odian hacer eso?
-
0:18 - 0:21Excelente. Bueno, eso lo inventé yo.
-
0:21 - 0:23(Risas)
-
0:23 - 0:26(Aplausos)
-
0:30 - 0:32Eso se llama un captcha.
-
0:32 - 0:35Es para asegurar que la entidad
-
0:35 - 0:38que llena el formulario es un humano
-
0:38 - 0:40y no un programa de computadora
-
0:40 - 0:43escrito para llenar ese formulario
millones de veces. -
0:43 - 0:45Esto funciona porque los humanos
-
0:45 - 0:48pueden leer
estos caracteres distorsionados -
0:48 - 0:51pero las computadoras simplemente
no lo pueden hacer aún. -
0:51 - 0:54Por ejemplo, cuando compran boletos
en Internet para algún concierto -
0:54 - 0:58tienen que ingresar esas letras
-
0:58 - 1:02para asegurarse de que los revendedores
no puedan comprar, -
1:02 - 1:04no puedan hacer un programa
-
1:04 - 1:07que compre todos los boletos,
dos a la vez. -
1:07 - 1:09Ahora, esos son usados por todo Internet.
-
1:09 - 1:11Y ya que son usados tantas veces,
-
1:11 - 1:16muchas veces la secuencia exacta
de caracteres o letras escogidas al azar -
1:16 - 1:18es un poco desafortunada.
-
1:18 - 1:21Por ejemplo, esto viene de Yahoo.
-
1:21 - 1:24Las letras escogidas totalmente al azar,
-
1:24 - 1:28en este caso fueron W, A, I, T
que en inglés es una palabra, WAIT, -
1:28 - 1:30que significa esperar.
-
1:30 - 1:33Pero lo mejor es que alrededor
de 20 minutos después, -
1:33 - 1:36el email que recibió Yahoo de este usuario
-
1:36 - 1:43["¡Ayúdenme! He estado esperando 20 m
y no pasa nada"] (Risas) -
1:43 - 1:47Eso por supuesto no es tan malo
como lo que le pasó a esta pobre persona. -
1:47 - 1:49[REINICIAR] (Risas)
-
1:49 - 1:52Les puedo contar historias divertidas
de captchas por horas, -
1:52 - 1:54pero mejor les quiero contar otro proyecto
-
1:54 - 1:57que hicimos después de este proyecto.
-
1:57 - 2:00Es como la evolución de los captchas.
El proyecto se llama recaptcha. -
2:00 - 2:03Es un proyecto que empezamos
en la universidad. -
2:04 - 2:06Lo convertimos en una compañía start-up
-
2:06 - 2:07y después Google compró esa compañía,
-
2:08 - 2:10así que por los próximos 5 m
todo lo que les diga -
2:10 - 2:15es propiedad de Google.
O sea que no lo repitan. -
2:15 - 2:19Este proyecto empezó por lo siguiente.
-
2:19 - 2:23Resulta ser que alrededor de 200 millones
de captchas son ingresados cada día. -
2:23 - 2:26Cuando me enteré de eso
yo estaba muy orgulloso de mí mismo. -
2:27 - 2:30Yo pensé "miren el impacto
que mi trabajo ha tenido". -
2:30 - 2:31Pero después me empecé a sentir mal.
-
2:31 - 2:33No sólo son odiosos, sino además,
-
2:33 - 2:37cada vez que alguien ingresa
un captcha realmente -
2:37 - 2:39pierden alrededor de
10 segundos de su tiempo. -
2:39 - 2:43Y si multiplicamos 10 s por 200 millones
llegamos a que -
2:43 - 2:47toda la humanidad está perdiendo
alrededor de 500 000 horas diarias -
2:47 - 2:49ingresando captchas en Internet.
-
2:49 - 2:52Entonces me empecé a sentir mal.
-
2:52 - 2:55Y me puse a pensar:
¿será que existe alguna manera? -
2:55 - 2:59o ¿cómo podemos utilizar este esfuerzo
para el bien de la humanidad? -
2:59 - 3:04Durante esos 10 s que alguien
está ingresando un captcha -
3:04 - 3:06su cerebro está haciendo algo increíble.
-
3:06 - 3:10Su cerebro está haciendo algo
que las computadoras aún no pueden hacer. -
3:10 - 3:12Será que podemos
hacer que hagan algo que sea -
3:12 - 3:13beneficioso para la humanidad.
-
3:14 - 3:17¿O existe algún problema gigantesco
que aún no podemos lograr -
3:17 - 3:19que las computadoras resuelvan
-
3:19 - 3:21pero que podemos dividir
en pedacitos chiquitos -
3:21 - 3:23para que cada vez que resuelva un captcha
-
3:23 - 3:25resuelva un pedacito de ese problema?
-
3:25 - 3:28Y resulta ser que sí
y eso es lo que estamos haciendo ahora. -
3:28 - 3:33Hoy en día, cuando ingresamos un captcha,
lo que tal vez no saben -
3:33 - 3:36es que no sólo están demostrando
que son humanos -
3:36 - 3:39sino además nos están ayudando
a digitalizar libros. -
3:39 - 3:41Déjenme explicarles cómo funciona eso.
-
3:41 - 3:43Hay varios proyectos para digitalizar
-
3:43 - 3:45todos los libros que han sido escritos.
-
3:45 - 3:46Google tiene uno.
-
3:46 - 3:49Amazon tiene otro con el Kindle.
-
3:49 - 3:51Es así: agarran un libro.
-
3:51 - 3:53Esas cosas físicas,
las han visto, ¿verdad? -
3:53 - 3:55Esas cosas de ahí afuera.
-
3:55 - 3:56(Risas)
-
3:56 - 3:58Agarran un libro y lo escanean.
-
3:58 - 4:05Escanear un libro consiste en tomarle
una foto digital a cada página. -
4:08 - 4:10El próximo paso en ese proceso
es que la computadora -
4:10 - 4:15tiene que descifrar todas las palabras
que están en esa foto. -
4:15 - 4:19El problema es que a los libros
que fueron escritos hace ya varios años, -
4:19 - 4:22la computadora no puede descifrar
muchas de esas palabras. -
4:22 - 4:25Porque la tinta ya se gastó,
las páginas ya se tornaron amarillas. -
4:25 - 4:27Entonces la palabra
se ve un poquito diferente -
4:27 - 4:30y la computadora no la puede descifrar.
-
4:30 - 4:33Para libros que fueron escritos
hace más de 50 años -
4:33 - 4:36la computadora no pude descifrar
alrededor del 30% de las palabras. -
4:36 - 4:37Entonces ahora estamos
-
4:37 - 4:41agarrando todas las palabras
que la computadora no puede descifrar -
4:41 - 4:44y estamos haciendo que alguien
las descifre para nosotros en Internet -
4:44 - 4:46mientras llenan un captcha.
-
4:46 - 4:47La próxima vez
que llenen un captcha -
4:47 - 4:55(Aplausos)
-
4:55 - 4:58esas palabras que están ingresando
-
4:58 - 5:01son palabras que vienen directamente
de libros que han sido digitalizados -
5:01 - 5:03y que la computadora no pudo reconocer.
-
5:03 - 5:07La razón por la que ahora tenemos
dos palabras en vez de una -
5:07 - 5:14es que necesitamos verificar
si la respuesta está correcta. -
5:14 - 5:18Porque una de las palabras
es tal que el sistema ya sabe la solución -
5:18 - 5:21y la otra es una que el sistema
acaba de agarrar de un libro, -
5:21 - 5:24no sabe qué es, se la va
a enseñar a algún usuario. -
5:24 - 5:27Le vamos a pedir al usuario
que ingrese ambas. -
5:28 - 5:29Y no le vamos a decir cuál es cuál.
-
5:29 - 5:31Y si ingresan la respuesta correcta,
-
5:31 - 5:34para la cual el sistema
ya sabe la respuesta, -
5:34 - 5:35suponemos que es un humano
-
5:35 - 5:40y como tenemos un poco de confianza
que ingresaron la otra correctamente. -
5:40 - 5:44Y si repetimos este proceso
con 10 personas con la nueva palabra -
5:44 - 5:46y todos ingresan la misma cosa
con la nueva palabra -
5:46 - 5:48tenemos mucha seguridad
de que esa nueva palabra -
5:48 - 5:50está correctamente digitalizada.
-
5:50 - 5:52Esa es la manera
en que funciona ese sistema. -
5:52 - 5:54Y lo bueno es que ha sido muy exitoso.
-
5:54 - 5:58Estamos digitalizando alrededor de
100 millones de palabras diarias. -
5:58 - 6:02Lo cual es el equivalente
a 2 millones de libros al año -
6:02 - 6:05que están siendo digitalizados
una palabra a la vez -
6:05 - 6:07por gentes escribiendo captchas
en Internet. -
6:07 - 6:11Ahora, ya que estamos haciendo
tantos pares de palabras, -
6:11 - 6:15también pueden pasar
cosas interesantes o divertidas. -
6:15 - 6:19Eso es cierto porque ahora
estamos enseñando dos palabras, -
6:19 - 6:22en inglés, una a la par de la otra,
escogidas al azar. -
6:22 - 6:24Eso puede llevar
a cosas divertidas que pasan. -
6:24 - 6:26Por ejemplo, enseñamos esta palabra.
-
6:26 - 6:30Que solo es "cristianos",
no tiene nada de malo. -
6:31 - 6:34Pero si la ponemos con otra palabra
escogida totalmente al azar -
6:34 - 6:36pueden pasar cosas malas.
-
6:36 - 6:38Por ejemplo, enseñamos esto.
[malos cristianos] -
6:39 - 6:40(Risas)
-
6:40 - 6:41Es un poco divertido.
-
6:41 - 6:44Pero es aún peor
porque hay millones de sitios, -
6:44 - 6:46pero resulta que este captcha lo enseñamos
-
6:46 - 6:50en un sitio llamado
La Embajada del Reino de Dios. -
6:50 - 6:52(Risas)
-
6:52 - 6:53¡Ups!
-
6:53 - 6:55Aquí hay otro muy malo.
-
6:55 - 7:00Un político en EE. UU., JohnEdwards.com
[maldito liberal] -
7:00 - 7:04(Risas)
-
7:04 - 7:07Bueno, insultamos a gente
todos los días con esto. -
7:07 - 7:09Pero no solo son insultos.
-
7:09 - 7:12También muchas veces son
cosas interesantes que pueden pasar -
7:12 - 7:15y eso ha dado auge
a una nueva moda en Internet -
7:15 - 7:18en la cual han participado
millones de personas -
7:18 - 7:20que se llama captchart o arte de captchas.
-
7:20 - 7:22La idea es la siguiente.
-
7:22 - 7:26Imagínense que están navegando
en Internet y de repente -
7:26 - 7:28miran un captcha
que les parece interesante. -
7:28 - 7:30Como éste. [tostador invisible]
-
7:30 - 7:34Lo que tienen que hacer
es tomar una captura de pantalla. -
7:34 - 7:36Después tienen que ingresar el captcha,
-
7:36 - 7:38porque así nos ayudan
a digitalizar libros, por favor. -
7:38 - 7:40Y después, lo que tienen que hacer
-
7:40 - 7:45es dibujar algo basado en este captcha
y ponerlo con el captcha, así como esto. -
7:45 - 7:46[tostador invisible]
-
7:46 - 7:47(Risas)
-
7:48 - 7:51Es un ejemplo de arte de captcha.
-
7:51 - 7:53Ahora, hay miles de miles de esos.
-
7:53 - 7:55Hay unos como éste, interesantes.
-
7:55 - 7:58Hay otros como este
que son más tiernos. [¡Gané!] -
7:58 - 8:01Y hay otros como este
que son mucho más divertidos. -
8:01 - 8:08[Fundadores drogados] (Risas)
-
8:08 - 8:12Este es mi nº favorito acerca
de este proyecto: 900 millones. -
8:12 - 8:15Ese es el nº total de personas distintas
-
8:15 - 8:18que nos han ayudado a digitalizar
al menos una palabra -
8:18 - 8:19de algún libro a través de captchas.
-
8:19 - 8:21Un poco más del 10 % de la humanidad
-
8:21 - 8:23nos ha ayudado a digitalizar libros.
-
8:23 - 8:26Son números como este
los que motivan mi trabajo. -
8:26 - 8:30Y en particular, la pregunta
que me motiva a mí es la siguiente: -
8:30 - 8:33Si miramos todos los proyectos más grandes
de la historia de la humanidad. -
8:33 - 8:36Todos esos megaproyectos
que ha hecho la humanidad -
8:36 - 8:40como las pirámides de Egipto,
o el Canal de Panamá, -
8:40 - 8:43o poner un hombre en la Luna.
-
8:43 - 8:45Algo curioso acerca
de todos estos megaproyectos -
8:45 - 8:49es que fueron hechos con alrededor
del mismo nº de personas. -
8:49 - 8:51Todos fueron hechos
con alrededor de 100 000 personas. -
8:51 - 8:54Y nos podemos preguntar
por qué es que todos usaron -
8:54 - 8:55el mismo nº de personas.
-
8:55 - 8:57Y la razón es porque antes de Internet,
-
8:57 - 9:01coordinar a más
de 100 000 personas era imposible. -
9:01 - 9:04Pero ahora con Internet
les acabo de enseñar un proyecto -
9:04 - 9:07donde hemos coordinado
a 900 millones de personas. -
9:07 - 9:09Entonces la pregunta que me motiva a mí es
-
9:09 - 9:12si podemos poner a un hombre
en la luna con 100 000 personas, -
9:12 - 9:14¿Qué podemos hacer
con 100 millones de personas? -
9:14 - 9:17Y con esa pregunta
hemos trabajado en varios proyectos. -
9:17 - 9:19No les voy a contar todos.
-
9:19 - 9:23Pero les quiero contar acerca de uno
que estamos trabajando ahorita. -
9:23 - 9:26Llevamos alrededor de dos años
trabajando en este proyecto. -
9:26 - 9:30Y lo vamos a lanzar
en alrededor de 30 días. -
9:30 - 9:33Es un proyecto que se llama Duolingo.
-
9:33 - 9:36Este proyecto empezó
con la siguiente pregunta: -
9:36 - 9:40¿Cómo podemos hacer
que 100 millones de personas -
9:40 - 9:46traduzcan Internet
a todos los mayores idiomas, gratis? -
9:46 - 9:47Hablemos de esta pregunta.
-
9:47 - 9:50La primera es traducir Internet.
-
9:50 - 9:52Como sabemos, Internet
está partido en varios idiomas. -
9:52 - 9:54Una gran fracción está en inglés.
-
9:54 - 9:57Y si alguien no sabe inglés
no puede usarlo -
9:57 - 9:58pero hay fracciones en otros idiomas
-
9:58 - 10:00y si alguien no sabe se lo pierde.
-
10:01 - 10:04Yo quisiera traducir todo Internet
a todos los mayores idiomas. -
10:04 - 10:05Me gustaría.
-
10:05 - 10:08Ahora, si eso es lo que quiero
hacer mucha gente me podría decir -
10:08 - 10:11por qué no usamos computadoras
para hacerlo. -
10:11 - 10:15Últimamente las computadoras
están traduciendo algunas oraciones. -
10:15 - 10:17Pero como todos sabemos,
las computadoras simplemente -
10:17 - 10:19no son muy buenas para traducir.
-
10:19 - 10:24Y no lo van a ser por los próximos
20 o 30 años. -
10:24 - 10:27Déjenme enseñarles sólo
un ejemplo de qué puede pasar -
10:27 - 10:29cuando traducimos algo con computadoras.
-
10:29 - 10:34Esto es un ejemplo que encontramos
en un foro en Internet acerca de... -
10:34 - 10:38es un foro para preguntas de programación.
-
10:38 - 10:42Esta es una pregunta de programación
que fue traducida del japonés al inglés -
10:42 - 10:45y de ahí la traduje al español
pero mi traducción es buena. -
10:45 - 10:47La otra es la que es mala. Ya van a ver.
-
10:47 - 10:50Sólo les voy a dejar que lean esto.
-
10:50 - 10:53Está pidiendo perdón
por el hecho de que es una traducción. -
10:53 - 10:56Esto fue hecho
con el mejor programa de traducción -
10:56 - 10:58de japonés a inglés.
-
10:58 - 11:04Recuerden. Se supone que es una pregunta
acerca de programación. -
11:04 - 11:06Aquí viene el preámbulo de la pregunta.
-
11:06 - 11:12[A menudo, la cabra durante la instalación
de un error es vomitar] (Risas) -
11:12 - 11:14Después viene la primera parte
de la pregunta. -
11:14 - 11:20[¿Cuántas veces como el viento,
un poste, y el dragón?] (Risas) -
11:20 - 11:22Después viene mi parte favorita
de la pregunta. -
11:22 - 11:26[¿Este insulto a las piedras
de mi padre?] (Risas) -
11:26 - 11:29Y después viene mi parte favorita
de todo el mensaje. -
11:29 - 11:33[Por favor, pedir disculpas
por su estupidez. Hay muchos gracias] -
11:33 - 11:35O sea que, las computadoras
no son muy buenas -
11:35 - 11:36así que necesitamos humanos.
-
11:36 - 11:40Entonces lo que yo quiero hacer
es que 100 millones de personas -
11:40 - 11:43traduzcan Internet a todos
los mayores idiomas y gratis. -
11:43 - 11:46No creo que le pueda pagar
yo a 100 millones de personas. -
11:46 - 11:47Entonces quiero que lo hagan gratis.
-
11:47 - 11:49Si eso es lo que quiero hacer,
-
11:49 - 11:52cuando empezamos a trabajar
en este proyecto nos dimos cuenta -
11:52 - 11:56de que había dos grandes obstáculos
para lograr hacer esto. -
11:56 - 12:00El primero es la falta
de personas bilingües. -
12:00 - 12:03Yo no sé si existen 100 millones
de personas que usan Internet -
12:03 - 12:07que son suficientemente bilingües
para ayudarnos a traducir. -
12:07 - 12:08Ese es un gran problema.
-
12:08 - 12:10El segundo es la falta de motivación.
-
12:10 - 12:14¿Cómo vamos a hacer para motivar
a personas para que traduzcan gratis? -
12:14 - 12:19Después de pensar en esos dos problemas
por varios meses, -
12:19 - 12:21nos dimos cuenta que había una manera
-
12:21 - 12:24de resolver ambos problemas
con la misma solución. -
12:24 - 12:28Nos dimos cuenta que había una manera
de matar dos pájaros de un tiro. -
12:28 - 12:31Y la manera es transformar
la traducción de idiomas -
12:31 - 12:34en algo que millones de personas
quieren hacer -
12:34 - 12:38y que además ayuda con el problema
de falta de personas bilingües. -
12:38 - 12:41Y eso es el aprendizaje de otros idiomas.
-
12:41 - 12:44Hay millones de personas
que quieren aprender otros idiomas. -
12:44 - 12:49Hoy en día hay 1200 millones de personas
en el mundo aprendiendo otro idioma. -
12:49 - 12:52No sólo es porque los están forzando
a hacerlo en el colegio. -
12:52 - 12:55En EE. UU., por ejemplo,
hay más de 5 millones de personas -
12:55 - 12:59que han pagado más de 500 dólares
por programas de computación -
12:59 - 13:01para aprender nuevos idiomas.
-
13:01 - 13:04Mucha gente quiere aprender
nuevos idiomas. -
13:04 - 13:07Entonces hemos estado trabajando
en los últimos dos años -
13:07 - 13:09es un nuevo sitio de Internet
que se llama Duolingo. -
13:09 - 13:12La idea es que la gente
puede aprender un nuevo idioma, -
13:12 - 13:18100 % gratis, y al mismo tiempo,
están traduciendo Internet. -
13:18 - 13:20O sea, aprenden traduciendo.
-
13:20 - 13:22Esa es la manera en que funciona.
-
13:22 - 13:26Y la manera en que funciona
es que cuando están empezando -
13:26 - 13:28les vamos a dar oraciones
muy sencillas de Internet. -
13:28 - 13:32Y si no saben alguna palabra
les vamos a decir qué significa, -
13:32 - 13:34pero les vamos a decir
"traduzca esta oración". -
13:34 - 13:36Y resulta ser que la gente
sí lo puede hacer. -
13:36 - 13:39Aunque no sepan nada del idioma
si les explicamos -
13:39 - 13:41qué significa cada palabra
y la van a traducir. -
13:41 - 13:44Y después van a ver
cómo otras personas traducen -
13:44 - 13:46la misma oración y así
aprende cómo se traduce. -
13:46 - 13:48Y después que van usando el sitio
-
13:48 - 13:51les vamos a ir dando oraciones
más y más complejas. -
13:51 - 13:55Y así nos van a ir ayudando a traducir.
Así es como funciona el sitio. -
13:55 - 13:57Ahora ya terminamos de construirlo
-
13:57 - 14:00y lo que estamos haciendo
ahora es sólo probándolo. -
14:00 - 14:02Cuando empezamos a trabajar en esto
-
14:02 - 14:04yo no pensé que fuera a funcionar,
la verdad. -
14:04 - 14:06Pero resulta ser que sí funciona.
Y es increíble. -
14:06 - 14:09En primer lugar la gente aprende idiomas.
-
14:09 - 14:13En este caso estamos probándolo
con personas -
14:13 - 14:15que saben inglés y aprenden español.
-
14:15 - 14:16Y al revés.
-
14:16 - 14:18Y resulta ser
que aprenden el idioma muy bien. -
14:19 - 14:22Lo aprenden tan bien como con cualquier
otro método computarizado -
14:22 - 14:23de aprender idiomas.
-
14:23 - 14:26Lo cual es muy bueno.
Pero aún más increíble las traducciones -
14:26 - 14:29que nos está dando la gente a la hora
que están aprendiendo son muy buenas. -
14:29 - 14:31Es más son tan buenas
como las traducciones -
14:31 - 14:34que nos dan traductores profesionales.
-
14:34 - 14:37Ahora, hay un truco
que estamos usando para esto -
14:37 - 14:41y es que cada oración la traducen
varias personas, varios estudiantes, -
14:41 - 14:44y escogemos la mejor.
Pero resulta ser que esa mejor -
14:44 - 14:48es tan buena como la que nos da
un traductor profesional. -
14:48 - 14:55Pero además de que a cada oración
la está traduciendo muchas personas, -
14:55 - 14:57otra cosa que es buena es que con Duolingo
-
14:57 - 15:00podemos traducir realmente
bastante rápido. -
15:00 - 15:04Déjenme darles un estimado
de qué tan rápido podemos traducir. -
15:04 - 15:07Si quisiéramos traducir
la Wikipedia del inglés al español -
15:07 - 15:10-la Wikipedia existe en español
pero es mucho más pequeña -
15:10 - 15:12que en inglés, es alrededor
del 20 % del tamaño en inglés- -
15:12 - 15:16si quisiéramos traducir la Wikipedia
del inglés al español con Duolingo, -
15:16 - 15:21si tuviéramos 100 000 usuarios
aprendiendo inglés con Duolingo -
15:21 - 15:23podríamos hacerlo en 5 semanas.
-
15:23 - 15:26Y con un millón de usuarios
podríamos hacerlo en 80 horas. -
15:26 - 15:29Y ya que todos mis proyectos
hasta la fecha han logrado -
15:29 - 15:30tener más de un millón de personas
-
15:30 - 15:34esperamos que podamos
traducir todo Internet gratis. -
15:34 - 15:36No hemos lanzado Duolingo.
-
15:36 - 15:38(Aplausos)
-
15:46 - 15:49No hemos lanzado Duolingo
pero lo vamos a hacer como en 30 días. -
15:49 - 15:52Si van a Duolingo.com los vamos a dejar
-
15:53 - 15:57entrar al beta privado
en alrededor de 30 días. -
15:57 - 15:59Ayúdennos.
-
15:59 - 16:00Gracias.
-
16:00 - 16:04(Aplausos)
- Title:
- Utilizando el poder de millones de mentes humanas | Luis von Ahn | TEDxRíodelaPlata
- Speaker:
- Luis von Ahn
- Video Language:
- Spanish
- Duration:
- 16:14
Show all