0:00:02.366,0:00:06.104 Les mostraré algo. 0:00:06.104,0:00:10.260 (Video) Niña: Eso es un gato [br]sentado en una cama. 0:00:10.260,0:00:14.300 El niño está acariciando al elefante. 0:00:14.300,0:00:18.654 Esas son personas que van en un avión. 0:00:18.654,0:00:21.464 Ese es un avión grande. 0:00:21.464,0:00:23.670 Fei-Fei Li: Así describe una niña 0:00:23.670,0:00:27.349 de 3 años lo que ve[br]en una serie de fotos. 0:00:27.349,0:00:30.194 Tal vez le falta mucho [br]por aprender sobre este mundo, 0:00:30.194,0:00:34.743 pero ya es experta[br]en algo importante: 0:00:34.743,0:00:37.589 entender lo que ve. 0:00:38.229,0:00:42.455 Tecnológicamente, nuestra sociedad[br]está más avanzada que nunca. 0:00:42.455,0:00:46.084 Enviamos personas a la luna,[br]nuestros teléfonos nos hablan 0:00:46.084,0:00:51.030 o personalizan radios para reproducir[br]solo la música que nos gusta. 0:00:51.030,0:00:55.085 Sin embargo, nuestras máquinas[br]y computadoras más avanzadas 0:00:55.085,0:00:57.988 aún tienen problemas en ese aspecto. 0:00:57.988,0:01:01.447 Hoy estoy aquí[br]para darles un reporte 0:01:01.447,0:01:05.494 de nuestros últimos avances[br]en visión artificial, 0:01:05.494,0:01:09.655 una de las tecnologías potencialmente[br]más revolucionarias 0:01:09.655,0:01:12.861 en la ciencia de la computación. 0:01:12.861,0:01:17.412 Es cierto, hemos inventado autos[br]que conducen solos, 0:01:17.412,0:01:21.265 pero sin una visión inteligente,[br]realmente no pueden distinguir 0:01:21.265,0:01:25.235 entre una bolsa arrugada de papel[br]en el camino, que puede uno pisar, 0:01:25.235,0:01:28.575 y una roca del mismo tamaño,[br]que debemos evitar. 0:01:29.415,0:01:32.805 Hemos creado fabulosas cámaras[br]de muchos megapíxeles, 0:01:32.805,0:01:35.940 pero aún no podemos devolverle[br]la vista a un ciego. 0:01:36.420,0:01:39.665 Los drones pueden volar sobre [br]grandes superficies de tierra, 0:01:39.665,0:01:41.100 pero no tienen tecnología 0:01:41.100,0:01:42.155 de visión suficiente 0:01:42.155,0:01:45.320 para ayudarnos a monitorear los [br]cambios en los bosques tropicales. 0:01:45.320,0:01:48.270 Hay cámaras de seguridad en todas partes, 0:01:48.270,0:01:53.337 pero no nos alertan cuando un niño[br]se está ahogando en una piscina. 0:01:54.167,0:01:59.762 Las fotos y los videos se están volviendo[br]parte integral de la vida global. 0:01:59.762,0:02:03.849 Se generan a un ritmo mucho mayor[br]de lo que cualquier humano, 0:02:03.849,0:02:06.632 o equipo de humanos, podría ver, 0:02:06.632,0:02:10.553 y Uds. y yo contribuimos [br]a eso en este TED. 0:02:10.553,0:02:15.785 Aun así, nuestro software más avanzado[br]tiene problemas para entender 0:02:15.785,0:02:19.661 y gestionar este enorme contenido. 0:02:19.661,0:02:24.933 En otras palabras, colectivamente[br]como una sociedad, 0:02:24.933,0:02:26.679 somos muy ciegos, 0:02:26.679,0:02:30.066 porque nuestras máquinas[br]más inteligentes aún son ciegas. 0:02:31.526,0:02:34.452 Se preguntarán:[br]"¿Por qué es tan difícil?" 0:02:34.452,0:02:37.145 Las cámaras pueden tomar fotos como esta 0:02:37.145,0:02:41.139 convirtiendo luz en matrices [br]numéricas bidimensionales 0:02:41.139,0:02:42.789 conocidas como pixeles, 0:02:42.789,0:02:45.040 pero estos son solo números vacíos. 0:02:45.040,0:02:48.151 En sí mismos no tienen significado. 0:02:48.151,0:02:52.494 Al igual que oír no es[br]lo mismo que escuchar, 0:02:52.494,0:02:56.534 tomar fotografías [br]no es lo mismo que ver; 0:02:56.534,0:03:00.363 y solo viendo podemos realmente entender. 0:03:01.293,0:03:07.470 De hecho, le tomó a la Madre Naturaleza[br]540 millones de años de arduo trabajo 0:03:07.470,0:03:09.443 lograr esta tarea, 0:03:09.443,0:03:11.324 y mucho de ese esfuerzo 0:03:11.324,0:03:16.595 consistió en desarrollar el sistema[br]de procesamiento visual en el cerebro, 0:03:16.595,0:03:19.242 no los ojos en sí. 0:03:19.242,0:03:21.989 La visión empieza en los ojos, 0:03:21.989,0:03:25.507 pero, en realidad, [br]ocurre en nuestro cerebro. 0:03:26.287,0:03:31.347 Durante 15 años, empezando[br]desde mi doctorado en Caltech 0:03:31.347,0:03:34.273 y luego al frente del laboratorio[br]Stanford Vision Lab, 0:03:34.273,0:03:38.669 he trabajado con mis mentores,[br]colaboradores y estudiantes 0:03:38.669,0:03:41.558 para enseñar a las computadoras a ver. 0:03:42.438,0:03:44.388 Nuestro campo de investigación se llama 0:03:44.388,0:03:46.878 "visión artificial [br]y aprendizaje automático". 0:03:46.878,0:03:49.830 Es parte del campo de [br]la inteligencia artificial. 0:03:51.000,0:03:56.493 Queremos enseñar a las máquinas[br]a ver tal como nosotros lo hacemos: 0:03:56.493,0:04:01.880 nombrar objetos, identificar personas,[br]inferir la geometría 3D de las cosas, 0:04:01.880,0:04:07.568 entender relaciones, emociones,[br]acciones e intenciones. 0:04:07.568,0:04:13.721 Nosotros tejemos historias completas[br]de la gente, los lugares y las cosas 0:04:13.721,0:04:15.885 simplemente con mirarlas. 0:04:16.954,0:04:22.538 El primer paso hacia esta meta es[br]enseñar a una computadora a ver objetos, 0:04:22.538,0:04:25.906 la unidad básica del mundo visual. 0:04:25.906,0:04:30.340 En términos más simples,[br]imaginen este proceso 0:04:30.340,0:04:33.335 mostrando a las computadoras[br]algunas imágenes de entrenamiento 0:04:33.335,0:04:36.656 de un objeto en particular,[br]digamos gatos, 0:04:36.656,0:04:41.393 y diseñar un modelo que [br]aprenda de estas imágenes. 0:04:41.393,0:04:43.437 ¿Qué tan difícil puede ser esto? 0:04:43.437,0:04:47.489 A fin de cuentas, un gato es solo [br]un conjunto de formas y colores, 0:04:47.489,0:04:51.575 y eso fue lo que hacíamos en los inicios[br]de la modelización de objetos. 0:04:51.575,0:04:53.606 Decíamos al algoritmo[br]de la computadora 0:04:53.606,0:04:55.617 en un lenguaje matemático 0:04:55.617,0:04:58.540 que un gato tiene cara redonda,[br]cuerpo regordete, 0:04:58.540,0:05:00.839 dos orejas puntiagudas[br]y cola larga, 0:05:00.839,0:05:02.249 y así quedaba bien. 0:05:02.859,0:05:04.972 Pero ¿qué me dicen de este gato? 0:05:04.972,0:05:06.063 (Risas) 0:05:06.063,0:05:07.689 Está todo retorcido. 0:05:07.689,0:05:12.408 Se debe agregar otra figura y otra [br]perspectiva al modelo del objeto. 0:05:12.408,0:05:14.123 ¿Y si los gatos están escondidos? 0:05:15.143,0:05:17.362 ¿Qué tal estos gatos tontos? 0:05:19.112,0:05:21.529 Ahora entienden mi idea. 0:05:21.529,0:05:24.896 Incluso algo tan simple[br]como una mascota 0:05:24.896,0:05:29.400 puede tener un número infinito de [br]variaciones en el modelo del objeto, 0:05:29.400,0:05:31.633 y eso es solo un objeto. 0:05:32.573,0:05:35.065 Así que hace unos 8 años, 0:05:35.065,0:05:40.095 una observación simple y profunda[br]cambió mi perspectiva. 0:05:41.425,0:05:44.110 Nadie le dice al niño cómo ver, 0:05:44.110,0:05:46.371 menos aún en los primeros años. 0:05:46.371,0:05:51.371 Ellos aprenden a través de ejemplos[br]y experiencias del mundo real. 0:05:51.371,0:05:54.111 Si consideramos los ojos de un niño 0:05:54.111,0:05:56.665 como un par de cámaras biológicas, 0:05:56.665,0:06:00.845 toman una foto cada 200 milisegundos, 0:06:00.845,0:06:03.979 el tiempo promedio en que el ojo[br]hace un movimiento. 0:06:03.979,0:06:09.529 Entonces, a los 3 años un niño ha visto[br]cientos de millones de fotografías 0:06:09.529,0:06:11.363 del mundo real. 0:06:11.363,0:06:13.643 Esos son muchos ejemplares[br]de entrenamiento. 0:06:14.383,0:06:20.372 Así que en lugar de enfocarnos[br]solo en mejorar los algoritmos, 0:06:20.372,0:06:25.644 mi intención fue dotar a los algoritmos[br]con los datos de entrenamiento 0:06:25.644,0:06:28.963 que un niño adquiere con la experiencia 0:06:28.963,0:06:32.841 tanto en cantidad como en calidad. 0:06:32.841,0:06:34.699 Al conocer esto 0:06:34.699,0:06:37.670 supimos que necesitábamos recolectar 0:06:37.670,0:06:42.129 muchas más imágenes que nunca, 0:06:42.129,0:06:44.706 tal vez miles de veces más; 0:06:44.706,0:06:48.817 y junto con el profesor Kai Li[br]en la Universidad de Princeton, 0:06:48.817,0:06:53.569 lanzamos el proyecto ImageNet en 2007. 0:06:53.569,0:06:57.407 Por suerte, no tuvimos que ponernos[br]una cámara en la cabeza 0:06:57.407,0:06:59.171 y esperar muchos años. 0:06:59.171,0:07:00.634 Entramos a Internet, 0:07:00.634,0:07:05.070 el banco de imágenes más grande[br]creado por la humanidad. 0:07:05.070,0:07:08.111 Descargamos casi [br]1000 millones de imágenes 0:07:08.111,0:07:13.991 y usamos tecnología de crowdsourcing[br]como la plataforma Amazon Mechanical Turk 0:07:13.991,0:07:16.330 para etiquetar estas imágenes. 0:07:16.330,0:07:21.230 En su mejor momento, ImageNet fue[br]uno de los empleadores más importantes 0:07:21.230,0:07:24.226 de trabajadores en [br]Amazon Mechanical Turk: 0:07:24.226,0:07:28.080 Casi 50 000 trabajadores 0:07:28.080,0:07:32.120 de 167 países del mundo 0:07:32.120,0:07:36.067 nos ayudaron a limpiar,[br]separar y etiquetar 0:07:36.067,0:07:39.642 casi 1000 millones [br]de imágenes candidatas. 0:07:40.612,0:07:43.265 Se necesitó todo ese esfuerzo 0:07:43.265,0:07:47.165 para capturar apenas una fracción[br]de todas las imágenes 0:07:47.165,0:07:51.336 que un niño asimila en sus [br]primeros años de desarrollo. 0:07:52.148,0:07:56.050 Viendo en retrospectiva, [br]esta idea de usar muchos datos 0:07:56.050,0:08:00.600 para entrenar algoritmos[br]puede parecer obvia ahora. 0:08:00.600,0:08:04.710 Sin embargo, en 2007[br]no era tan evidente. 0:08:04.710,0:08:08.588 Estuvimos solos en este viaje[br]por un buen rato. 0:08:08.588,0:08:13.591 Algunos colegas me sugerían[br]hacer algo más útil para mi cátedra, 0:08:13.591,0:08:17.933 y con frecuencia teníamos problemas[br]para conseguir financiamiento. 0:08:17.933,0:08:20.418 Incluso llegué a decir[br]a mis alumnos, como broma, 0:08:20.418,0:08:24.481 que tendría que reabrir mi tintorería [br]para financiar ImageNet. 0:08:24.481,0:08:29.242 Después de todo, así fue como[br]financié mis años de universidad. 0:08:29.242,0:08:31.098 Seguimos adelante. 0:08:31.098,0:08:34.813 En 2009, el proyecto ImageNet juntó 0:08:34.813,0:08:38.855 una base de datos con [br]15 millones de imágenes 0:08:38.855,0:08:43.659 de 22 000 tipos de objetos 0:08:43.659,0:08:46.980 organizados por palabra[br]en inglés de uso cotidiano. 0:08:46.980,0:08:49.906 En cantidad y calidad, 0:08:49.906,0:08:52.878 tuvieron una escala sin precedentes. 0:08:52.878,0:08:56.339 Por ejemplo, en el caso de los gatos, 0:08:56.339,0:08:59.148 tenemos más de 62 000 gatos 0:08:59.148,0:09:03.258 con todo tipo de apariencias y poses 0:09:03.258,0:09:08.481 y todo tipo de gatos[br]domésticos y salvajes. 0:09:08.481,0:09:11.825 Estábamos entusiasmados[br]por haber creado ImageNet 0:09:11.825,0:09:15.563 y queríamos que todo el mundo de [br]la investigación se beneficiara, 0:09:15.563,0:09:19.604 así que, al estilo TED,[br]abrimos toda la base de datos 0:09:19.604,0:09:23.196 a la comunidad mundial de [br]investigadores de forma gratuita. 0:09:24.636,0:09:28.636 (Aplausos) 0:09:29.416,0:09:33.954 Ahora que tenemos los datos para nutrir[br]el cerebro de nuestra computadora, 0:09:33.954,0:09:37.691 estamos listos para volver[br]a los algoritmos. 0:09:37.691,0:09:42.869 La abundancia de información[br]aportada por ImageNet 0:09:42.869,0:09:47.675 fue el complemento perfecto para [br]un tipo particular de algoritmos 0:09:47.675,0:09:50.090 de aprendizaje automático llamado [br]red neuronal convolucional, 0:09:50.090,0:09:55.338 ideado por Kunihiko Fukushima,[br]Geoff Hinton y Yann LeCun 0:09:55.338,0:09:58.983 en los años 70 y 80. 0:09:58.983,0:10:04.602 Como el cerebro que tiene miles de [br]millones de neuronas muy bien conectadas, 0:10:04.602,0:10:08.456 la unidad operativa fundamental[br]en una red neuronal 0:10:08.456,0:10:10.871 es un nodo con forma de neurona. 0:10:10.871,0:10:13.425 Toma datos de otros nodos 0:10:13.425,0:10:16.143 los procesa y los manda[br]a otros nodos. 0:10:16.143,0:10:20.856 Además, estos cientos de miles[br]o incluso millones de nodos 0:10:20.856,0:10:24.083 se organizan en capas jerárquicas, 0:10:24.083,0:10:26.637 algo parecido al cerebro. 0:10:26.637,0:10:29.291 En una red neuronal típica [br]que usamos para entrenar 0:10:29.291,0:10:31.945 nuestro modelo de [br]reconocimiento de objetos 0:10:31.945,0:10:34.601 hay 24 millones de nodos, 0:10:34.601,0:10:37.898 140 millones de parámetros 0:10:37.898,0:10:40.661 y 15 000 millones de conexiones. 0:10:40.661,0:10:43.076 Es un modelo enorme. 0:10:43.076,0:10:46.977 Alimentado por la información [br]masiva de ImageNet 0:10:46.977,0:10:52.410 y las CPUs y GPUs modernas que [br]entrenan este inmenso modelo, 0:10:52.410,0:10:54.779 la red neuronal convolucional 0:10:54.779,0:10:58.215 tuvo un éxito inesperado. 0:10:58.215,0:11:00.723 Se volvió la ingeniería ganadora 0:11:00.723,0:11:06.063 para generar nuevos y emocionantes[br]resultados en reconocimiento de objetos. 0:11:06.063,0:11:08.873 Esta es una computadora que nos dice 0:11:08.873,0:11:11.173 que la foto tiene un gato 0:11:11.173,0:11:13.076 y dónde está el gato. 0:11:13.076,0:11:15.188 Desde luego hay más cosas[br]aparte de los gatos 0:11:15.188,0:11:17.626 así que hay un algoritmo[br]informático que nos dice 0:11:17.626,0:11:20.900 que hay un niño y un oso[br]de peluche en la foto; 0:11:20.900,0:11:25.266 un perro, una persona[br]y un papalote al fondo; 0:11:25.266,0:11:28.401 o una foto de cosas muy ocupadas 0:11:28.401,0:11:33.045 como un hombre, una patineta,[br]un barandal, una lámpara etc. 0:11:33.045,0:11:38.338 A veces, cuando la computadora[br]no está segura de lo que ve, 0:11:39.498,0:11:41.774 le hemos enseñado 0:11:41.774,0:11:45.652 a darnos una respuesta segura[br]en lugar de comprometer su respuesta, 0:11:45.652,0:11:48.463 tal como lo haríamos nosotros. 0:11:48.463,0:11:53.129 Pero otras veces nuestro algoritmo [br]informático es muy acertado al decirnos 0:11:53.129,0:11:55.382 qué son los objetos exactamente, 0:11:55.382,0:11:58.818 como la marca, modelo [br]y año de los coches. 0:11:58.818,0:12:04.204 Aplicamos este algoritmo a millones[br]de imágenes de Google Street View 0:12:04.204,0:12:07.339 de cientos de ciudades[br]de Estados Unidos 0:12:07.339,0:12:10.265 y hemos aprendido algo muy interesante: 0:12:10.265,0:12:13.585 primero, confirmó nuestra idea 0:12:13.585,0:12:16.875 de que los precios de los autos[br]se relacionan bien 0:12:16.875,0:12:19.220 con los ingresos del hogar. 0:12:19.220,0:12:23.747 Pero sorprendentemente, los precios[br]de los autos se relacionan también 0:12:23.747,0:12:26.047 con las tasas de criminalidad[br]en la ciudades 0:12:27.007,0:12:30.970 o los patrones de votación[br]por código postal. 0:12:32.060,0:12:34.266 Un minuto. ¿Eso es todo? 0:12:34.266,0:12:39.419 ¿Acaso la computadora ya sobrepasó[br]las capacidades humanas? 0:12:39.419,0:12:41.557 No tan rápido. 0:12:41.557,0:12:46.480 Hasta ahora solo hemos enseñado[br]a la computadora a ver objetos. 0:12:46.480,0:12:51.124 Es como un niño pequeño[br]que aprende a decir palabras. 0:12:51.124,0:12:53.794 Es un logro increíble, 0:12:53.794,0:12:56.254 pero es apenas el primer paso. 0:12:56.254,0:13:00.016 Pronto daremos otro paso 0:13:00.016,0:13:03.477 y los niños empiezan[br]a comunicarse con frases. 0:13:03.477,0:13:07.701 Así que en lugar de decir[br]que hay un gato en la foto, 0:13:07.701,0:13:12.903 la niña ya dice que el gato[br]está sobre la cama. 0:13:12.903,0:13:18.498 Así que para enseñar a una computadora[br]a ver una foto y generar frases 0:13:18.498,0:13:22.446 la conjunción de mucha información[br]y el algoritmo de aprendizaje automático 0:13:22.446,0:13:24.721 debe dar otro paso. 0:13:24.721,0:13:28.877 Ahora, la computadora tiene [br]que aprender de fotografías 0:13:28.877,0:13:31.733 así como de frases en lenguaje natural 0:13:31.733,0:13:35.055 generado por humanos. 0:13:35.055,0:13:38.908 De la forma en que el cerebro [br]integra visión y lenguaje, 0:13:38.908,0:13:44.109 desarrollamos un modelo que [br]conecta partes de cosas visuales 0:13:44.109,0:13:46.013 como fragmentos visuales 0:13:46.013,0:13:50.216 con palabras y frases en oraciones. 0:13:50.216,0:13:52.979 Hace unos 4 meses 0:13:52.979,0:13:55.626 finalmente juntamos todo esto 0:13:55.626,0:13:59.410 y produjimos uno de los primeros[br]modelos de visión artificial 0:13:59.410,0:14:03.404 que puede generar frases[br]como las de un humano 0:14:03.404,0:14:06.910 cuando ve una foto por primera vez. 0:14:06.910,0:14:11.554 Ahora estoy lista para mostrarles[br]lo que dice la computadora 0:14:11.554,0:14:13.529 cuando ve la fotografía 0:14:13.529,0:14:17.359 que la niña vio al inicio de esta charla. 0:14:19.519,0:14:22.863 (Video) Computadora:[br]Un hombre está junto a un elefante. 0:14:24.393,0:14:28.027 Un avión grande está encima[br]de una pista de aeropuerto. 0:14:29.057,0:14:33.269 FFL: Desde luego, seguimos[br]trabajando para mejorar los algoritmos 0:14:33.269,0:14:35.865 y aún tiene mucho que aprender. 0:14:35.865,0:14:38.156 (Aplausos) 0:14:39.556,0:14:42.877 Y la computadora aún comete errores. 0:14:42.877,0:14:46.268 (Video) Computadora: Un gato [br]recostado en la cama en una sábana. 0:14:46.268,0:14:48.821 FFL: Y cuando ha visto[br]demasiados gatos, 0:14:48.821,0:14:51.747 cree que todo lo que ve[br]parece un gato. 0:14:53.317,0:14:56.181 (Video) Computadora: Un niño [br]tiene un bate de béisbol. 0:14:56.181,0:14:57.946 (Risas) 0:14:57.946,0:15:00.578 FFL: O si nunca ha visto[br]un cepillo de dientes, 0:15:00.578,0:15:03.500 lo confunde con un bate de béisbol. 0:15:03.500,0:15:06.743 (Video) Computadora: Un hombre [br]montando un caballo junto a un edificio. 0:15:06.743,0:15:08.766 (Risas) 0:15:08.766,0:15:12.318 FFL: No le hemos enseñado[br]arte elemental a las computadoras. 0:15:13.768,0:15:16.652 (Video) Computadora: Una cebra[br]en un campo de hierba. 0:15:16.652,0:15:20.019 FFL: Y no ha aprendido a apreciar[br]la belleza deslumbrante 0:15:20.019,0:15:22.457 de la naturaleza,[br]como lo hacemos nosotros. 0:15:22.457,0:15:25.289 Así que ha sido un largo camino. 0:15:25.289,0:15:29.515 Pasar de los 0 a los 3 años fue difícil. 0:15:29.515,0:15:35.111 El verdadero reto es llegar [br]a los 13 y mucho más todavía. 0:15:35.111,0:15:39.476 Recordemos nuevamente esta foto[br]del niño y el pastel. 0:15:39.476,0:15:43.540 Hasta ahora, le hemos enseñado[br]a la computadora a ver objetos 0:15:43.540,0:15:47.998 o incluso darnos una pequeña [br]historia cuando ve la foto. 0:15:47.998,0:15:51.574 (Video) Computadora: Una persona sentada[br]a la mesa con un pastel. 0:15:51.574,0:15:54.204 FFL: Pero hay mucho más[br]en esta fotografía 0:15:54.204,0:15:56.474 que simplemente una persona y un pastel. 0:15:56.474,0:16:00.941 Lo que la computadora no ve es que [br]este es un pastel especial italiano 0:16:00.941,0:16:04.158 exclusivo de Pascua. 0:16:04.158,0:16:07.363 El niño viste su camiseta favorita, 0:16:07.363,0:16:11.333 que le regaló su papá[br]tras un viaje a Sídney, 0:16:11.333,0:16:15.141 y nosotros podemos decir[br]qué tan feliz está 0:16:15.141,0:16:18.344 y qué pasa por su mente[br]en ese momento. 0:16:19.214,0:16:22.339 Ese es mi hijo Leo. 0:16:22.339,0:16:24.963 En mi búsqueda de inteligencia visual, 0:16:24.963,0:16:27.354 pienso constantemente en él 0:16:27.354,0:16:30.257 y en el futuro en que va a vivir. 0:16:30.257,0:16:32.278 Cuando las máquinas puedan ver, 0:16:32.278,0:16:36.990 los médicos y enfermeras tendrán[br]un par extra de ojos incansables 0:16:36.990,0:16:41.082 para ayudarlos a diagnosticar[br]y cuidar de los pacientes. 0:16:41.082,0:16:45.465 Los autos andarán de forma[br]inteligente y segura en los caminos. 0:16:45.465,0:16:48.159 Robots, y no solo humanos, 0:16:48.159,0:16:53.008 nos ayudarán a desafiar zonas de desastre[br]para salvar heridos y atrapados. 0:16:53.798,0:16:57.594 Descubriremos nuevas especies,[br]mejores materiales, 0:16:57.594,0:17:02.103 y exploraremos fronteras nunca vistas[br]con ayuda de las máquinas. 0:17:03.113,0:17:07.280 Poco a poco, damos a las máquinas[br]el don de la vista. 0:17:07.280,0:17:10.078 Primero les enseñamos a ver. 0:17:10.078,0:17:12.840 Luego ellas nos ayudarán a ver mejor. 0:17:12.840,0:17:17.006 Por primera vez, los ojos humanos[br]no serán los únicos 0:17:17.006,0:17:19.940 que exploren nuestro mundo. 0:17:19.940,0:17:23.400 No solo usaremos máquinas[br]por su inteligencia, 0:17:23.400,0:17:29.579 también colaboraremos con ellas de [br]formas que ni siquiera imaginamos. 0:17:29.579,0:17:31.740 Esta es mi misión: 0:17:31.740,0:17:34.452 dar a las computadoras [br]inteligencia visual 0:17:34.452,0:17:39.583 y crear un mejor futuro[br]para Leo y para el mundo. 0:17:39.583,0:17:41.394 Gracias. 0:17:41.394,0:17:45.192 (Aplausos)