Return to Video

Cómo las computadoras aprenden a ser creativas

  • 0:00 - 0:04
    Coordino un equipo de Google que
    trabaja en inteligencia artificial;
  • 0:04 - 0:08
    es decir, en la disciplina de ingeniería
    para fabricar computadoras y dispositivos
  • 0:08 - 0:11
    capaces de hacer algunas cosas
    que hacen los cerebros.
  • 0:11 - 0:15
    Y esto hace que nos interese
    mucho el cerebro real,
  • 0:15 - 0:16
    la neurociencia
  • 0:16 - 0:20
    y, especialmente, nos interesan
    las cosas que hace nuestro cerebro
  • 0:20 - 0:24
    que todavía son muy superiores
    al rendimiento de las computadoras.
  • 0:25 - 0:29
    Históricamente, una de esas áreas
    ha sido la percepción,
  • 0:29 - 0:32
    el proceso por el cual
    las cosas que hay en el mundo,
  • 0:32 - 0:34
    sonidos e imágenes,
  • 0:34 - 0:36
    pueden convertirse
    en conceptos en la mente.
  • 0:36 - 0:39
    Esto es esencial
    para nuestro propio cerebro,
  • 0:39 - 0:41
    y también es muy útil en una máquina.
  • 0:42 - 0:45
    Nuestro equipo hace algoritmos
    de percepción computacional
  • 0:45 - 0:49
    que permiten encontrar imágenes en Google
  • 0:49 - 0:51
    en función de lo que hay en ellas.
  • 0:52 - 0:55
    La otra cara de la percepción
    es la creatividad:
  • 0:55 - 0:58
    convertir un concepto
    en algo que hay en el mundo.
  • 0:58 - 1:02
    Así que en el último año, nuestro
    trabajo en percepción computacional
  • 1:02 - 1:07
    ha conectado de forma inesperada
    con el mundo de la creatividad
  • 1:07 - 1:08
    y el arte computacionales.
  • 1:09 - 1:12
    Creo que Miguel Ángel
    tenía una visión aguda
  • 1:12 - 1:16
    en esta doble relación
    entre la percepción y la creatividad.
  • 1:16 - 1:18
    Esta es una de sus célebres citas:
  • 1:18 - 1:21
    "Cada bloque de piedra tiene
    una estatua en su interior,
  • 1:22 - 1:25
    y el trabajo del escultor
    es descubrirla".
  • 1:26 - 1:29
    Pienso que Miguel Ángel quería decir
  • 1:29 - 1:32
    que creamos al percibir,
  • 1:32 - 1:36
    y que la propia percepción
    es un acto de imaginación
  • 1:36 - 1:38
    y es la materia de la creatividad.
  • 1:39 - 1:43
    El órgano que crea todo el pensamiento,
    la percepción y la imaginación,
  • 1:43 - 1:44
    por supuesto, es el cerebro.
  • 1:45 - 1:48
    Y me gustaría empezar
    con un poquito de historia
  • 1:48 - 1:50
    sobre lo que sabemos del cerebro.
  • 1:50 - 1:53
    Porque a diferencia de, por ejemplo,
    el corazón o los intestinos,
  • 1:53 - 1:56
    realmente no se puede decir mucho
    de un cerebro con solo mirarlo,
  • 1:56 - 1:58
    al menos a simple vista.
  • 1:58 - 2:00
    Los primeros anatomistas
    que exploraron cerebros dieron
  • 2:00 - 2:04
    a las estructuras superficiales de esta
    cosa todo tipo de nombres de fantasía,
  • 2:04 - 2:07
    como hipocampo,
    que significa "pequeño camarón".
  • 2:07 - 2:10
    Pero, por supuesto,
    eso no nos dice mucho
  • 2:10 - 2:12
    de lo que realmente
    sucede en el interior.
  • 2:13 - 2:16
    La primera persona que, creo,
    desarrolló una visión
  • 2:16 - 2:18
    de lo que ocurría en el cerebro
  • 2:18 - 2:22
    fue el gran neuroanatomista español,
    Santiago Ramón y Cajal,
  • 2:22 - 2:24
    en el siglo XIX,
  • 2:24 - 2:28
    que usó la microscopía
    y tinciones especiales
  • 2:28 - 2:32
    para poder marcar selectivamente
    en un contraste muy alto
  • 2:32 - 2:34
    las células individuales en el cerebro,
  • 2:34 - 2:37
    para empezar a entender sus morfologías.
  • 2:38 - 2:41
    Y estos son los tipos de dibujos
    que hizo de las neuronas
  • 2:41 - 2:42
    en el siglo XIX.
  • 2:42 - 2:44
    Esto es de un cerebro de un pájaro.
  • 2:44 - 2:47
    Y ya ven esta increíble variedad
    de diferentes tipos de células,
  • 2:47 - 2:51
    incluso la propia teoría celular
    era bastante nueva en este momento.
  • 2:51 - 2:52
    Y estas estructuras,
  • 2:52 - 2:54
    estas células que tienen
    estas arborizaciones,
  • 2:54 - 2:57
    estas ramas que pueden alcanzar
    muy largas distancias,
  • 2:57 - 2:59
    esto era muy novedoso en esa época.
  • 2:59 - 3:02
    Nos recuerdan, por supuesto,
    a los cables.
  • 3:02 - 3:05
    Eso podría haber sido obvio
    para algunos en el siglo XIX;
  • 3:05 - 3:10
    las revoluciones del cableado y de
    la electricidad se estaban iniciando.
  • 3:10 - 3:11
    Pero en muchos sentidos,
  • 3:11 - 3:15
    los dibujos de microanatomía
    de Ramón y Cajal, como éste,
  • 3:15 - 3:17
    todavía son,
    en cierto modo, insuperables.
  • 3:17 - 3:19
    Un siglo más tarde todavía
  • 3:19 - 3:22
    tratamos de terminar
    el trabajo que empezó Ramón y Cajal.
  • 3:22 - 3:25
    Estos son los datos brutos
    de nuestros colaboradores
  • 3:25 - 3:27
    del Instituto Max Planck
    de Neurociencia.
  • 3:27 - 3:29
    Nuestros colaboradores
  • 3:29 - 3:34
    han tomado imágenes de
    trozos de tejido cerebral.
  • 3:34 - 3:38
    La muestra completa aquí
    es de 1 mm cúbico de tamaño,
  • 3:38 - 3:40
    y les estoy mostrando
    un trozo muy pequeño.
  • 3:40 - 3:43
    Esa barra de la izquierda es
    de aproximadamente una micra.
  • 3:43 - 3:45
    Las estructuras visibles
    son las mitocondrias
  • 3:45 - 3:47
    del tamaño de las bacterias.
  • 3:47 - 3:49
    Y estos son cortes consecutivos
  • 3:49 - 3:52
    de este diminuto bloque de tejido.
  • 3:52 - 3:55
    solo a efectos de comparación,
  • 3:55 - 3:58
    el diámetro de una hebra promedio
    de pelo es de unas 100 micras.
  • 3:58 - 4:00
    Así que vemos algo mucho,
    mucho más pequeño
  • 4:00 - 4:02
    que una sola hebra de cabello.
  • 4:02 - 4:06
    Y a partir de este tipo de rebanadas
    de microscopía electrónica de serie,
  • 4:06 - 4:11
    se pueden hacer reconstrucciones en 3D
    de las neuronas con este aspecto.
  • 4:11 - 4:14
    Son casi del mismo estilo
    que las de Ramón y Cajal.
  • 4:14 - 4:16
    Solo se iluminaron unas pocas neuronas,
  • 4:16 - 4:19
    porque, de lo contrario,
    no se podría ver nada aquí.
  • 4:19 - 4:20
    Estaría tan lleno,
  • 4:20 - 4:21
    tan pleno de estructuras,
  • 4:21 - 4:24
    de cableado de todas las neuronas
    conectadas una a otra.
  • 4:25 - 4:28
    Así Ramón y Cajal se adelantó
    un poco a su tiempo,
  • 4:28 - 4:30
    y al progreso
    en la comprensión del cerebro
  • 4:30 - 4:33
    avanzando lentamente
    a lo largo de las siguientes décadas.
  • 4:33 - 4:36
    Pero sabíamos que las neuronas
    usan electricidad
  • 4:36 - 4:40
    y por la Segunda Guerra Mundial,
    la tecnología avanzó lo suficiente
  • 4:40 - 4:43
    como para empezar a hacer experimentos
    eléctricos reales con neuronas vivas
  • 4:43 - 4:45
    para comprender mejor cómo funcionaban.
  • 4:45 - 4:49
    En ese mismo momento
    se desarrollaban las computadoras
  • 4:49 - 4:52
    con la idea de modelar el cerebro,
  • 4:52 - 4:55
    de "máquinas inteligentes",
    como decía Alan Turing,
  • 4:55 - 4:57
    uno de los padres de la informática.
  • 4:58 - 5:03
    Warren McCulloch y Walter Pitts
    miraron el dibujo de Ramón y Cajal
  • 5:03 - 5:04
    de la corteza visual,
  • 5:04 - 5:05
    que muestro aquí.
  • 5:06 - 5:10
    Esta es la corteza que procesa
    las imágenes que provienen del ojo.
  • 5:10 - 5:14
    Y para ellos, esto parecía
    un diagrama de circuito.
  • 5:14 - 5:18
    Y hay gran cantidad de detalles en el
    diagrama de circuito de McCulloch y Pitts
  • 5:18 - 5:20
    que no están del todo bien.
  • 5:20 - 5:21
    Pero esta idea básica de que
  • 5:21 - 5:25
    la corteza visual funciona como
    una serie de elementos computacionales
  • 5:25 - 5:28
    que pasan una información de uno
    al siguiente en cascada,
  • 5:28 - 5:29
    es esencialmente correcta.
  • 5:29 - 5:32
    Hablemos por un momento
  • 5:32 - 5:36
    de lo que tendría que hacer un modelo
    para procesar la información visual.
  • 5:36 - 5:39
    La tarea básica de la percepción
  • 5:39 - 5:43
    es tomar una imagen como esta y decir:
  • 5:43 - 5:44
    "Eso es un pájaro"
  • 5:44 - 5:47
    que es algo muy simple
    de ver con nuestro cerebro.
  • 5:47 - 5:51
    Pero todos Uds. deben entender
    que para una computadora
  • 5:51 - 5:54
    esto era prácticamente imposible
    hace pocos años.
  • 5:54 - 5:56
    Con el paradigma
    de la computación clásica
  • 5:56 - 5:58
    esta tarea no es fácil de hacer.
  • 5:59 - 6:02
    Entonces lo que pasa
    entre los píxeles,
  • 6:02 - 6:06
    entre la imagen del ave
    y la palabra "pájaro"
  • 6:06 - 6:09
    es esencialmente un conjunto
    de neuronas conectadas entre sí
  • 6:09 - 6:10
    en una red neuronal,
  • 6:10 - 6:11
    como la que diagramo aquí.
  • 6:11 - 6:15
    Esta red neuronal podría ser biológica,
    en nuestras cortezas visuales,
  • 6:15 - 6:17
    o, en la actualidad, podemos
  • 6:17 - 6:19
    modelar este tipo de redes neuronales
    en la computadora.
  • 6:20 - 6:22
    Y mostraré qué aspecto tienen.
  • 6:22 - 6:26
    Así que los píxeles se puede pensar
    como una primera capa de neuronas,
  • 6:26 - 6:28
    y así es, de hecho,
    como funciona el ojo,
  • 6:28 - 6:30
    eso son las neuronas de la retina.
  • 6:30 - 6:31
    Y después avanzan
  • 6:31 - 6:35
    de una capa a la otra,
    y luego a otra capa de neuronas,
  • 6:35 - 6:37
    todas conectadas
    por sinapsis de diferentes pesos.
  • 6:37 - 6:39
    El comportamiento de esta red
  • 6:39 - 6:42
    se caracteriza por las fortalezas
    de todas esas sinapsis.
  • 6:42 - 6:46
    Estas caracterizan las propiedades
    computacionales de esta red.
  • 6:46 - 6:47
    Y al final
  • 6:47 - 6:50
    una neurona o un pequeño grupo de neuronas
  • 6:50 - 6:51
    da la luz, diciendo, "pájaro".
  • 6:52 - 6:55
    Ahora voy a representar esas tres cosas:
  • 6:55 - 7:00
    los píxeles de entrada,
    las sinapsis en la red neuronal,
  • 7:00 - 7:01
    y el pájaro, la salida,
  • 7:01 - 7:04
    con tres variables: X, W e Y.
  • 7:05 - 7:07
    Hay tal vez un millón o más de X,
  • 7:07 - 7:09
    un millón de píxeles en la imagen.
  • 7:09 - 7:11
    Hay miles de millones o billones de W,
  • 7:11 - 7:15
    que representan los pesos de todas
    estas sinapsis en la red neuronal.
  • 7:15 - 7:16
    Y hay un número muy pequeño de Y,
  • 7:16 - 7:18
    de salidas que tiene esa red.
  • 7:18 - 7:20
    "Pájaro" son solo seis letras, ¿verdad?
  • 7:21 - 7:24
    Así que vamos a suponer
    que esto es solo una fórmula simple,
  • 7:24 - 7:27
    X "x" W = Y.
  • 7:27 - 7:29
    Pongo la multiplicación entre comillas
  • 7:29 - 7:31
    porque lo que realmente pasa allí,
    por supuesto,
  • 7:31 - 7:34
    es una serie muy complicada
    de operaciones matemáticas.
  • 7:35 - 7:36
    Esa es una ecuación.
  • 7:36 - 7:38
    Hay tres variables.
  • 7:38 - 7:41
    Y todos sabemos que
    si uno tiene una ecuación,
  • 7:41 - 7:45
    puede resolver una variable
    conociendo las otras dos.
  • 7:45 - 7:49
    Así que el problema de la inferencia,
  • 7:49 - 7:51
    es decir, averiguar que la imagen
    de un pájaro es un pájaro,
  • 7:51 - 7:53
    es este:
  • 7:53 - 7:56
    Y es la desconocida
    y W y X las conocidas.
  • 7:56 - 7:59
    Se conoce la red neuronal,
    y también los píxeles.
  • 7:59 - 8:02
    Como se puede ver, en realidad, es
    un problema relativamente sencillo.
  • 8:02 - 8:04
    Se multiplica dos veces tres y ya está.
  • 8:05 - 8:07
    Les voy a mostrar
    una red neuronal artificial
  • 8:07 - 8:10
    que hemos construido recientemente,
    haciendo exactamente eso.
  • 8:10 - 8:12
    Esto se ejecuta en tiempo real
    en un teléfono móvil,
  • 8:13 - 8:16
    y eso es, por supuesto,
    sorprendente en sí mismo,
  • 8:16 - 8:18
    que los teléfonos móviles puedan hacer
  • 8:18 - 8:21
    tantos millones y billones
    de operaciones por segundo.
  • 8:21 - 8:22
    Lo que ven es un teléfono
  • 8:22 - 8:26
    que analiza imágenes
    de un pájaro una tras otra.
  • 8:26 - 8:29
    Y, de hecho, no solo dice:
    "Sí, es un pájaro"
  • 8:29 - 8:32
    sino que identifica las especies
    de pájaros con una red de este tipo.
  • 8:33 - 8:35
    Así que en ese cuadro,
  • 8:35 - 8:38
    la X y la W son conocidas,
    y la Y es la desconocida.
  • 8:38 - 8:41
    Estoy pasando por alto
    la parte más difícil, por supuesto,
  • 8:41 - 8:45
    que es cómo demonios
    podemos averiguar la W,
  • 8:45 - 8:47
    cómo puede el cerebro hacerlo.
  • 8:47 - 8:50
    ¿Cómo podríamos llegar a aprender
    un modelo de este tipo?
  • 8:50 - 8:53
    Este proceso de aprendizaje
    de despejar W,
  • 8:53 - 8:55
    si lo hacemos con una simple ecuación
  • 8:55 - 8:57
    en la que pensamos en ellos como números,
  • 8:57 - 9:00
    sabemos exactamente
    cómo hacer eso: 6 = 2 x W,
  • 9:00 - 9:03
    así, se divide por dos y ya está.
  • 9:04 - 9:06
    El problema estriba en este operador.
  • 9:06 - 9:08
    Por lo tanto, la división,
  • 9:08 - 9:11
    hemos usado la división
    por ser la inversa de la multiplicación,
  • 9:11 - 9:13
    pero, como acabo de decir,
  • 9:13 - 9:15
    la multiplicación tiene
    algo de mentira aquí.
  • 9:15 - 9:18
    Esta es una operación muy complicada,
    nada lineal;
  • 9:18 - 9:20
    que no tiene inversa.
  • 9:20 - 9:23
    Así que tenemos que encontrar
    una manera de resolver la ecuación
  • 9:23 - 9:25
    sin un operador de división.
  • 9:25 - 9:28
    Y la manera de hacerlo
    es bastante sencilla.
  • 9:28 - 9:30
    Vamos a aplicar
    un pequeño truco de álgebra,
  • 9:30 - 9:33
    y a mover el 6 hacia
    el lado derecho de la ecuación.
  • 9:33 - 9:36
    Ahora, todavía usamos la multiplicación.
  • 9:36 - 9:39
    Y el cero... pensémoslo como un error.
  • 9:39 - 9:42
    Es decir, si hemos resuelto la W
    de la manera correcta,
  • 9:42 - 9:44
    luego el error será el cero.
  • 9:44 - 9:46
    Y si no lo hacemos del todo bien,
  • 9:46 - 9:47
    el error será mayor que cero.
  • 9:47 - 9:50
    Así que ahora solo podemos hacer
    conjeturas para minimizar el error,
  • 9:50 - 9:53
    y en eso las computadoras son muy buenas.
  • 9:53 - 9:55
    Así que ya hemos hecho
    una aproximación inicial:
  • 9:55 - 9:56
    ¿Y si W = 0?
  • 9:56 - 9:57
    Entonces el error es 6.
  • 9:57 - 9:59
    ¿Qué pasa si W = 1?
    El error es 4.
  • 9:59 - 10:02
    Y luego, la computadora puede correr
    una especie de Marco Polo,
  • 10:02 - 10:04
    y reducir el error cercano a cero.
  • 10:04 - 10:07
    A medida que lo hace, se logra
    aproximaciones sucesivas a W.
  • 10:07 - 10:11
    Por lo general, nunca llega allí,
    pero tras una docena de pasos,
  • 10:11 - 10:15
    estamos en W = 2.999,
    que es lo suficientemente aproximado.
  • 10:16 - 10:18
    Y este es el proceso de aprendizaje.
  • 10:18 - 10:21
    Así que recuerden que
  • 10:21 - 10:25
    hemos tomado muchas X e Y conocidas
  • 10:25 - 10:29
    para resolver la W por medio
    de un proceso iterativo.
  • 10:29 - 10:32
    De la misma manera como
    lo hacemos en nuestro propio aprendizaje.
  • 10:32 - 10:35
    Tenemos muchas, muchas imágenes de bebés
  • 10:35 - 10:37
    y nos dicen: "Esto es un pájaro,
    esto no es un pájaro".
  • 10:38 - 10:40
    Y con el tiempo, a través de iteración,
  • 10:40 - 10:43
    resolvemos W, lo resolvemos
    para esas conexiones neuronales.
  • 10:43 - 10:48
    Así que ahora ya tenemos despejada la X,
    y la W para resolver Y;
  • 10:48 - 10:49
    eso todos los días, percepción rápida.
  • 10:49 - 10:51
    Entendemos cómo podemos resolver W,
  • 10:51 - 10:53
    esto es aprendizaje,
    que es mucho más difícil,
  • 10:53 - 10:55
    porque tenemos que minimizar errores,
  • 10:55 - 10:57
    usando mucho ejemplos
    para el entrenamiento.
  • 10:57 - 11:00
    Y hace un año, Alex Mordvintsev,
    de nuestro equipo,
  • 11:00 - 11:04
    decidió experimentar
    qué sucede si intentamos resolver X,
  • 11:04 - 11:06
    con una W e Y conocidas.
  • 11:06 - 11:07
    En otras palabras,
  • 11:07 - 11:09
    se sabe que es un pájaro,
  • 11:09 - 11:12
    y se cuenta con una red neuronal
    entrenada en aves,
  • 11:12 - 11:14
    pero ¿y la imagen de un pájaro?
  • 11:15 - 11:20
    Usando el mismo procedimiento
    de minimización de errores,
  • 11:20 - 11:24
    uno puede hacer eso con la red entrenada
    para reconocer aves,
  • 11:24 - 11:27
    y el resultado es...
  • 11:30 - 11:32
    una imagen de aves.
  • 11:33 - 11:37
    Esta es una imagen de aves generada
    en su totalidad por una red neuronal
  • 11:37 - 11:38
    entrenada para reconocer aves,
  • 11:38 - 11:42
    simplemente resolviendo X,
    en lugar de resolver Y,
  • 11:42 - 11:43
    haciéndolo de forma iterativa.
  • 11:44 - 11:46
    He aquí otro ejemplo divertido.
  • 11:46 - 11:49
    Este fue un trabajo realizado
    por Mike Tyka en nuestro grupo,
  • 11:49 - 11:51
    llamado "animal del desfile".
  • 11:51 - 11:54
    Me recuerda algo a las obras
    de arte de William Kentridge,
  • 11:54 - 11:57
    donde él hace bocetos, los borra,
  • 11:57 - 11:58
    hace bocetos, los borra
  • 11:58 - 12:00
    y crea una película de esta manera.
  • 12:00 - 12:01
    En este caso, Mike
  • 12:01 - 12:04
    varía Y sobre el espacio
    de diferentes animales,
  • 12:04 - 12:07
    en una red diseñada
    para reconocer y distinguir
  • 12:07 - 12:08
    animales diferentes unos de otros.
  • 12:08 - 12:12
    Y se obtiene esta extraña metamorfosis
    de un animal a la Escher.
  • 12:14 - 12:19
    Aquí él y Alex han intentado reducir
  • 12:19 - 12:22
    las Y a un espacio
    de solo dos dimensiones,
  • 12:22 - 12:25
    logrando un mapa
    fuera del espacio de todas las cosas
  • 12:25 - 12:27
    reconocido por esta red.
  • 12:27 - 12:29
    Realizar este tipo de síntesis
  • 12:29 - 12:31
    o la generación de las imágenes
    sobre toda la superficie,
  • 12:31 - 12:34
    variando Y sobre la superficie,
    se hace una especie de mapa,
  • 12:34 - 12:37
    un mapa visual de todas las cosas
    que la red sabe reconocer.
  • 12:37 - 12:40
    Los animales están todos aquí;
    el armadillo está justo aquí.
  • 12:41 - 12:43
    Se puede hacer esto
    con otros tipos de redes.
  • 12:43 - 12:46
    Esta es una red diseñada
    para reconocer caras,
  • 12:46 - 12:48
    para distinguir una cara de otra.
  • 12:48 - 12:52
    Y aquí ponemos en Y una que dice "yo",
  • 12:52 - 12:53
    mis propios parámetros cara.
  • 12:53 - 12:55
    Y cuando esto resuelve X,
  • 12:55 - 12:58
    genera esta imagen de mí,
  • 12:58 - 13:02
    alocada, tipo cubista, psicodélica,
    como un cuadro surrealista,
  • 13:02 - 13:04
    desde múltiples puntos de vista a la vez.
  • 13:04 - 13:07
    Aparecen múltiples puntos
    de vista a la vez
  • 13:07 - 13:10
    porque la red está diseñada
    para descartar la ambigüedad
  • 13:10 - 13:13
    de una cara en una postura u otra,
  • 13:13 - 13:16
    con un tipo de luz, u otro.
  • 13:16 - 13:18
    Al hacer este tipo de reconstrucción,
  • 13:18 - 13:21
    si no se usa alguna imagen de guía
  • 13:21 - 13:22
    o estadísticas de guía,
  • 13:22 - 13:26
    entonces se obtiene una confusión
    de diferentes puntos de vista,
  • 13:26 - 13:27
    porque es ambigua.
  • 13:28 - 13:32
    Esto es lo que sucede si Alex usa
    su propia cara imagen como guía
  • 13:32 - 13:35
    durante ese proceso de optimización
    para reconstruir mi propia cara.
  • 13:36 - 13:39
    Así se puede ver que no es perfecto.
  • 13:39 - 13:41
    Todavía hay mucho trabajo por hacer
  • 13:41 - 13:43
    sobre cómo mejorar
    el proceso de optimización.
  • 13:43 - 13:46
    Pero ya se empieza a ver algo
    más parecido a una cara coherente,
  • 13:46 - 13:48
    usando mi propia cara como guía.
  • 13:49 - 13:51
    No tiene que comenzar
    con un lienzo en blanco
  • 13:51 - 13:53
    o con ruido blanco.
  • 13:53 - 13:54
    Cuando se está resolviendo X,
  • 13:54 - 13:58
    se puede comenzar con una X,
    que en sí es ya una imagen.
  • 13:58 - 14:00
    En eso consiste
    esta pequeña demostración.
  • 14:00 - 14:05
    Esta es una red diseñada para categorizar
  • 14:05 - 14:08
    todo objeto, estructuras
    hechas por humanos, animales...
  • 14:08 - 14:10
    Aquí empezamos
    con una imagen de las nubes,
  • 14:10 - 14:12
    y la optimizamos,
  • 14:12 - 14:17
    básicamente, esta red averigua
    qué se ve en las nubes.
  • 14:17 - 14:19
    Y cuanto más tiempo uno pasa mirando,
  • 14:19 - 14:22
    más cosas también se verán
    en las nubes.
  • 14:23 - 14:26
    También es posible usar la red
    para alucinar,
  • 14:26 - 14:28
    obteniendo cosas bastante locas.
  • 14:28 - 14:29
    (Risas)
  • 14:30 - 14:33
    O, Mike ha hecho otros experimentos
  • 14:33 - 14:37
    donde se detiene la imagen de la nube,
  • 14:37 - 14:41
    la alucina, la amplía,
    la alucina, la amplía...
  • 14:41 - 14:42
    Y de esta manera,
  • 14:42 - 14:45
    se obtiene una especie
    de estado de fuga de la red, supongo,
  • 14:46 - 14:49
    o una especie de asociación libre,
  • 14:49 - 14:51
    en el que la red se come su propia cola.
  • 14:51 - 14:55
    Así que cada imagen es ahora la base para
  • 14:55 - 14:56
    "¿Qué pienso que veré ahora?
  • 14:56 - 14:59
    ¿Qué pienso que veré ahora?
    ¿Qué pienso que veré ahora?"
  • 14:59 - 15:02
    Mostré esto por primera vez en público
  • 15:02 - 15:08
    a un grupo en una conferencia en
    Seattle llamada "Educación Superior",
  • 15:08 - 15:10
    esto fue justo después de que
    la marihuana fuera legalizada.
  • 15:10 - 15:13
    (Risas)
  • 15:15 - 15:17
    Así que me gustaría
    terminar rápidamente
  • 15:17 - 15:21
    con solo señalar
    que esta tecnología no está limitada.
  • 15:21 - 15:25
    He mostrado ejemplos puramente visuales
    porque son muy divertidos.
  • 15:25 - 15:27
    Pero no es una tecnología
    puramente visual.
  • 15:27 - 15:29
    Nuestro artista colaborador,
    Ross Goodwin,
  • 15:29 - 15:33
    tiene experimentos que implican
    a una cámara tomando una foto,
  • 15:33 - 15:37
    y luego una computadora en su mochila,
    escribe un poema usando redes neuronales,
  • 15:37 - 15:39
    basado en el contenido de la imagen.
  • 15:39 - 15:42
    Y que la red neuronal de poesía
    ha sido entrenada
  • 15:42 - 15:44
    en un gran corpus de poesía del siglo XX.
  • 15:44 - 15:46
    Y la poesía es, ya saben,
  • 15:46 - 15:48
    creo que no está tan mal, en realidad.
  • 15:48 - 15:49
    (Risas)
  • 15:49 - 15:50
    Para concluir,
  • 15:50 - 15:53
    creo que Miguel Ángel
  • 15:53 - 15:54
    tenía razón;
  • 15:54 - 15:57
    la percepción y la creatividad
    están conectadas muy íntimamente.
  • 15:58 - 16:00
    Acabamos de ver redes neuronales
  • 16:00 - 16:03
    totalmente capacitadas para discriminar,
  • 16:03 - 16:05
    o para reconocer
    cosas diferentes en el mundo,
  • 16:05 - 16:08
    que pueden ejecutarse a la inversa,
    para generar nuevas cosas.
  • 16:08 - 16:10
    Algo que me sugiere esto
  • 16:10 - 16:12
    no es solo que Miguel Ángel
    realmente vio
  • 16:12 - 16:15
    la escultura en los bloques de piedra,
  • 16:15 - 16:18
    sino que cualquier criatura,
    cualquier ser, cualquier alienígena
  • 16:18 - 16:22
    que es capaz de percibir
    actos de ese tipo
  • 16:22 - 16:23
    también es capaz de crear
  • 16:23 - 16:27
    porque en ambos casos
    se usa la misma maquinaria.
  • 16:27 - 16:31
    Además, creo que la percepción
    y la creatividad no son absolutamente
  • 16:31 - 16:33
    únicamente humanas.
  • 16:33 - 16:36
    Ya tenemos modelos computacionales
    que pueden hacer exactamente estas cosas.
  • 16:36 - 16:40
    Y que no debería ser sorprendente;
    el cerebro es computacional.
  • 16:40 - 16:41
    Y, finalmente,
  • 16:41 - 16:46
    la computación empezó como un ejercicio
    de diseño de máquinas inteligentes.
  • 16:46 - 16:48
    Fue modelada siguiendo la idea
  • 16:48 - 16:51
    de cómo podríamos hacer
    máquinas inteligentes.
  • 16:52 - 16:54
    Y, finalmente, se están
    empezando a cumplir
  • 16:54 - 16:56
    algunas de las promesas
    de aquellos pioneros,
  • 16:56 - 16:58
    como Turing, von Neumann
  • 16:58 - 17:00
    McCulloch y Pitts.
  • 17:00 - 17:04
    Y creo que la informática
    no es solo contabilidad
  • 17:04 - 17:06
    o jugar al Candy Crush y esas cosas.
  • 17:06 - 17:09
    Desde el principio, se diseñó
    siguiendo el modelo de nuestra mente.
  • 17:09 - 17:12
    Y eso nos da la capacidad de comprender
    mejor nuestra propia mente
  • 17:12 - 17:14
    y de ampliarla.
  • 17:15 - 17:16
    Muchas gracias.
  • 17:16 - 17:22
    (Aplausos)
Title:
Cómo las computadoras aprenden a ser creativas
Speaker:
Blaise Agüera y Arcas
Description:

Estamos en el límite de una nueva frontera en el arte y la creatividad y que no es humana. Blaise Agüera y Arcas, científico principal en Google, trabaja con redes neuronales para el desarrollo de la percepción computacional y el aprendizaje distribuido. En esta demo cautivadora muestra cómo las redes neuronales entrenadas para reconocer imágenes se pueden ejecutar a la inversa, para generarlas. Los resultados, espectaculares collages (¡y poemas!) alucinantes que desafían la categorización. "La percepción y la creatividad están conectados muy íntimamente", dice Agüera y Arcas. "Cualquier criatura, cualquier ser capaz de percibir es también capaz de crear".

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
17:34

Spanish subtitles

Revisions