Datos masivos, datos mucho mejores
-
0:01 - 0:05¿Pastel favorito en EEUU?
-
0:05 - 0:08Audiencia: El de manzana.
Kenneth Cukier: De manzana. Por supuesto. -
0:08 - 0:09¿Cómo lo sabemos?
-
0:09 - 0:12Por los datos.
-
0:12 - 0:14Se miran las ventas en supermercados.
-
0:14 - 0:17Se miran las ventas en supermercados
de pasteles de 30 cm -
0:17 - 0:21congelados, y los de manzana
ganan, sin rival. -
0:21 - 0:26La mayoría de las ventas son
los de manzana. -
0:26 - 0:29Pero los supermercados
comenzaron a vender -
0:29 - 0:32pasteles más pequeños, de 11 cm,
-
0:32 - 0:36y de repente, el de manzana
cayó al 4º o 5º lugar. -
0:36 - 0:39¿Por qué? ¿Qué paso?
-
0:39 - 0:42Bueno, piensen en ello.
-
0:42 - 0:46Cuando compramos un pastel de 30 cm,
-
0:46 - 0:48toda la familia tiene
que estar de acuerdo, -
0:48 - 0:52y el de manzana es el segundo
favorito de todos. -
0:52 - 0:54(Risas)
-
0:54 - 0:57Pero si uno compra
un pastel de 11 cm individual, -
0:57 - 1:01puede comprar el que desee.
-
1:01 - 1:05Puede comprar su primera opción.
-
1:05 - 1:07Tenemos más datos.
-
1:07 - 1:08Podemos ver algo
-
1:08 - 1:09que no se podía ver
-
1:09 - 1:13cuando solo había menor
cantidad de datos. -
1:13 - 1:16Ahora, el punto es que
muchos más datos -
1:16 - 1:18no solo nos permiten ver más,
-
1:18 - 1:20más de lo mismo
que ya veíamos. -
1:20 - 1:23Más datos nos permiten
ver cosas nuevas. -
1:23 - 1:27Nos permiten ver mejor.
-
1:27 - 1:30Nos permiten ver
de forma diferente. -
1:30 - 1:33En este caso, nos permiten ver
-
1:33 - 1:36que el pastel favorito de EEUU es:
-
1:36 - 1:39no el de manzana.
-
1:39 - 1:42Puede que todos hayan oído escuchado
el término "Datos masivos". -
1:42 - 1:45De hecho, es probable que
estén hartos de escucharlo -
1:45 - 1:46"Datos masivos".
-
1:46 - 1:49Es cierto que se exagera
mucho el término, -
1:49 - 1:52y eso es muy lamentable,
-
1:52 - 1:55porque los datos masivos
son una herramienta muy importante -
1:55 - 1:59para que la sociedad avance.
-
1:59 - 2:02En el pasado, solíamos observar
pequeñas cantidades de datos -
2:02 - 2:04y pensar qué significarían
-
2:04 - 2:05para tratar de entender el mundo.
-
2:05 - 2:07Ahora tenemos mucho más de ello,
-
2:07 - 2:10más de lo que podía existir antes.
-
2:10 - 2:12Lo que encontramos es que
cuando tenemos -
2:12 - 2:15una gran cantidad de datos,
podemos hacer cosas -
2:15 - 2:18que no podíamos hacer
teniendo solo cantidades más pequeñas. -
2:18 - 2:21Los datos masivos son importantes
y es algo nuevo, -
2:21 - 2:22y cuando se piensa en ello,
-
2:22 - 2:25la única forma en que
este planeta afronte -
2:25 - 2:26sus desafíos mundiales, esto es,
-
2:26 - 2:30alimentar a la gente,
ofrecer atención médica, -
2:30 - 2:33suministrar energía, electricidad,
-
2:33 - 2:35y asegurarse de que
no nos achicharramos -
2:35 - 2:36debido al calentamiento global,
-
2:36 - 2:40es utilizando de forma eficaz los datos.
-
2:40 - 2:44Entonces, ¿qué es lo nuevo de
los datos masivos? ¿Cuál es la gran cosa? -
2:44 - 2:46Bueno, para responder a esto,
pensaremos en -
2:46 - 2:48cómo se veía la información,
-
2:48 - 2:51físicamente en el pasado.
-
2:51 - 2:55En 1908 en la isla de Creta,
-
2:55 - 3:00los arqueólogos descubrieron
un disco de arcilla. -
3:00 - 3:04Datan del año 2000 aC,
así que tienen 4000 años de antigüedad. -
3:04 - 3:06Hay inscripciones en este disco,
-
3:06 - 3:07pero, no sabemos
qué significan. -
3:07 - 3:09Es un completo misterio,
pero el punto es que -
3:09 - 3:11así solía verse la información
-
3:11 - 3:13hace 4000 años.
-
3:13 - 3:16Esta es la forma en que
la sociedad almacenaba -
3:16 - 3:19y transmitía la información.
-
3:19 - 3:23Ahora, la sociedad no ha avanzado tanto.
-
3:23 - 3:27Todavía guardamos
la información en discos, -
3:27 - 3:30pero ahora podemos almacenar
mucha más información, -
3:30 - 3:31más que nunca.
-
3:31 - 3:34Buscar es más fácil. Copiar es más fácil.
-
3:34 - 3:38El compartir es más fácil.
El procesamiento es más fácil. -
3:38 - 3:41Y podemos volver
a utilizar esta información -
3:41 - 3:42para usos que nunca
nos imaginamos -
3:42 - 3:46cuando se recogieron los primeros datos.
-
3:46 - 3:48A este respecto, los datos
han evolucionado -
3:48 - 3:51de un almacén a un flujo,
-
3:51 - 3:55de algo que es estacionario y estático
-
3:55 - 3:59a algo que es fluido y dinámico.
-
3:59 - 4:03Hay, si quieren,
una liquidez de información. -
4:04 - 4:06El disco descubierto fuera de Creta
-
4:06 - 4:10que tiene 4000 años
de antigüedad, es pesado, -
4:10 - 4:12no almacena gran cantidad de información,
-
4:12 - 4:15y esa información no es modificable.
-
4:15 - 4:19Por el contrario, todos los archivos
-
4:19 - 4:21que Edward Snowden tomó
-
4:21 - 4:24de la Agencia de Seguridad Nacional
de EEUU -
4:24 - 4:26caben en un dispositivo
de memoria extraíble -
4:26 - 4:29del tamaño de una uña,
-
4:29 - 4:34y pueden compartirse
a la velocidad de la luz. -
4:34 - 4:39Más datos. Más.
-
4:39 - 4:41Una razón para tener tantos datos
hoy en el mundo -
4:41 - 4:43es que recolectamos cosas
-
4:43 - 4:46sobre las que siempre
hemos recopilado información, -
4:46 - 4:49pero otra razón es que
estamos tomando cosas -
4:49 - 4:51que siempre han sido informacionales
-
4:51 - 4:54pero nunca se habían convertido
a un formato de datos -
4:54 - 4:56y las estamos convirtiendo en datos.
-
4:56 - 5:00Piensen, por ejemplo,
en la cuestión de la ubicación. -
5:00 - 5:02Tomemos, por ejemplo, Martín Lutero.
-
5:02 - 5:04Si hubiéramos querido
saber en 1500 -
5:04 - 5:06donde estaba Martín Lutero,
-
5:06 - 5:09habríamos tenido que seguirlo
en todo momento, -
5:09 - 5:10quizá con pluma y tintero,
-
5:10 - 5:12y anotarlo.
-
5:12 - 5:14Pero piensen cómo es hoy en día.
-
5:14 - 5:16Uds. saben que en algún lugar,
-
5:16 - 5:19quizá en la base de datos
de una empresa de telecomunicaciones, -
5:19 - 5:22hay una hoja de cálculo o
entrada de base de datos -
5:22 - 5:24donde se registra su información
-
5:24 - 5:26de donde han estado
en todo momento. -
5:26 - 5:27Si tienen celular,
-
5:27 - 5:30y el teléfono tiene GPS,
pero incluso si no tiene GPS, -
5:30 - 5:33se puede registrar su información.
-
5:33 - 5:37En este sentido, la localización
ha sido un campo de datos. -
5:37 - 5:41Ahora piensen, por ejemplo,
en el tema de la postura, -
5:41 - 5:43la forma en que están
sentados ahora, -
5:43 - 5:45la forma en Ud. está sentado,
-
5:45 - 5:47la de Ud., la de Ud.
-
5:47 - 5:51Todas diferentes, en función
de la longitud de las piernas, -
5:51 - 5:52la espalda y su contorno,
-
5:52 - 5:54y si pusiera censores,
tal vez 100 -
5:54 - 5:56en todos los asientos ahora,
-
5:56 - 5:59podría crear un índice
que es único para cada uno, -
5:59 - 6:04algo así como una huella digital,
que no es del dedo. -
6:04 - 6:07Y entonces,
¿qué podemos hacer con esto? -
6:07 - 6:09Los investigadores en Tokio
están utilizando -
6:09 - 6:14como un dispositivo potencial
antirobo en los autos. -
6:14 - 6:16La idea es que el ladrón
se siente al volante, -
6:16 - 6:19intente encenderlo,
pero el auto reconoce -
6:19 - 6:21que un conductor no autorizado
está en el auto -
6:21 - 6:23y, tal vez el motor se detiene,
a menos que -
6:23 - 6:26escriba una contraseña
en el salpicadero -
6:26 - 6:31para decir, "Tengo la autorización
para conducir". Estupendo. -
6:31 - 6:33¿Qué pasaría si cada automóvil
en Europa -
6:33 - 6:35tuviera esta tecnología?
-
6:35 - 6:38¿Qué podemos hacer entonces?
-
6:38 - 6:40Tal vez, si agregamos los datos,
-
6:40 - 6:44tal vez podríamos identificar
signos reveladores -
6:44 - 6:47que predijeran mejor
que un accidente de auto -
6:47 - 6:53tendrá lugar en los próximos
cinco segundos. -
6:53 - 6:55Y entonces,
la base de datos que tendremos -
6:55 - 6:57es la fatiga del conductor,
-
6:57 - 7:00y el servicio se activaría
cuando los sensores del automóvil -
7:00 - 7:03detectaran que la persona
reposa en esa posición, -
7:03 - 7:07y automáticamente
se activa una alarma interna -
7:07 - 7:09que haría vibrar el volante,
sonar una alarma -
7:09 - 7:11para decir, "Despierta,
-
7:11 - 7:12presta más atención a la carretera".
-
7:12 - 7:15Este es el tipo de cosas
que podemos hacer -
7:15 - 7:17cuando tomamos datos
en más aspectos de nuestras vidas. -
7:17 - 7:21Entonces, ¿cuál es el valor
de los datos masivos? -
7:21 - 7:23Bueno, piensen en ello.
-
7:23 - 7:25Tienen más información.
-
7:25 - 7:29Pueden hacer cosas que antes
no se podían hacer. -
7:29 - 7:30Una de las zonas más impresionantes
-
7:30 - 7:32donde este concepto se ve aplicado
-
7:32 - 7:35es en el área del
aprendizaje automático. -
7:35 - 7:39El aprendizaje automático es una rama
de la inteligencia artificial, -
7:39 - 7:42que en sí es una rama de la informática.
-
7:42 - 7:44La idea general es que en lugar de
-
7:44 - 7:46enseñar a un equipo algo,
-
7:46 - 7:48simplemente transferiremos
datos al problema -
7:48 - 7:51para decirle a la computadora
que lo averigüe sola. -
7:51 - 7:53Y nos ayude a entenderlo
-
7:53 - 7:57al ver sus orígenes.
-
7:57 - 7:59En la década de 1950,
un científico de computación -
7:59 - 8:03en IBM llamado Arthur Samuel
al que le gustaba jugar a damas, -
8:03 - 8:04por eso escribió
un programa -
8:04 - 8:07para poder jugar contra la computadora.
-
8:07 - 8:10Jugó. Ganó.
-
8:10 - 8:12Jugó. Ganó.
-
8:12 - 8:15Jugó. Ganó,
-
8:15 - 8:17porque el equipo solo sabía
-
8:17 - 8:19lo que era un movimiento legal.
-
8:19 - 8:21Arthur Samuel sabía algo más.
-
8:21 - 8:26Arthur Samuel sabía estrategia.
-
8:26 - 8:28Así que escribió un pequeño subprograma
-
8:28 - 8:30operando en el fondo.
Y todo lo que hizo -
8:30 - 8:32fue anotar la probabilidad
-
8:32 - 8:34de que una configuración
del tablero condujera -
8:34 - 8:37a un tablero ganador frente
a un tablero perdedor -
8:37 - 8:40después de cada movimiento.
-
8:40 - 8:43Él jugó contra el equipo.
Él ganó. -
8:43 - 8:45Él jugó contra el equipo.
Él ganó. -
8:45 - 8:49Él jugó contra el equipo.
Él ganó. -
8:49 - 8:51Y luego Arthur Samuel dejó
que la computadora -
8:51 - 8:54jugara sola.
-
8:54 - 8:57Juega sola. Y recoge más datos.
-
8:57 - 9:01Recoge más datos.
Aumenta la precisión de su predicción. -
9:01 - 9:03Y luego Arthur Samuel vuelve al equipo
-
9:03 - 9:06juega y pierde.
-
9:06 - 9:08Y juega y pierde.
-
9:08 - 9:10Y juega y pierde.
-
9:10 - 9:13Y Arthur Samuel ha creado una máquina
-
9:13 - 9:19que supera su capacidad
en una tarea que él enseñó. -
9:19 - 9:21Y esta idea de aprendizaje automático
-
9:21 - 9:25irá a todas partes.
-
9:25 - 9:28¿Cómo creen que tenemos
autos autodirigidos? -
9:28 - 9:31¿Estamos mejor como sociedad
-
9:31 - 9:34almacenando todas las reglas
de la carretera en un software? -
9:34 - 9:36No. La memoria es más barata. No.
-
9:36 - 9:40Los algoritmos son más rápidos. No.
Los procesadores son mejores. No. -
9:40 - 9:43Todas esas cosas importan,
pero no es por eso. -
9:43 - 9:46Es porque hemos cambiado
la naturaleza del problema. -
9:46 - 9:48Hemos cambiado
el problema de uno -
9:48 - 9:50en el que intentábamos
abierta y explícitamente -
9:50 - 9:53explicar a la computadora
cómo conducir, -
9:53 - 9:54a uno en la que decimos,
-
9:54 - 9:56"Aquí hay una gran cantidad
de datos del vehículo. -
9:56 - 9:57Haz los números.
-
9:57 - 9:59Te diste cuenta de que eso es un semáforo,
-
9:59 - 10:01que está en rojo
y no verde, -
10:01 - 10:03eso significa que tienes
que detenerte -
10:03 - 10:06y no seguir".
-
10:06 - 10:08El aprendizaje automático está en la base
-
10:08 - 10:11de muchas cosas
que hacemos en línea: -
10:11 - 10:12motores de búsqueda,
-
10:12 - 10:16el algoritmo de personalización
de Amazon, -
10:16 - 10:18la traducción automática
por computadora, -
10:18 - 10:22los sistemas de reconocimiento de voz.
-
10:22 - 10:25Recientemente,
los investigadores han examinado -
10:25 - 10:28la cuestión de biopsias,
-
10:28 - 10:31biopsias de cáncer,
-
10:31 - 10:33y han usado la computadora
para identificar, -
10:33 - 10:36mirando los datos y
las tasas de supervivencia, -
10:36 - 10:40si las células son en realidad
-
10:40 - 10:43cancerosas o no,
-
10:43 - 10:45y claro, al trasferir
los datos -
10:45 - 10:47por un algoritmo
de aprendizaje automático, -
10:47 - 10:49la máquina fue capaz de identificar
-
10:49 - 10:51los 12 signos reveladores
que mejor predicen -
10:51 - 10:54si en esta biopsia de
células de cáncer de mama, -
10:54 - 10:57hay, en efecto, cáncer.
-
10:57 - 11:00El problema: la literatura médica
-
11:00 - 11:03solo sabía nueve de ellos.
-
11:03 - 11:04Tres de los rasgos eran de
-
11:04 - 11:07los que las personas no buscan,
-
11:07 - 11:11pero que la máquina descubrió.
-
11:14 - 11:19También hay lados oscuros
en los datos masivos. -
11:19 - 11:21Mejorará nuestras vidas,
pero hay problemas -
11:21 - 11:24de los que tenemos que
ser conscientes, -
11:24 - 11:26y el primero es la idea
-
11:26 - 11:29de que podemos ser castigados
por las predicciones, -
11:29 - 11:33que la policía puede utilizar
datos masivos para sus fines, -
11:33 - 11:35un poco como "Minority Report".
-
11:35 - 11:38Es un término conocido como
policial predictiva, -
11:38 - 11:40o criminología algorítmica,
-
11:40 - 11:42y la idea es que,
con gran cantidad de datos, -
11:42 - 11:44por ejemplo, donde hubo
crímenes antes, -
11:44 - 11:47sabremos dónde enviar
a las patrullas. -
11:47 - 11:49Tiene sentido, pero,
el problema, claro, -
11:49 - 11:53es que no solo se quedarán
en los datos de ubicación, -
11:53 - 11:56irán al nivel del individuo.
-
11:56 - 11:59¿Por qué no usamos
los datos de personas -
11:59 - 12:01con un alto expediente académico?
-
12:01 - 12:02Tal vez utilizar
el hecho de que -
12:02 - 12:04estén sin empleo,
su record crediticio, -
12:04 - 12:06su comportamiento en la web,
-
12:06 - 12:08si están despiertos
tarde en la noche. -
12:08 - 12:12Su controlador físico digital,
cuando identifique datos bioquímicos, -
12:12 - 12:15mostrará si tienen
pensamientos agresivos. -
12:15 - 12:17Podemos tener algoritmos
que pueden predecir -
12:17 - 12:19lo que estamos a punto de hacer,
-
12:19 - 12:20y podemos ser responsables
-
12:20 - 12:23antes de que realmente
hayamos actuado. -
12:23 - 12:25la privacidad era el desafío principal
-
12:25 - 12:28en la era de los datos pequeños.
-
12:28 - 12:30En la era de los datos masivos,
-
12:30 - 12:34el reto será salvaguardar
el libre albedrío, -
12:34 - 12:38la elección moral,
la voluntad humana, -
12:38 - 12:41la acción humana.
-
12:43 - 12:45Hay otro problema:
-
12:45 - 12:48los datos masivos nos quitarán
nuestros puestos de trabajo. -
12:48 - 12:52Los datos masivos y algoritmos desafiarán
-
12:52 - 12:55los conocimientos profesionales de gestión
-
12:55 - 12:57en el siglo XXI
-
12:57 - 12:59de la misma manera que
la automatización de las fábricas -
12:59 - 13:01y las cadenas de montaje
-
13:01 - 13:04desafiaron el trabajo
de los obreros en el siglo XX. -
13:04 - 13:06Piensen en un técnico de laboratorio
-
13:06 - 13:08que mira en un microscopio
-
13:08 - 13:09una biopsia de cáncer
-
13:09 - 13:12para determinar si es cáncer o no.
-
13:12 - 13:14La persona que fue a la universidad.
-
13:14 - 13:15En el que compra propiedades.
-
13:15 - 13:17Él o ella vota.
-
13:17 - 13:21Él o ella es un constituyente
de la sociedad. -
13:21 - 13:22Y el trabajo de esa persona,
-
13:22 - 13:24así como toda una flota
-
13:24 - 13:26de profesionales como esa persona,
-
13:26 - 13:29se encontrará que sus puestos de trabajo
han cambiado radicalmente -
13:29 - 13:31o, en realidad, se han eliminado
completamente. -
13:31 - 13:33Ahora, nos gusta pensar
-
13:33 - 13:36que la tecnología crea
puestos de trabajo -
13:36 - 13:39después de un corto período
de dislocación temporal, -
13:39 - 13:41y es cierto para el marco de referencia
-
13:41 - 13:43de la Revolución Industrial,
que vivimos, -
13:43 - 13:46porque eso es precisamente lo que ocurrió.
-
13:46 - 13:48Pero nos olvidamos de algo en el análisis:
-
13:48 - 13:50Hay algunas categorías de empleos
-
13:50 - 13:53que simplemente se eliminan y
no se crean nunca más. -
13:53 - 13:55La Revolución Industrial no era muy buena
-
13:55 - 13:59si eras un caballo.
-
13:59 - 14:01Así que tendremos
que tener cuidado -
14:01 - 14:05y tomar datos masivos
y ajustarlos a nuestras necesidades, -
14:05 - 14:08a nuestras necesidades muy humanas.
-
14:08 - 14:10Tenemos que ser los dueños
de esta tecnología, -
14:10 - 14:12no sus siervos.
-
14:12 - 14:15Estamos justo en el comienzo
de la era de los datos masivos, -
14:15 - 14:18y honestamente,
no somos muy buenos -
14:18 - 14:22en el manejo de todos los datos
que ahora podemos recoger. -
14:22 - 14:25No es solo un problema para
la Agencia de Seguridad Nacional. -
14:25 - 14:28Las empresas recogen muchos datos,
y también, hacen mal uso de ellos, -
14:28 - 14:32y tenemos que mejorar en esto,
y esto tomará tiempo. -
14:32 - 14:34Es un poco como
el desafío que enfrentó -
14:34 - 14:36el hombre primitivo y el fuego.
-
14:36 - 14:38Es una herramienta,
pero que, -
14:38 - 14:42a menos que seamos cuidadosos,
nos va a quemar. -
14:44 - 14:47Los datos masivos transformarán
la manera en que vivimos, -
14:47 - 14:50cómo trabajamos y
cómo pensamos. -
14:50 - 14:52Nos ayudarán con nuestras carreras
-
14:52 - 14:55y a llevar una vida de satisfacción
y esperanza -
14:55 - 14:58y felicidad y salud,
-
14:58 - 15:02pero en el pasado, frecuentemente,
vimos esa tecnología -
15:02 - 15:04y nuestros ojos solo han visto la T
-
15:04 - 15:06la tecnología, el hardware,
-
15:06 - 15:08porque eso es físico.
-
15:08 - 15:11Ahora tenemos que reformular
nuestra mirada a la I, -
15:11 - 15:12la información,
-
15:12 - 15:14que es menos tangible,
-
15:14 - 15:17pero en algunos aspectos
mucho más importante. -
15:18 - 15:21La humanidad finalmente
puede aprender de la información -
15:21 - 15:24que puede recoger,
-
15:24 - 15:26como parte de nuestra búsqueda eterna
-
15:26 - 15:29para entender el mundo y
nuestro lugar en él, -
15:29 - 15:33y por eso los datos masivos
es un gran asunto. -
15:35 - 15:38(Aplausos)
- Title:
- Datos masivos, datos mucho mejores
- Speaker:
- Kenneth Cukier
- Description:
-
Los automóviles autodirigidos fueron solo el comienzo. ¿Cuál es el futuro de la tecnología y el diseño impulsado por los datos masivos? En esta apasionante charla científica Kenneth Cukier observa lo que esto supone para el aprendizaje automático, y, por ende, para el conocimiento humano.
- Video Language:
- English
- Team:
- closed TED
- Project:
- TEDTalks
- Duration:
- 15:51
Lidia Cámara de la Fuente approved Spanish subtitles for Big data is better data | ||
Lidia Cámara de la Fuente edited Spanish subtitles for Big data is better data | ||
Lidia Cámara de la Fuente edited Spanish subtitles for Big data is better data | ||
Lidia Cámara de la Fuente edited Spanish subtitles for Big data is better data | ||
Ciro Gomez accepted Spanish subtitles for Big data is better data | ||
Ciro Gomez edited Spanish subtitles for Big data is better data | ||
Ciro Gomez edited Spanish subtitles for Big data is better data | ||
Ciro Gomez edited Spanish subtitles for Big data is better data |