Megadados são dados melhores
-
0:01 - 0:04A tarte preferida da América é...?
-
0:05 - 0:06Audiência: Maçã!
-
0:06 - 0:08Kenneth Cukier: Maçã. Claro que é.
-
0:08 - 0:10Como é que sabemos?
-
0:10 - 0:12Por causa dos dados!
-
0:13 - 0:15Vemos nas vendas dos supermercados.
-
0:15 - 0:17Vemos nos supermercados
as vendas das tartes de 30 cm -
0:17 - 0:21que estão congeladas,
e a maçã ganha, sem discussão. -
0:21 - 0:24A maioria das vendas são as de maçã.
-
0:27 - 0:29Mas depois os supermercados
começaram a vender -
0:29 - 0:32tartes mais pequenas, de 11 cm.
-
0:32 - 0:35De repente, a maçã caiu
para quarto ou quinto lugar. -
0:36 - 0:39Porquê? O que é que aconteceu?
-
0:39 - 0:41Pensem bem.
-
0:42 - 0:46Quando vocês compram uma tarte de 30 cm,
-
0:46 - 0:48toda a família tem que aceitar,
-
0:48 - 0:52mas a maçã é a segunda escolha de todos.
-
0:52 - 0:53(Risos)
-
0:54 - 0:58Mas quando compram
uma tarte individual de 11 cm, -
0:58 - 1:01podem comprar aquela que quiserem.
-
1:01 - 1:04Podem obter a vossa primeira escolha.
-
1:05 - 1:07Vocês têm mais dados.
-
1:07 - 1:09Podem ver uma coisa que não viam,
-
1:09 - 1:12quando só tinham
uma quantidade mais pequena. -
1:13 - 1:18A questão aqui é que mais dados
não só nos permitem ver mais, -
1:18 - 1:20mais da mesma coisa
para que estamos a olhar, -
1:20 - 1:23mas mais dados também
nos permitem ver coisas novas. -
1:24 - 1:26Permitem-nos ver melhor.
-
1:27 - 1:30Permitem-nos ver de modo diferente.
-
1:30 - 1:33Neste caso, permitem-nos ver
-
1:33 - 1:36qual é a tarte preferida da América:
-
1:36 - 1:38não é a de maçã.
-
1:39 - 1:42Provavelmente, já todos ouviram falar
do termo "megadados". -
1:42 - 1:45Provavelmente já estão enjoados
de ouvir o termo -
1:45 - 1:46Megadados.
-
1:46 - 1:50É verdade que há muita publicidade
em torno deste termo -
1:50 - 1:52e isso é lamentável,
-
1:52 - 1:55porque os megadados são uma ferramenta
extremamente importante -
1:55 - 1:58com a qual a sociedade vai avançar.
-
1:59 - 2:02No passado, olhávamos
para conjuntos reduzidos de dados -
2:02 - 2:05e pensávamos o que significariam
para tentar entender o mundo. -
2:05 - 2:07Agora temos muito mais,
-
2:07 - 2:10mais do que alguma vez tivemos.
-
2:10 - 2:13Descobrimos que, quando temos
um grande conjunto de dados, -
2:13 - 2:16podemos fazer coisas
que não eram possíveis, -
2:16 - 2:18quando só tínhamos
quantidades mais pequenas. -
2:18 - 2:21Os megadados são importantes
e são uma novidade. -
2:21 - 2:22Pensem nisto.
-
2:22 - 2:24A única forma como este planeta
-
2:24 - 2:27vai poder lidar com os desafios globais
-
2:27 - 2:30— alimentar as pessoas,
dispensar-lhes cuidados médicos, -
2:30 - 2:33fornecer-lhes energia, eletricidade,
-
2:33 - 2:35e garantir que elas
não vão ficar em torresmos -
2:35 - 2:37por causa do aquecimento global —
-
2:37 - 2:39é através do uso eficaz de dados.
-
2:40 - 2:42Então o que há de novo
quanto aos megadados? -
2:42 - 2:44O que têm de tão importante?
-
2:44 - 2:46Para responder a esta pergunta,
-
2:46 - 2:49pensemos em como era a informação,
-
2:49 - 2:52qual era o seu aspeto físico, no passado.
-
2:52 - 2:55Em 1908, na Ilha de Creta,
-
2:55 - 2:59os arqueólogos descobriram
um disco de barro. -
3:00 - 3:04Dataram-no de 2000 a.C.,
portanto com 4000 anos. -
3:04 - 3:06Há inscrições nesse disco,
-
3:06 - 3:07mas não sabemos o que é que significam.
-
3:07 - 3:09É um mistério total, mas a questão
-
3:09 - 3:12é que era aquele o aspeto das informações
-
3:12 - 3:13há 4000 anos.
-
3:13 - 3:16Era assim que a sociedade armazenava
-
3:16 - 3:19e transmitia as informações.
-
3:19 - 3:23A sociedade não avançou assim muito.
-
3:24 - 3:27Continuamos a armazenar
informação em discos, -
3:27 - 3:30mas agora podemos guardar
muito mais informações, -
3:30 - 3:32muito mais do que até aqui.
-
3:32 - 3:34É mais fácil pesquisar.
É mais fácil copiar. -
3:34 - 3:37É mais fácil partilhar.
É mais fácil processar. -
3:38 - 3:41Podemos reutilizar essas informações
-
3:41 - 3:43para usos que nunca sequer imaginávamos
-
3:43 - 3:46quando a princípio reunimos os dados.
-
3:46 - 3:51Neste aspeto, os dados
passaram de "stock" a fluxo, -
3:52 - 3:56passaram duma coisa que é fixa e estática
-
3:56 - 3:59para uma coisa que é fluida e dinâmica.
-
3:59 - 4:02Há, se quiserem,
uma liquidez na informação. -
4:04 - 4:07O disco que foi descoberto em Creta
-
4:07 - 4:10que tem 4000 anos, é pesado,
-
4:10 - 4:12não guarda muitas informações
-
4:12 - 4:15e essas informações são imutáveis.
-
4:15 - 4:20Em contrapartida, todos os arquivos
-
4:20 - 4:21que Edward Snowden levou
-
4:21 - 4:25da National Security Agency
nos Estados Unidos da América -
4:25 - 4:27cabem num cartão de memória
-
4:27 - 4:29do tamanho duma unha
-
4:29 - 4:32e podem ser partilhados
à velocidade da luz. -
4:35 - 4:37Mais dados. Mais.
-
4:39 - 4:41Uma das razões por que temos hoje
tantos dados no mundo -
4:41 - 4:43é porque estamos a reunir coisas
-
4:43 - 4:46sobre as quais sempre reunimos informação.
-
4:46 - 4:49Mas outra razão é porque
estamos a agarrar em coisas -
4:49 - 4:51que sempre foram informativas
-
4:51 - 4:54mas nunca foram transformadas
num formato de dados -
4:54 - 4:56e estamos a transformá-las em dados.
-
4:56 - 4:59Por exemplo, pensem
na questão da localização. -
5:00 - 5:02Por exemplo, Martinho Lutero.
-
5:02 - 5:04Se quiséssemos saber nos anos de 1500
-
5:04 - 5:06onde estava Martinho Lutero,
-
5:06 - 5:08tínhamos que andar sempre atrás dele,
-
5:08 - 5:11— talvez com uma pluma de pato
e um tinteiro — -
5:11 - 5:12e registar isso.
-
5:12 - 5:14Agora pensem no que se passa hoje.
-
5:14 - 5:16Sabemos que algures,
-
5:16 - 5:19provavelmente na base de dados
duma empresa de telecomunicações, -
5:19 - 5:23há uma folha de cálculo ou, pelo menos,
uma entrada numa base de dados -
5:23 - 5:24que regista as informações
-
5:24 - 5:26sobre onde estivemos em todas as ocasiões,
-
5:26 - 5:29se tivermos um telemóvel
e esse telemóvel tiver GPS. -
5:29 - 5:30Mas, mesmo que não tenha GPS,
-
5:30 - 5:33pode registar as nossas informações.
-
5:33 - 5:36Nesse aspeto, a localização
foi transformada em dados. -
5:37 - 5:40Pensem, por exemplo,
na questão da postura, -
5:40 - 5:43na forma como estão sentados
neste momento, -
5:43 - 5:45na forma como se sentam,
-
5:45 - 5:47na forma como você se senta,
na forma como você se senta. -
5:47 - 5:50São diferentes, em função
do tamanho das vossas pernas, -
5:50 - 5:52dos contornos das vossas costas.
-
5:52 - 5:54Se puséssemos censores,
— talvez uns 100 censores — -
5:54 - 5:56em todas as cadeiras, neste momento,
-
5:56 - 5:59eu podia criar um índice único
para cada um de vocês, -
5:59 - 6:04uma espécie de impressão digital,
mas não dos vossos dedos. -
6:04 - 6:07Mas o que é que podíamos fazer com isso?
-
6:07 - 6:09Há investigadores em Tóquio
que estão a usar isso -
6:09 - 6:13como um possível aparelho antirroubo
em automóveis. -
6:14 - 6:18A ideia é que o ladrão
senta-se ao volante, tenta arrancar, -
6:18 - 6:21mas o carro reconhece que, ao volante,
está um condutor não autorizado -
6:21 - 6:23e o motor não arranca,
-
6:23 - 6:25a não ser que se digite uma senha
-
6:25 - 6:27no painel de comandos, que diz:
-
6:27 - 6:29"Olha lá,
eu tenho autorização para guiar". -
6:29 - 6:30Fantástico.
-
6:31 - 6:34E, se todos os carros na Europa
-
6:34 - 6:35tivessem essa tecnologia?
-
6:35 - 6:38O que é que podíamos fazer?
-
6:39 - 6:40Se agregássemos os dados,
-
6:40 - 6:44talvez pudéssemos identificar
sinais reveladores -
6:44 - 6:46que previssem melhor
-
6:46 - 6:49que vai ocorrer um acidente de viação
-
6:49 - 6:52nos cinco segundos seguintes.
-
6:53 - 6:56E mais, o que teremos registado em dados
-
6:56 - 6:57é a fadiga do condutor.
-
6:57 - 6:59O objetivo seria que,
-
6:59 - 7:04quando o carro pressente
que a pessoa entra nessa situação, -
7:04 - 7:07sabe automaticamente
que deve ligar um alarme interno -
7:07 - 7:10que fará vibrar a buzina do volante,
no interior, a dizer: -
7:10 - 7:12"Ei, acorda!
Presta mais atenção à estrada!" -
7:13 - 7:15São estas as coisas que podemos fazer
-
7:15 - 7:18quando transformamos em dados
mais aspetos da nossa vida. -
7:18 - 7:21Então, qual é o valor dos megadados?
-
7:21 - 7:23Pensem só.
-
7:23 - 7:26Temos mais informações.
-
7:26 - 7:29Podemos fazer coisas
que não podíamos fazer antes. -
7:29 - 7:31Uma das áreas mais impressionantes
-
7:31 - 7:33em que está a ocorrer este conceito
-
7:33 - 7:35é na área da aprendizagem das máquinas.
-
7:36 - 7:39A aprendizagem das máquinas
é um ramo da inteligência artificial, -
7:39 - 7:42que, por sua vez, é um ramo
das tecnologias da informação. -
7:42 - 7:43A ideia geral é que,
-
7:43 - 7:46em vez de dar instruções
a um computador sobre o que fazer, -
7:46 - 7:49vamos simplesmente
lançar dados para o problema -
7:49 - 7:52e dizer ao computador para arranjar
a solução por si mesmo. -
7:52 - 7:54Vão compreender melhor
-
7:54 - 7:56conhecendo as suas origens.
-
7:57 - 8:00Nos anos 50,
um engenheiro informático da IBM, -
8:00 - 8:03chamado Arthur Samuel,
gostava de jogar xadrez. -
8:03 - 8:05Por isso escreveu
um programa para computador -
8:05 - 8:08para poder jogar com o computador.
-
8:07 - 8:09Jogou. Ganhou.
-
8:10 - 8:12Jogou. Ganhou.
-
8:12 - 8:14Jogou. Ganhou.
-
8:15 - 8:17Porque o computador só sabia
-
8:17 - 8:19o que era um movimento legal.
-
8:19 - 8:21Arthur Samuel sabia mais qualquer coisa.
-
8:21 - 8:25Arthur Samuel sabia estratégia.
-
8:26 - 8:28Assim, escreveu um pequeno subprograma
-
8:28 - 8:30que corria por detrás,
-
8:30 - 8:32que apenas calculava as probabilidades
-
8:32 - 8:34de uma dada configuração do tabuleiro
-
8:34 - 8:38levar a um tabuleiro vencedor
ou a um tabuleiro perdedor, -
8:38 - 8:40depois de cada movimento.
-
8:40 - 8:42Joga com o computador. Ganha.
-
8:43 - 8:45Joga com o computador. Ganha.
-
8:45 - 8:48Joga com o computador. Ganha.
-
8:49 - 8:53Então, Arthur Samuel deixa
o computador jogar sozinho. -
8:54 - 8:57Ele joga sozinho. Reúne mais dados.
-
8:57 - 9:01Reúne mais dados.
Aumenta o rigor das suas previsões. -
9:01 - 9:04Arthur Samuel volta ao computador.
-
9:04 - 9:06Joga e perde,
-
9:06 - 9:08joga e perde,
-
9:09 - 9:10joga e perde.
-
9:10 - 9:13Arthur Samuel criara uma máquina
-
9:13 - 9:17que ultrapassara a sua capacidade
numa tarefa que ele lhe ensinara. -
9:19 - 9:21Esta ideia de aprendizagem da máquina
-
9:21 - 9:24está a espalhar-se por todo o lado.
-
9:26 - 9:28Como é que julgam
que temos carros autoguiados? -
9:29 - 9:31A nossa sociedade está melhor
-
9:31 - 9:34por meter todas as regras de trânsito
em "software"? Não. -
9:35 - 9:37A memória é mais barata? Não.
-
9:37 - 9:38Os algoritmos são mais rápidos? Não.
-
9:38 - 9:41Os processadores são melhores? Não.
-
9:41 - 9:44Todas essas coisas são importantes,
mas a razão não é essa. -
9:44 - 9:46É porque alterámos a natureza do problema.
-
9:46 - 9:48Alterámos a natureza do problema.
-
9:48 - 9:50Em vez de tentarmos
aberta e explicitamente -
9:50 - 9:53explicar ao computador como guiar,
-
9:53 - 9:54dizemos:
-
9:54 - 9:56"Estão aqui os dados sobre o veículo.
-
9:56 - 9:58"Descobre lá como é.
-
9:58 - 9:59"Descobre que isto é um semáforo,
-
9:59 - 10:02"que a luz do semáforo
está vermelha e não verde, -
10:02 - 10:04"que isso significa que tens que parar
-
10:04 - 10:05"em vez de avançar".
-
10:06 - 10:08A aprendizagem da máquina está na base
-
10:08 - 10:10de muitas das coisas que fazemos "online".
-
10:10 - 10:12Por exemplo, motores de busca,
-
10:12 - 10:16algoritmo de personalização do Amazon,
-
10:16 - 10:18tradução por computador,
-
10:18 - 10:21sistemas de reconhecimento de voz.
-
10:22 - 10:25Recentemente, houve investigadores
-
10:25 - 10:28que analisaram a questão das biópsias,
-
10:28 - 10:30das biópsias relacionadas com cancros.
-
10:31 - 10:33Pediram ao computador para identificar,
-
10:33 - 10:36olhando para os dados
e as taxas de sobrevivência, -
10:36 - 10:38para determinar
-
10:38 - 10:42se as células eram cancerosas ou não.
-
10:43 - 10:45Claro que, quando lá meteram os dados,
-
10:45 - 10:47através dum algoritmo
de aprendizagem das máquinas, -
10:47 - 10:49a máquina foi capaz de identificar
-
10:49 - 10:51os 12 sinais reveladores
que melhor preveem -
10:51 - 10:55que naquela biopsia do cancro da mama
-
10:55 - 10:57as células são de facto cancerosas.
-
10:57 - 11:00Um problema: a literatura médica
-
11:00 - 11:02só conhecia nove desses sinais.
-
11:03 - 11:05Três dos sinais eram sinais
-
11:05 - 11:08que as pessoas não precisavam de procurar,
-
11:08 - 11:10mas a máquina detetou-os.
-
11:14 - 11:18Mas também há
o lado sombrio dos megadados. -
11:19 - 11:21Vai melhorar a nossa vida,
mas há problemas -
11:21 - 11:23de que temos que ter consciência.
-
11:24 - 11:26O primeiro é a ideia
-
11:26 - 11:29de que podemos ser punidos
por causa das previsões, -
11:29 - 11:33de que a polícia possa usar os megadados
para os seus objetivos, -
11:33 - 11:35um pouco como no "Minority Report".
-
11:36 - 11:38É um termo chamado
policiamento previsível, -
11:38 - 11:40ou criminologia algorítmica.
-
11:40 - 11:42A ideia é que, se tivermos muitos dados,
-
11:42 - 11:45por exemplo, sítios onde
ocorreram crimes no passado, -
11:45 - 11:47sabemos para onde enviar as patrulhas.
-
11:47 - 11:49Isso faz sentido, mas claro que o problema
-
11:49 - 11:52é que isso não vai parar
nos dados de localização, -
11:53 - 11:56vai descer ao nível do indivíduo.
-
11:56 - 11:58Porque é que não usamos dados
-
11:58 - 12:01sobre o historial universitário
das pessoas? -
12:01 - 12:03Podíamos usar o facto
de eles estarem empregados ou não, -
12:03 - 12:05o grau de confiança,
-
12:05 - 12:07o comportamento
de navegação na Internet, -
12:07 - 12:08se se deitam muito tarde.
-
12:08 - 12:12O seu Fitbit, quando conseguir
identificar bioquímicos, -
12:12 - 12:15mostrará que eles têm
pensamentos agressivos. -
12:15 - 12:18Podemos ter algoritmos
que poderão prever -
12:18 - 12:19o que estamos a pensar fazer,
-
12:19 - 12:21e podemos ser responsabilizados
-
12:21 - 12:23ainda antes de termos agido.
-
12:23 - 12:25A privacidade era o desafio central
-
12:25 - 12:28numa era de pequenos dados.
-
12:28 - 12:30Na era dos megadados,
-
12:30 - 12:35o desafio será
a salvaguarda da nossa vontade, -
12:35 - 12:38da escolha moral, da volição humana,
-
12:38 - 12:40da atividade humana.
-
12:43 - 12:45Há um outro problema:
-
12:45 - 12:48Os megadados vão roubar-nos trabalho.
-
12:48 - 12:53Os megadados e os algoritmos
vão pôr em causa o trabalho intelectual -
12:53 - 12:55de colarinho branco, dos profissionais
-
12:55 - 12:57no século XXI,
-
12:57 - 12:59tal como a automação das fábricas
-
12:59 - 13:01e as linhas de montagem
-
13:01 - 13:04puseram em causa o trabalho
dos operários no século XX. -
13:04 - 13:06Pensem num técnico de laboratório
-
13:06 - 13:09que observa ao microscópio
a biópsia dum cancro -
13:09 - 13:12e determina se é cancerosa ou não.
-
13:12 - 13:14Essa pessoa frequentou a universidade.
-
13:14 - 13:16Essa pessoa compra bens.
-
13:16 - 13:17Vota.
-
13:17 - 13:20É parte interessada da sociedade.
-
13:21 - 13:23Essa pessoa,
-
13:23 - 13:26assim como todo um grupo
de profissionais iguais a ela, -
13:26 - 13:29vai deparar-se com o seu trabalho
radicalmente alterado -
13:29 - 13:31ou totalmente eliminado.
-
13:32 - 13:33Gostamos de pensar
-
13:33 - 13:35que a tecnologia cria empregos
-
13:35 - 13:39depois de um curto período
temporário de transição. -
13:39 - 13:41Isso é verdade,
dentro do quadro de referência -
13:41 - 13:43em que todos vivemos
na Revolução Industrial -
13:43 - 13:46porque foi exatamente o que aconteceu.
-
13:46 - 13:48Mas esquecemos uma coisa nessa análise.
-
13:48 - 13:50Há algumas categorias de trabalhos
-
13:50 - 13:53que são eliminados e nunca mais voltam.
-
13:53 - 13:57A Revolução Industrial não foi
muito boa para os cavalos. -
13:59 - 14:02Portanto, vamos ter que ser cuidadosos,
-
14:02 - 14:05agarrar nos megadados
e ajustá-los às nossas necessidades, -
14:05 - 14:07às nossas necessidades humanas.
-
14:08 - 14:10Temos que ser os donos desta tecnologia
-
14:10 - 14:12e não os seus escravos.
-
14:12 - 14:15Estamos apenas no início
da era dos megadados. -
14:15 - 14:18Honestamente, não somos muito bons
-
14:18 - 14:21em manejar todos os dados
que conseguimos reunir atualmente. -
14:22 - 14:25Não é só um problema com a NSA.
-
14:25 - 14:28A indústria reúne muitos dados
e também os utiliza mal. -
14:28 - 14:32Precisamos de melhorar nisso,
mas isso vai levar tempo. -
14:32 - 14:34É um pouco como o desafio
-
14:34 - 14:36que os homens primitivos
enfrentaram com o fogo. -
14:36 - 14:38É uma ferramenta, mas é uma ferramenta
-
14:38 - 14:42que, se não tivermos cuidado,
pode-nos queimar. -
14:44 - 14:47Os megadados vão transformar
o modo como vivemos, -
14:47 - 14:50como trabalhamos e como pensamos.
-
14:50 - 14:52Vão ajudar-nos a gerir as nossas carreiras
-
14:52 - 14:56e a viver com satisfação e esperança,
-
14:56 - 14:58com felicidade e saúde.
-
14:59 - 15:02No passado, olhámos muitas vezes
para a tecnologia da informação -
15:02 - 15:04e os nossos olhos só viram o "T,"
-
15:04 - 15:06a Tecnologia, o equipamento,
-
15:06 - 15:08porque era o que era físico.
-
15:08 - 15:11Agora precisamos de focar
o nosso olhar no "I", -
15:11 - 15:12a Informação
-
15:12 - 15:14que é menos aparente,
-
15:14 - 15:16mas em certos aspetos,
muito mais importante. -
15:18 - 15:22A humanidade pode finalmente
aprender com as informações -
15:22 - 15:24que consegue reunir,
-
15:24 - 15:26faz parte
da nossa busca incansável -
15:26 - 15:29para entender o mundo
e o nosso lugar nele. -
15:29 - 15:33Por isso é que os megadados
são uma coisa importante. -
15:34 - 15:37(Aplausos)
- Title:
- Megadados são dados melhores
- Speaker:
- Kenneth Cukier
- Description:
-
Os carros autoguiados foram apenas o começo. Qual é o futuro da tecnologia e do "design" impulsionados pelos megadados? Numa palestra de ciência emocionante, Kenneth Cukier olha para o futuro da aprendizagem das máquinas — e do conhecimento humano.
- Video Language:
- English
- Team:
- closed TED
- Project:
- TEDTalks
- Duration:
- 15:51
Margarida Ferreira edited Portuguese subtitles for Big data is better data | ||
Margarida Ferreira edited Portuguese subtitles for Big data is better data | ||
Margarida Ferreira edited Portuguese subtitles for Big data is better data | ||
Margarida Ferreira approved Portuguese subtitles for Big data is better data | ||
Margarida Ferreira edited Portuguese subtitles for Big data is better data | ||
Margarida Ferreira edited Portuguese subtitles for Big data is better data | ||
Hamilton Abreu accepted Portuguese subtitles for Big data is better data | ||
Hamilton Abreu edited Portuguese subtitles for Big data is better data |