A torta preferida dos americanos é? Plateia: Maçã Kenneth Cukier: Maçã. Claro que sim. Como sabemos isso? Por causa dos dados. Vejam as vendas dos supermercados. Vejam as vendas das tortas congeladas de 30 cm, a de maçã vence, sem dúvida. A maioria das vendas são de maçã. Mas então os supermercados começaram a vender tortas menores, de 11 cm, e, de repente, a de maçã caiu para o quarto ou quinto lugar. Por quê? O que aconteceu? Certo, pensem bem. Quando você compra uma torta de 30 cm, a família toda tem que aceitar, e a de maçã é a segunda mais favorita de todos. (Risos) Mas quando você compra uma torta individual de 11 cm, você pode comprar a que quiser. Você pode comprar a sua primeira opção. Você tem mais dados. Pode ver algo que você não via, quando tinha menos informação. A questão aqui é que mais dados não nos permite apenas ver mais daquilo que já tínhamos antes. Mais dados nos permitem ver coisas novas. Permitem-nos ver melhor. Permitem-nos ver de forma diferente. Neste caso, permitem-nos ver qual é a torta favorita dos EUA: não é a de maçã. Vocês já devem ter ouvido o termo "megadados". Na verdade, já devem estar fartos de ouvir o termo "megadados". É verdade, há muitos exageros associados ao termo, e isso é lamentável, porque os megadados são uma ferramenta extremamente importante pela a qual a sociedade vai avançar. No passado, olhávamos para os dados pequenos e pensávamos no que significaria tentar entender o mundo, e agora nós temos muito mais dados, como jamais tivemos antes. O que vemos é que quando temos um grande volume de dados, podemos fazer coisas que não podíamos fazer quando só havia quantidades pequenas. Megadados são importantes, e megadados são novidade, e quando se pensa nisso, o único jeito deste planeta lidar com os desafios globais– alimentar as pessoas, provê-las com cuidados médicos, provê-las com energia, eletricidade, e assegurar que não ficaremos "tostados" com o aquecimento global – será com a utilização de dados de forma eficaz. Então, o que há de novo sobre megadados? Bom, para responder isso, vamos pensar em como informação era, fisicamente, no passado. Em 1908, na ilha de Creta, arqueólogos descobriram um disco de argila, que foi datado de 2000 A.C., então são 4 mil anos de idade. Há inscrições no disco, mas não sabemos o que significam. É um completo mistério, mas o detalhe é que era assim que a informação parecia 4 mil anos atrás. Era assim que a sociedade armazenava e transmitia informação. Hoje, sociedades não avançaram tanto assim. Ainda armazenamos informação em discos, mas hoje podemos guardar muito mais informação, mais do que podíamos antes. Buscar é mais fácil. Copiar é mais fácil. Compartilhar é mais fácil. Processar é mais fácil. E podemos reutilizar essa informação para usos que não imaginávamos quando coletamos os dados pela primeira vez Neste contexto, os dados mudaram de um estoque para um fluxo, de algo estacionário e estático para algo que é fluido e dinâmico. Existe um tipo de "liquidez" na informação. O disco descoberto em Creta, de 4 mil anos de idade, é pesado, ele não armazena muita informação, e a informação não é modificável. Em contraste, todos os arquivos que Edward Snowden levou da Agência de Segurança Nacional dos Estados Unidos cabem em um pen drive do tamanho de uma unha, e podem ser compartilhado à velocidade da luz. Mais dados. Mais. Agora, uma explicação de termos tantos dados hoje é que estamos coletando coisas sobre as quais sempre coletamos informação. Mas uma outra razão é que estamos pegando coisas, que sempre foram informacionais mas não estavam em formato de dados, e agora estão sendo transformados em dados. Vejam, por exemplo, a questão da localização. Vejam, por exemplo, Martinho Lutero. Se quiséssemos saber, nos anos 1500, onde Martinho Lutero estava, teríamos que segui-lo o tempo todo, talvez com uma pena e um tinteiro, e fazer registros, e agora veja como isso é hoje. Sabemos que em algum lugar, talvez num banco de dados de operadora de telefonia, há uma planilha, ou ao menos um registro em banco de dados gravando sua informação de onde você esteve, a todo momento. Se você tem um celular, com um GPS, mas mesmo que não tenha um GPS, ele pode registrar sua informação. Neste contexto, a localização foi transformada em dados. Vejam, por exemplo, a questão da postura, como vocês estão se sentando agora, o modo como você se senta, o modo como você se senta. São todos diferentes, e é uma função dos comprimentos das pernas e do contorno das suas costas, e seu eu colocasse censores, talvez 100 censores nas cadeiras de todos aqui agora, eu poderia criar um índice único para cada um de vocês, como uma impressão digital, mas não é do seu dedo. Então, o que poderíamos fazer com isso? Pesquisadores em Tóquio estão usando isso como um potencial dispositivo anti-roubo para carros. A ideia é que o ladrão senta ao volante, tenta ligar, mas o carro reconhece que um motorista não autorizado está ao volante, e talvez o motor pare, a não ser que você digite uma senha no painel para dizer: "Ei, eu tenho autorização para dirigir". Ótimo. E se todos os carros na Europa usassem esta tecnologia? O que poderíamos fazer? Talvez, se agregássemos os dados, talvez pudéssemos identificar sinais que indicassem se um acidente de carro irá acontecer nos próximos 5 segundos. E então, o que teremos transformados em dados, é fatiga do motorista, e o serviço seria, quando o carro sente que a pessoa assume aquela posição, automaticamente ativar um alarme interno que faria o volante vibrar, emitir um som, como se dissesse: "Ei, acorda, presta mais atenção na estrada." Essas são as coisas que podemos fazer quando convertemos em dados mais aspectos das nossas vidas. Então, qual o valor dos megadados? Pensem bem. Temos mais informação. Podemos fazer coisas que não podíamos antes. Uma das áreas mais impressionantes em que este conceito está ocorrendo é na área do aprendizado de máquina. O aprendizado de máquina é um ramo da inteligência artificial, que, por sua vez, é um ramo da ciência da computação. A idéia geral é que em vez de instruir um computador sobre o que fazer, nós simplesmente jogamos dados no problema e dizemos ao computador que resolva sozinho. Conhecer as origens disso ajudará vocês a entenderem. Por volta de 1950, um cientista da computação da IBM, Arthur Samuel, gostava de jogar damas, ele então criou um programa para que pudesse jogar contra o computador. Ele jogou. Ele ganhou. Ele jogou. Ele ganhou. Ele jogou. Ele ganhou, porque o computador só sabia o que era uma jogada legal. Arthur Samuel sabia algo mais. Arthur Samuel sabia sobre estratégia. Ele então criou um pequeno sub-programa, operando em segundo plano, e tudo que ele fazia era calcular a probabilidade que uma dada configuração do tabuleiro pudesse levar a um jogo vencedor contra um perdedor, após cada movimento. Ele joga contra o computador. Ele ganha. Ele joga contra o computador. Ele ganha. Ele joga contra o computador. Ele ganha. Então Arthur Samuel deixou o computador jogar contra ele mesmo. Ele joga com ele mesmo. Coleta mais dados. Coleta mais dados. A precisão de sua predição aumenta. Arthur Samuel volta ao computador ele joga, e ele perde, ele joga, e ele perde, ele joga, e ele perde, e Arthur Samuel criou uma máquina que supera sua habilidade em uma tarefa que ele mesmo ensinou. Essa ideia de aprendizagem de máquina estará em todas as partes. Como vocês acham que funcionam os carros auto-dirigidos? Será que estamos melhores como uma sociedade, colocando todas as regras de trânsito em um software? Não. A memória está mais barata. Não. Os algoritmos são mais rápidos. Não. Os processadores são melhores. Não. Tudo isso é importante, mas não é o principal. O essencial é que modificamos a natureza do problema. Mudamos o problema de um em que tentávamos aberta e explicitamente, explicar ao computador como dirigir, para um em que dizemos: "Aqui temos um monte de dados sobre o veículo. Resolva. Descubra se aquilo é um semáforo, se a luz é vermelha e não verde, que isso significa que você tem que parar e não ir adiante." A aprendizagem de máquina é a base de muita coisa que fazemos online: Motores de busca, algoritmos de personalização da Amazon, tradução automática, sistemas de reconhecimento de voz. Pesquisadores recentemente examinaram a questão das biópsias, biópsias de câncer, e pediram para o computador para identificar, olhando os dados e taxas de sobrevivência para determinar se as células são cancerosas ou não, e, certamente, alimentando os dados em um algoritmo de aprendizagem de máquina, a máquina foi capaz de identificar os 12 sinais que melhor predizem que nesta biópsia, as células da mama são realmente cancerosas. O problema: a literatura médica só conhecia nove deles. Três das características eram traços que as pessoas não tinham necessidade de procurar, mas o computador detectou. Mas também há o lado sombrio dos megadados. Eles vão melhorar nossas vidas, mas há problemas dos quais devemos estar cientes. O primeiro é que possamos ser punidos por causa das previsões; que a polícia poderá usar megadados para seus propósitos, um pouco como "Minority Report". Atualmente, é um termo chamado "policiamento preditivo", ou criminologia algorítmica. A ideia é que, se tivermos muitos dados, digamos, onde um crime ocorreu no passado, sabemos para onde enviar as patrulhas. Isso faz sentido, mas o problema, claro, é que isso não vai parar só nos dados de localização, vai chegar ao nível do indivíduo. Por que não usar os dados do histórico escolar das pessoas? Talvez usar o fato de estarem desempregadas, ou não, usar sua pontuação de crédito, sua conduta na Internet, se ficam acordadas de noite. Seus Fitbits, quando puderem identificar dados bioquímicos, mostrarão se têm pensamentos agressivos. Poderemos ter algoritmos que poderão prever o que estamos prestes a fazer. e poderemos ser incriminados mesmo antes de agirmos. A privacidade era o desafio principal na era dos pequenos dados. Na fase dos megadados, o desafio será salvaguardar nosso livre arbítrio, escolha moral, volição humana, e atuação humana. Há um outro problema: Os megadados vão roubar nossos empregos. Megadados e algoritmos desafiarão o conhecimento profissional dos funcionários do século 21, da mesma forma que a automação das fábricas e as linhas de produção desafiaram o trabalho dos operários no século 20. Imagine um técnico de laboratório examinando ao microscópio uma biópsia do câncer, decidindo se é maligno ou não. Esta pessoa frequentou faculdade. Ela compra um imóvel. Vota. É parte interessada da sociedade. E o seu emprego, assim como o de toda uma frota de profissionais, vão ver que seus empregos mudarão radicalmente ou, de fato, serão completamente extintos. Agora, gostamos de pensar que a tecnologia cria empregos durante um período tempo após um período de transição curto, temporário. Isso é verdade para o quadro de referência com o qual vivemos, a Revolução Industrial, porque foi exatamente o que ocorreu. Mas esquecemos algo nessa análise: Há certas categorias de empregos que simplesmente são eliminados e não voltam nunca. A Revolução Industrial não foi muito boa para os cavalos. Portanto precisamos ser cautelosos, e pegar os megadados e ajustá-los às nossas necessidades, às nossas necessidades humanas. Temos que ser os mestres desta tecnologia, e não seus criados. Estamos apenas no início da era dos megadados, e, honestamente, não somos muito bons em manejar todos dados que agora podemos coletar. O problema não é só para a Agência Segurança Nacional dos EUA. Empresas coletam muitos dados e também fazem mal uso deles, e precisamos melhorar nisso, o que levará tempo É um pouco como o desafio que os homens primitivos enfrentaram com o fogo. É uma ferramenta, mas é uma ferramenta que, se não tivermos cuidado, vai nos queimar. Megadados vão transformar o modo como vivemos, como trabalhamos e como pensamos. Vão ajudar no gerenciamento de nossas carreiras, e viver satisfeitos, com esperança, felizes e saudáveis, mas no passado muitas vezes olhávamos para a Tecnologia da Informação mas nossos olhos só viam o 'T', a tecnologia, o hardware, porque era a parte física. Agora precisamos colocar nossa atenção no 'I', de informação, que é menos tangível. mas em certos aspectos muito mais importante. A humanidade pode finalmente aprender a partir da informação que ela pode coletar, como parte da nossa eterna busca pelo entendimento do mundo e do nosso lugar nele, e é por isso que os megadados são importantes. (Aplausos)