WEBVTT 00:00:01.114 --> 00:00:08.606 Ao longo dos últimos séculos, microscópios revolucionaram nosso mundo. 00:00:09.036 --> 00:00:14.252 Eles nos revelaram um mundo minúsculo de objetos, vida e estruturas 00:00:14.252 --> 00:00:17.028 que são pequenos demais para vermos a olho nu. 00:00:17.028 --> 00:00:19.930 Eles são uma enorme contribuição para a ciência e tecnologia. 00:00:19.930 --> 00:00:23.164 Hoje eu gostaria de apresentá-los à um novo tipo de microscópio, 00:00:23.164 --> 00:00:25.766 um microscópio que amplifica mudanças. 00:00:25.766 --> 00:00:28.500 Ele não usa ótica, como um microscópio comum, 00:00:28.500 --> 00:00:30.771 para aumentar pequenos objetos, 00:00:30.771 --> 00:00:35.257 mas em vez disso, usa uma câmera de vídeo e processamento de imagem 00:00:35.257 --> 00:00:40.513 para nos revelar os movimentos ínfimos e mudanças de cor em objetos e pessoas, 00:00:40.513 --> 00:00:44.355 mudanças que são impossíveis de serem vistas a olhos nus. 00:00:44.355 --> 00:00:48.095 E isso permite-nos olhar o nosso mundo de uma forma totalmente nova. 00:00:48.095 --> 00:00:50.525 Então, o que quero dizer com alterações de cor? 00:00:50.525 --> 00:00:53.207 Nossa pele, por exemplo, muda de cor muito ligeiramente 00:00:53.207 --> 00:00:55.214 quando o sangue flui sob ela. 00:00:55.214 --> 00:00:57.611 Essa mudança é incrivelmente sutil, 00:00:57.611 --> 00:00:59.674 por isso quando você vê outras pessoas, 00:00:59.674 --> 00:01:01.925 quando olha para a pessoa sentada ao seu lado, 00:01:01.925 --> 00:01:05.500 você não vê sua pele ou seu rosto mudando de cor. 00:01:05.500 --> 00:01:09.860 Quando vemos este vídeo do Steve aqui, a aparência é de uma imagem estática, 00:01:09.860 --> 00:01:13.460 mas quando vemos o vídeo através do nosso novo e especial microscópio, 00:01:13.460 --> 00:01:16.320 de repente, vemos uma imagem completamente distinta. 00:01:16.320 --> 00:01:20.250 O que veem aqui são pequenas mudanças na cor da pele do Steve, 00:01:20.250 --> 00:01:24.256 ampliadas 100 vezes, de modo que se tornam visíveis. 00:01:24.256 --> 00:01:27.393 Na verdade, podemos ver um pulso humano. 00:01:27.393 --> 00:01:30.940 Podemos ver o quão rápido o coração de Steve está batendo, 00:01:30.940 --> 00:01:36.535 mas também podemos ver a forma real com que o sangue flui em seu rosto. 00:01:36.544 --> 00:01:39.175 E podemos fazer isso não só para visualizar o pulso, 00:01:39.175 --> 00:01:44.039 mas também para efetivamente extrair e medir a frequência cardíaca, 00:01:44.039 --> 00:01:48.892 E podemos fazer isso com câmeras comuns e sem tocar nos pacientes. 00:01:48.892 --> 00:01:54.339 Aqui vemos o pulso e frequência cardíaca que extraímos de um bebê recém-nascido 00:01:54.339 --> 00:01:57.390 a partir um vídeo feito com uma câmera DSLR comum, 00:01:57.390 --> 00:01:59.206 e a frequência cardíaca que obtemos 00:01:59.206 --> 00:02:03.757 é tão precisa quanto aquela de um monitor padrão de hospital. 00:02:03.757 --> 00:02:06.329 E nem precisa ser um vídeo que gravamos. 00:02:06.329 --> 00:02:09.514 Podemos essencialmente fazê-lo com outros vídeos também. 00:02:09.514 --> 00:02:13.295 Então, peguei um pequeno clipe de "Batman Begins" aqui, 00:02:13.295 --> 00:02:15.459 só para mostrar o pulso de Christian Bale. 00:02:15.459 --> 00:02:17.101 (Risos) 00:02:17.101 --> 00:02:19.204 E presumivelmente, ele está usando maquiagem, 00:02:19.204 --> 00:02:21.277 iluminação aqui é um pouco desafiadora, 00:02:21.277 --> 00:02:24.208 mesmo assim, a partir do vídeo, podemos extrair seu pulso 00:02:24.208 --> 00:02:26.186 e mostrá-lo muito bem. 00:02:26.186 --> 00:02:28.136 Então, como fazemos isso? 00:02:28.136 --> 00:02:32.374 Basicamente analisamos as mudanças na luz que é gravada 00:02:32.374 --> 00:02:34.975 em cada pixel do vídeo, ao longo do tempo, 00:02:34.975 --> 00:02:36.713 e depois aumentamos essas mudanças. 00:02:36.713 --> 00:02:39.075 Tornamos elas maiores para que possamos vê-las. 00:02:39.075 --> 00:02:40.977 A parte complicada é que esses sinais, 00:02:40.977 --> 00:02:43.910 essas mudanças que queremos ver, são extremamente sutis, 00:02:43.910 --> 00:02:46.689 por isso temos que ter muito cuidado ao separá-las do ruído 00:02:46.689 --> 00:02:49.900 que sempre existe em vídeos. 00:02:49.900 --> 00:02:53.515 Então, usamos algumas técnicas inteligentes de processamento de imagem 00:02:53.515 --> 00:02:57.509 para obter uma medida muito precisa da cor de cada pixel no vídeo, 00:02:57.509 --> 00:03:00.179 e em seguida, a forma como a cor muda ao longo do tempo, 00:03:00.179 --> 00:03:02.872 e então amplificamos essas mudanças. 00:03:02.872 --> 00:03:06.852 Tornamo-as maiores para criar esses tipos de vídeos melhorados, ou ampliados, 00:03:06.852 --> 00:03:09.024 que realmente nos mostram essas mudanças. 00:03:09.024 --> 00:03:13.262 Acontece que podemos fazer isso não apenas para mostrar pequenas mudanças de cor, 00:03:13.262 --> 00:03:15.503 mas também pequenos movimentos, 00:03:15.503 --> 00:03:19.079 e isso é porque a luz que fica gravada em nossas câmeras 00:03:19.079 --> 00:03:21.729 muda não somente com a cor do objeto, 00:03:21.729 --> 00:03:24.077 mas também quando o objeto se move. 00:03:24.077 --> 00:03:27.893 Então, esta é a minha filha quando tinha cerca de dois meses de idade. 00:03:27.893 --> 00:03:30.782 É um vídeo que gravei há cerca de três anos atrás. 00:03:30.782 --> 00:03:34.360 E como pais iniciantes, todos queremos que nossos bebês estejam saudáveis, 00:03:34.360 --> 00:03:36.372 respirando, e que estejam vivos, é claro. 00:03:36.372 --> 00:03:38.784 Então, eu também tinha um desses monitores de bebê 00:03:38.784 --> 00:03:41.223 para ver minha filha enquanto estava dormindo. 00:03:41.223 --> 00:03:44.780 E isso é o que você verá com um monitor de bebê padrão. 00:03:44.780 --> 00:03:48.214 Vocês podem ver o bebê dormindo, mas não há muita informação aí. 00:03:48.214 --> 00:03:49.708 Não há muito que podemos ver. 00:03:49.708 --> 00:03:52.672 Não seria melhor, ou mais informativo, ou mais útil, 00:03:52.672 --> 00:03:55.732 se em vez disso pudéssemos observar a cena assim. 00:03:55.732 --> 00:04:01.808 Aqui eu ampliei os movimentos em 30 vezes, 00:04:01.808 --> 00:04:06.074 então pude ver claramente que minha filha estava realmente viva e respirando. 00:04:06.074 --> 00:04:08.327 (Risos) 00:04:08.327 --> 00:04:10.249 Aqui está uma comparação lado-a-lado. 00:04:10.249 --> 00:04:12.732 Novamente, no vídeo de origem, no vídeo original, 00:04:12.732 --> 00:04:14.158 Não há muito que podemos ver, 00:04:14.158 --> 00:04:18.075 mas uma vez que aumentamos os movimentos, a respiração torna-se muito mais visível. 00:04:18.075 --> 00:04:20.144 E acontece que, há muitos fenômenos 00:04:20.144 --> 00:04:23.768 que podemos revelar e ampliar com o nosso novo microscópio de movimento. 00:04:23.768 --> 00:04:28.072 Podemos ver como nossas veias e artérias estão pulsando em nossos corpos. 00:04:28.072 --> 00:04:30.960 Podemos ver que nossos olhos estão em constante movimento 00:04:30.960 --> 00:04:32.847 nesse padrão cambaleante. 00:04:32.847 --> 00:04:34.356 Isso é na verdade o meu olho, 00:04:34.356 --> 00:04:37.261 e esse vídeo foi feito logo depois que minha filha nasceu, 00:04:37.261 --> 00:04:41.623 então vocês podem ver que eu não estava dormindo muito. (Risos) 00:04:41.623 --> 00:04:44.339 Até mesmo quando uma pessoa está parada, 00:04:44.339 --> 00:04:46.383 há muita informação que podemos extrair 00:04:46.383 --> 00:04:49.552 dos seus padrões de respiração e pequenas expressões faciais. 00:04:49.552 --> 00:04:51.537 Talvez pudéssemos usar esses movimentos 00:04:51.537 --> 00:04:54.691 para nos dizer algo sobre nossos pensamentos ou emoções. 00:04:54.691 --> 00:04:57.606 Também podemos ampliar pequenos movimentos mecânicos, 00:04:57.606 --> 00:04:59.251 como vibrações em motores, 00:04:59.251 --> 00:05:02.963 que podem ajudar engenheiros a detectar e diagnosticar problemas em máquinas, 00:05:02.963 --> 00:05:07.931 ou ver como nossos edifícios e estruturas balançam ao vento e reagem às forças. 00:05:07.931 --> 00:05:12.312 Essas são coisas que a nossa sociedade sabe como medir de várias maneiras, 00:05:12.312 --> 00:05:14.965 mas medir esses movimentos é uma coisa, 00:05:14.965 --> 00:05:17.241 e ver esses movimentos enquanto eles acontecem 00:05:17.241 --> 00:05:19.795 é algo totalmente diferente. 00:05:19.795 --> 00:05:22.836 E desde que descobrimos essa nova tecnologia, 00:05:22.836 --> 00:05:26.789 divulgamos o nosso código online para que outros pudessem usar e experimentar. 00:05:26.789 --> 00:05:28.664 É muito simples de usar. 00:05:28.664 --> 00:05:30.708 Pode funcionar em seus próprios vídeos. 00:05:30.708 --> 00:05:33.691 Nossos colaboradores na Quantum Research criaram este belo site 00:05:33.691 --> 00:05:36.699 onde vocês podem fazer o upload de vídeos e processá-los online, 00:05:36.699 --> 00:05:40.395 e mesmo que não tenham experiência em ciência da computação ou programação, 00:05:40.395 --> 00:05:43.421 ainda podem facilmente experimentar esse novo microscópio. 00:05:43.421 --> 00:05:45.745 E eu gostaria de mostrar-lhes alguns exemplos 00:05:45.745 --> 00:05:48.470 do que as pessoas fizeram com ele. 00:05:48.470 --> 00:05:53.657 Este vídeo foi feito por um usuário do YouTube chamado Tamez85. 00:05:53.657 --> 00:05:55.250 Eu não sei quem é esse usuário, 00:05:55.250 --> 00:05:57.595 mas ele, ou ela, usou o nosso código 00:05:57.595 --> 00:06:01.150 para ampliar pequenos movimentos da barriga durante a gravidez. 00:06:01.150 --> 00:06:02.802 É meio assustador. 00:06:02.802 --> 00:06:04.525 (Risos) 00:06:04.525 --> 00:06:09.486 Pessoas ampliaram as veias em suas mãos. 00:06:09.486 --> 00:06:13.268 E sabemos que não é ciência de verdade a menos que se use cobaias, 00:06:13.268 --> 00:06:16.508 e, aparentemente, esta cobaia se chama Tiffany, 00:06:16.508 --> 00:06:19.607 e esse usuário do YouTube diz que ela é o primeiro roedor na Terra 00:06:19.607 --> 00:06:22.295 a ter os movimentos ampliados. 00:06:22.295 --> 00:06:24.483 Você também pode fazer arte. 00:06:24.483 --> 00:06:27.421 Este vídeo me foi enviado por uma estudante de design em Yale. 00:06:27.421 --> 00:06:29.338 Ela queria ver se há alguma diferença 00:06:29.338 --> 00:06:31.680 na forma como seus colegas de classe se movem. 00:06:31.680 --> 00:06:35.369 Ela fez com que todos ficassem parados, então ampliou seus movimentos. 00:06:35.369 --> 00:06:38.747 É como ver fotografias ganharem vida. 00:06:38.747 --> 00:06:41.180 E a coisa legal nesses exemplos 00:06:41.180 --> 00:06:43.476 é que não tivemos nada a ver com eles. 00:06:43.476 --> 00:06:47.330 Nós apenas provemos essa nova ferramenta, uma nova maneira de olhar o mundo, 00:06:47.330 --> 00:06:52.462 e então as pessoas acham outras formas interessantes e criativas de usá-la. 00:06:52.462 --> 00:06:54.226 Mas não paramos por aí. 00:06:54.226 --> 00:06:57.477 Esta ferramenta não só nos permite ver o mundo de uma nova maneira, 00:06:57.477 --> 00:07:01.305 ela também redefine e expande os limites do que podemos fazer 00:07:01.305 --> 00:07:02.886 com nossas câmeras. 00:07:02.886 --> 00:07:05.255 Então, como cientistas, começamos a nos perguntar, 00:07:05.255 --> 00:07:09.040 quais outros tipos de fenômenos físicos produzem pequenos movimentos 00:07:09.040 --> 00:07:11.943 que podemos usar nossas câmeras para medir? 00:07:11.943 --> 00:07:15.944 Um desses fenômenos no qual recentemente nos concentramos é o som. 00:07:15.944 --> 00:07:18.049 O som, como sabemos, é basicamente mudanças 00:07:18.049 --> 00:07:20.232 de pressão se propagam no ar. 00:07:20.232 --> 00:07:23.853 Essas ondas de pressão batem em objetos e criam pequenas vibrações neles, 00:07:23.853 --> 00:07:26.385 é assim que ouvimos e gravamos o som. 00:07:26.385 --> 00:07:30.053 Mas acontece que o som também produz movimentos visuais. 00:07:30.053 --> 00:07:32.666 Esses movimentos não são visíveis para nós, 00:07:32.666 --> 00:07:35.507 mas são visíveis para uma câmera com o tratamento correto. 00:07:35.507 --> 00:07:37.260 Então, aqui estão dois exemplos. 00:07:37.260 --> 00:07:40.994 Esse sou eu demonstrando minhas grandes habilidades de canto. 00:07:41.064 --> 00:07:42.698 (Cantando) 00:07:42.698 --> 00:07:43.944 (Risos) 00:07:43.944 --> 00:07:47.250 Fiz um vídeo em câmera lenta da minha garganta enquanto cantava. 00:07:47.250 --> 00:07:49.324 Novamente, se vocês olharem para o vídeo, 00:07:49.324 --> 00:07:50.960 não há muito que conseguirão ver, 00:07:50.960 --> 00:07:55.132 mas ao ampliarmos os movimentos 100 vezes, vemos todos os movimentos e ondulações 00:07:55.132 --> 00:07:58.566 do pescoço que estão envolvidos na produção do som. 00:07:58.566 --> 00:08:01.306 Esse sinal está alí naquele vídeo. 00:08:01.306 --> 00:08:03.726 Também sabemos que cantores podem quebrar uma taça 00:08:03.726 --> 00:08:05.439 se atingirem a nota correta. 00:08:05.439 --> 00:08:07.064 Aqui, vamos tocar uma nota 00:08:07.064 --> 00:08:09.730 que está em ressonância com a frequência da taça 00:08:09.730 --> 00:08:12.038 através de um alto-falante que está ao lado dela. 00:08:12.038 --> 00:08:16.197 Uma vez que tocamos essa nota e ampliamos os movimentos 250 vezes, 00:08:16.197 --> 00:08:18.535 podemos ver muito claramente como o vidro vibra 00:08:18.535 --> 00:08:22.105 e ressoa em resposta ao som. 00:08:22.105 --> 00:08:24.295 Não é algo que vemos todos os dias. 00:08:24.295 --> 00:08:28.054 Mas isso nos fez pensar. Isso nos deu uma ideia maluca. 00:08:28.054 --> 00:08:33.662 Será que podemos inverter este processo e recuperar o som a partir do vídeo 00:08:33.662 --> 00:08:37.697 através da análise de minúsculas vibrações que as ondas sonoras criam em objetos, 00:08:37.697 --> 00:08:42.474 e, essencialmente, convertê-las de volta para os sons que as produziram? 00:08:42.474 --> 00:08:46.931 Desta forma, podemos transformar objetos do cotidiano em microfones. 00:08:46.931 --> 00:08:49.163 Então, isso é exatamente o que fizemos. 00:08:49.163 --> 00:08:51.979 Aqui está um saco de batatas vazio que estava em uma mesa, 00:08:51.979 --> 00:08:54.684 e vamos transformar esse saco de batatas em um microfone 00:08:54.684 --> 00:08:56.335 filmando-o com uma câmera de vídeo 00:08:56.335 --> 00:08:59.623 e analisando os mínimos movimentos que as ondas sonoras criam nele. 00:08:59.623 --> 00:09:02.419 Aqui está o som que tocamos no quarto. 00:09:02.419 --> 00:09:09.707 (Música: "Mary Had a Little Lamb") 00:09:09.707 --> 00:09:13.272 E este é um vídeo em alta velocidade desse saco de batatas fritas. 00:09:13.272 --> 00:09:14.656 A música está tocando. 00:09:14.656 --> 00:09:17.228 Não há como vocês verem nada acontecendo nesse vídeo 00:09:17.228 --> 00:09:18.476 somente olhando para ele, 00:09:18.476 --> 00:09:21.970 mas aqui está o som que conseguimos recuperar apenas por meio da análise 00:09:21.970 --> 00:09:23.873 dos minúsculos movimentos no vídeo. 00:09:23.873 --> 00:09:29.535 (Música: "Mary Had a Little Lamb") 00:09:40.475 --> 00:09:42.471 Eu chamo isso de... Obrigado. 00:09:42.471 --> 00:09:47.696 (Aplausos) 00:09:49.388 --> 00:09:52.053 Eu chamo isso de microfone visual. 00:09:52.053 --> 00:09:55.473 Nós realmente extraímos sinais de áudio a partir de sinais de vídeo. 00:09:55.473 --> 00:09:58.794 E só para dar-lhes um sentido da escala dos movimentos aqui, 00:09:58.799 --> 00:10:03.885 um som bem alto fará com que o saco de batatas se mova menos de um micrômetro. 00:10:03.885 --> 00:10:06.874 Isso é um milésimo de um milímetro. 00:10:06.874 --> 00:10:10.435 Esses são os movimentos minúsculos que agora somos capazes de obter 00:10:10.435 --> 00:10:13.678 apenas observando como a luz rebate em objetos 00:10:13.678 --> 00:10:15.814 e é gravada por nossas câmeras. 00:10:15.814 --> 00:10:19.064 Podemos recuperar sons a partir de outros objetos, tais como plantas. 00:10:19.064 --> 00:10:25.040 (Música: "Mary Had a Little Lamb") 00:10:27.214 --> 00:10:29.211 E podemos recuperar falas também. 00:10:29.211 --> 00:10:31.708 Então aqui está uma pessoa falando em um quarto. 00:10:31.708 --> 00:10:35.991 Voz (em inglês): Mary had a little lamb whose fleece was white as snow, 00:10:35.991 --> 00:10:40.221 and everywhere that Mary went, that lamb was sure to go. 00:10:40.221 --> 00:10:42.980 Michael Rubinstein: E aqui está a fala recuperada 00:10:42.980 --> 00:10:46.254 a partir desse mesmo vídeo do batatas fritas. 00:10:46.254 --> 00:10:51.085 Voz (em inglês): Mary had a little lamb whose fleece was white as snow, 00:10:51.085 --> 00:10:55.644 and everywhere that Mary went, that lamb was sure to go. 00:10:55.644 --> 00:10:58.290 MR: Usamos "Mary Had a Little Lamb" 00:10:58.290 --> 00:11:00.993 porque acredita-se que foram as primeiras palavras 00:11:00.993 --> 00:11:04.574 que Thomas Edison falou em seu fonógrafo em 1877. 00:11:04.574 --> 00:11:07.802 Ele foi um dos primeiros gravadores de som na história. 00:11:07.802 --> 00:11:11.129 Ele basicamente direcionava o som para um diafragma 00:11:11.129 --> 00:11:15.008 que vibrava uma agulha que, basicamente, gravava o som em papel alumínio 00:11:15.008 --> 00:11:17.483 enrolado em torno de um cilindro. 00:11:17.483 --> 00:11:23.086 Aqui está uma demonstração de gravação e reprodução de som no fonógrafo de Edison: 00:11:23.086 --> 00:11:26.236 (Video) Voz: Testando, testando, um, dois, três. 00:11:26.236 --> 00:11:29.859 Mary had a little lamb whose fleece was white as snow, 00:11:29.859 --> 00:11:33.528 and everywhere that Mary went, the lamb was sure to go. 00:11:33.528 --> 00:11:36.268 Testando, testando, um, dois, três. 00:11:36.268 --> 00:11:40.424 Mary had a little lamb whose fleece was white as snow, 00:11:40.424 --> 00:11:45.648 and everywhere that Mary went, the lamb was sure to go. 00:11:45.648 --> 00:11:49.665 MR: E agora, 137 anos depois, 00:11:49.665 --> 00:11:53.752 somos capazes de obter som praticamente com a mesma qualidade 00:11:53.752 --> 00:11:57.831 apenas observando objetos vibrando ao som com câmeras, 00:11:57.831 --> 00:11:59.765 e podemos fazer isso mesmo com a câmera 00:11:59.765 --> 00:12:03.999 a 4,5 metros de distância do objeto, e atrás de um vidro à prova de som. 00:12:03.999 --> 00:12:07.219 Este é o som que conseguimos recuperar nesse caso. 00:12:07.219 --> 00:12:12.513 Voz: Mary had a little lamb whose fleece was white as snow, 00:12:12.513 --> 00:12:17.272 and everywhere that Mary went, the lamb was sure to go. 00:12:17.404 --> 00:12:21.034 MR: E, claro, vigilância é a primeira aplicação que vem em mente. 00:12:21.034 --> 00:12:24.029 (Risos) 00:12:24.029 --> 00:12:28.085 Mas isso pode ser realmente útil para outras coisas também. 00:12:28.085 --> 00:12:30.925 Talvez no futuro, sejamos capazes para usá-lo, por exemplo, 00:12:30.925 --> 00:12:33.177 para recuperar som através do espaço, 00:12:33.177 --> 00:12:36.753 porque o som não pode viajar no espaço, mas a luz pode. 00:12:36.753 --> 00:12:39.157 Nós apenas começamos a explorar 00:12:39.157 --> 00:12:41.746 outros usos possíveis para esta nova tecnologia. 00:12:41.746 --> 00:12:45.008 Ela nos permite ver processos físicos que sabemos que estão lá 00:12:45.008 --> 00:12:48.564 mas que nunca pudemos ver com nossos próprios olhos até agora. 00:12:48.564 --> 00:12:49.768 Esta é a nossa equipe. 00:12:49.768 --> 00:12:52.567 Tudo o que eu mostrei hoje é o resultado de uma colaboração 00:12:52.567 --> 00:12:55.188 com este incrível grupo de pessoas que vocês veem aqui, 00:12:55.188 --> 00:12:58.005 e encorajo e convido vocês a conhecerem nosso site, 00:12:58.005 --> 00:12:59.451 experimentá-lo vocês mesmos, 00:12:59.451 --> 00:13:02.933 e se juntarem a nós na exploração desse mundo de pequenos movimentos. 00:13:02.933 --> 00:13:04.048 Obrigado. 00:13:04.048 --> 00:13:05.302 (Aplausos)