WEBVTT
00:00:01.114 --> 00:00:08.606
Ao longo dos últimos séculos,
microscópios revolucionaram nosso mundo.
00:00:09.036 --> 00:00:14.252
Eles nos revelaram um mundo minúsculo
de objetos, vida e estruturas
00:00:14.252 --> 00:00:17.028
que são pequenos demais
para vermos a olho nu.
00:00:17.028 --> 00:00:19.930
Eles são uma enorme contribuição
para a ciência e tecnologia.
00:00:19.930 --> 00:00:23.164
Hoje eu gostaria de apresentá-los
à um novo tipo de microscópio,
00:00:23.164 --> 00:00:25.766
um microscópio que amplifica mudanças.
00:00:25.766 --> 00:00:28.500
Ele não usa ótica,
como um microscópio comum,
00:00:28.500 --> 00:00:30.771
para aumentar pequenos objetos,
00:00:30.771 --> 00:00:35.257
mas em vez disso, usa uma câmera de vídeo
e processamento de imagem
00:00:35.257 --> 00:00:40.513
para nos revelar os movimentos ínfimos
e mudanças de cor em objetos e pessoas,
00:00:40.513 --> 00:00:44.355
mudanças que são impossíveis
de serem vistas a olhos nus.
00:00:44.355 --> 00:00:48.095
E isso permite-nos olhar o nosso mundo
de uma forma totalmente nova.
00:00:48.095 --> 00:00:50.525
Então, o que quero dizer
com alterações de cor?
00:00:50.525 --> 00:00:53.207
Nossa pele, por exemplo,
muda de cor muito ligeiramente
00:00:53.207 --> 00:00:55.214
quando o sangue flui sob ela.
00:00:55.214 --> 00:00:57.611
Essa mudança é incrivelmente sutil,
00:00:57.611 --> 00:00:59.674
por isso quando você vê outras pessoas,
00:00:59.674 --> 00:01:01.925
quando olha para a pessoa
sentada ao seu lado,
00:01:01.925 --> 00:01:05.500
você não vê sua pele
ou seu rosto mudando de cor.
00:01:05.500 --> 00:01:09.860
Quando vemos este vídeo do Steve aqui,
a aparência é de uma imagem estática,
00:01:09.860 --> 00:01:13.460
mas quando vemos o vídeo através
do nosso novo e especial microscópio,
00:01:13.460 --> 00:01:16.320
de repente, vemos uma imagem
completamente distinta.
00:01:16.320 --> 00:01:20.250
O que veem aqui são pequenas mudanças
na cor da pele do Steve,
00:01:20.250 --> 00:01:24.256
ampliadas 100 vezes,
de modo que se tornam visíveis.
00:01:24.256 --> 00:01:27.393
Na verdade, podemos ver um pulso humano.
00:01:27.393 --> 00:01:30.940
Podemos ver o quão rápido
o coração de Steve está batendo,
00:01:30.940 --> 00:01:36.535
mas também podemos ver a forma real
com que o sangue flui em seu rosto.
00:01:36.544 --> 00:01:39.175
E podemos fazer isso não só
para visualizar o pulso,
00:01:39.175 --> 00:01:44.039
mas também para efetivamente
extrair e medir a frequência cardíaca,
00:01:44.039 --> 00:01:48.892
E podemos fazer isso com câmeras comuns
e sem tocar nos pacientes.
00:01:48.892 --> 00:01:54.339
Aqui vemos o pulso e frequência cardíaca
que extraímos de um bebê recém-nascido
00:01:54.339 --> 00:01:57.390
a partir um vídeo feito
com uma câmera DSLR comum,
00:01:57.390 --> 00:01:59.206
e a frequência cardíaca que obtemos
00:01:59.206 --> 00:02:03.757
é tão precisa quanto aquela
de um monitor padrão de hospital.
00:02:03.757 --> 00:02:06.329
E nem precisa ser um vídeo que gravamos.
00:02:06.329 --> 00:02:09.514
Podemos essencialmente fazê-lo
com outros vídeos também.
00:02:09.514 --> 00:02:13.295
Então, peguei um pequeno clipe
de "Batman Begins" aqui,
00:02:13.295 --> 00:02:15.459
só para mostrar o pulso de Christian Bale.
00:02:15.459 --> 00:02:17.101
(Risos)
00:02:17.101 --> 00:02:19.204
E presumivelmente,
ele está usando maquiagem,
00:02:19.204 --> 00:02:21.277
iluminação aqui
é um pouco desafiadora,
00:02:21.277 --> 00:02:24.208
mesmo assim, a partir do vídeo,
podemos extrair seu pulso
00:02:24.208 --> 00:02:26.186
e mostrá-lo muito bem.
00:02:26.186 --> 00:02:28.136
Então, como fazemos isso?
00:02:28.136 --> 00:02:32.374
Basicamente analisamos
as mudanças na luz que é gravada
00:02:32.374 --> 00:02:34.975
em cada pixel do vídeo, ao longo do tempo,
00:02:34.975 --> 00:02:36.713
e depois aumentamos essas mudanças.
00:02:36.713 --> 00:02:39.075
Tornamos elas maiores
para que possamos vê-las.
00:02:39.075 --> 00:02:40.977
A parte complicada é que esses sinais,
00:02:40.977 --> 00:02:43.910
essas mudanças que queremos ver,
são extremamente sutis,
00:02:43.910 --> 00:02:46.689
por isso temos que ter muito cuidado
ao separá-las do ruído
00:02:46.689 --> 00:02:49.900
que sempre existe em vídeos.
00:02:49.900 --> 00:02:53.515
Então, usamos algumas técnicas
inteligentes de processamento de imagem
00:02:53.515 --> 00:02:57.509
para obter uma medida muito precisa
da cor de cada pixel no vídeo,
00:02:57.509 --> 00:03:00.179
e em seguida, a forma
como a cor muda ao longo do tempo,
00:03:00.179 --> 00:03:02.872
e então amplificamos essas mudanças.
00:03:02.872 --> 00:03:06.852
Tornamo-as maiores para criar esses tipos
de vídeos melhorados, ou ampliados,
00:03:06.852 --> 00:03:09.024
que realmente nos mostram essas mudanças.
00:03:09.024 --> 00:03:13.262
Acontece que podemos fazer isso não apenas
para mostrar pequenas mudanças de cor,
00:03:13.262 --> 00:03:15.503
mas também pequenos movimentos,
00:03:15.503 --> 00:03:19.079
e isso é porque a luz
que fica gravada em nossas câmeras
00:03:19.079 --> 00:03:21.729
muda não somente com a cor do objeto,
00:03:21.729 --> 00:03:24.077
mas também quando o objeto se move.
00:03:24.077 --> 00:03:27.893
Então, esta é a minha filha
quando tinha cerca de dois meses de idade.
00:03:27.893 --> 00:03:30.782
É um vídeo que gravei
há cerca de três anos atrás.
00:03:30.782 --> 00:03:34.360
E como pais iniciantes, todos queremos
que nossos bebês estejam saudáveis,
00:03:34.360 --> 00:03:36.372
respirando, e que estejam vivos, é claro.
00:03:36.372 --> 00:03:38.784
Então, eu também tinha
um desses monitores de bebê
00:03:38.784 --> 00:03:41.223
para ver minha filha
enquanto estava dormindo.
00:03:41.223 --> 00:03:44.780
E isso é o que você verá
com um monitor de bebê padrão.
00:03:44.780 --> 00:03:48.214
Vocês podem ver o bebê dormindo,
mas não há muita informação aí.
00:03:48.214 --> 00:03:49.708
Não há muito que podemos ver.
00:03:49.708 --> 00:03:52.672
Não seria melhor,
ou mais informativo, ou mais útil,
00:03:52.672 --> 00:03:55.732
se em vez disso pudéssemos
observar a cena assim.
00:03:55.732 --> 00:04:01.808
Aqui eu ampliei os movimentos em 30 vezes,
00:04:01.808 --> 00:04:06.074
então pude ver claramente que minha filha
estava realmente viva e respirando.
00:04:06.074 --> 00:04:08.327
(Risos)
00:04:08.327 --> 00:04:10.249
Aqui está uma comparação lado-a-lado.
00:04:10.249 --> 00:04:12.732
Novamente, no vídeo de origem,
no vídeo original,
00:04:12.732 --> 00:04:14.158
Não há muito que podemos ver,
00:04:14.158 --> 00:04:18.075
mas uma vez que aumentamos os movimentos,
a respiração torna-se muito mais visível.
00:04:18.075 --> 00:04:20.144
E acontece que,
há muitos fenômenos
00:04:20.144 --> 00:04:23.768
que podemos revelar e ampliar
com o nosso novo microscópio de movimento.
00:04:23.768 --> 00:04:28.072
Podemos ver como nossas veias e artérias
estão pulsando em nossos corpos.
00:04:28.072 --> 00:04:30.960
Podemos ver que nossos olhos
estão em constante movimento
00:04:30.960 --> 00:04:32.847
nesse padrão cambaleante.
00:04:32.847 --> 00:04:34.356
Isso é na verdade o meu olho,
00:04:34.356 --> 00:04:37.261
e esse vídeo foi feito
logo depois que minha filha nasceu,
00:04:37.261 --> 00:04:41.623
então vocês podem ver que eu não
estava dormindo muito. (Risos)
00:04:41.623 --> 00:04:44.339
Até mesmo quando uma pessoa está parada,
00:04:44.339 --> 00:04:46.383
há muita informação
que podemos extrair
00:04:46.383 --> 00:04:49.552
dos seus padrões de respiração
e pequenas expressões faciais.
00:04:49.552 --> 00:04:51.537
Talvez pudéssemos usar esses movimentos
00:04:51.537 --> 00:04:54.691
para nos dizer algo sobre
nossos pensamentos ou emoções.
00:04:54.691 --> 00:04:57.606
Também podemos ampliar
pequenos movimentos mecânicos,
00:04:57.606 --> 00:04:59.251
como vibrações em motores,
00:04:59.251 --> 00:05:02.963
que podem ajudar engenheiros a detectar
e diagnosticar problemas em máquinas,
00:05:02.963 --> 00:05:07.931
ou ver como nossos edifícios e estruturas
balançam ao vento e reagem às forças.
00:05:07.931 --> 00:05:12.312
Essas são coisas que a nossa sociedade
sabe como medir de várias maneiras,
00:05:12.312 --> 00:05:14.965
mas medir esses movimentos é uma coisa,
00:05:14.965 --> 00:05:17.241
e ver esses movimentos
enquanto eles acontecem
00:05:17.241 --> 00:05:19.795
é algo totalmente diferente.
00:05:19.795 --> 00:05:22.836
E desde que descobrimos
essa nova tecnologia,
00:05:22.836 --> 00:05:26.789
divulgamos o nosso código online para que
outros pudessem usar e experimentar.
00:05:26.789 --> 00:05:28.664
É muito simples de usar.
00:05:28.664 --> 00:05:30.708
Pode funcionar em seus próprios vídeos.
00:05:30.708 --> 00:05:33.691
Nossos colaboradores na Quantum Research
criaram este belo site
00:05:33.691 --> 00:05:36.699
onde vocês podem fazer o upload
de vídeos e processá-los online,
00:05:36.699 --> 00:05:40.395
e mesmo que não tenham experiência
em ciência da computação ou programação,
00:05:40.395 --> 00:05:43.421
ainda podem facilmente
experimentar esse novo microscópio.
00:05:43.421 --> 00:05:45.745
E eu gostaria de mostrar-lhes
alguns exemplos
00:05:45.745 --> 00:05:48.470
do que as pessoas fizeram com ele.
00:05:48.470 --> 00:05:53.657
Este vídeo foi feito por
um usuário do YouTube chamado Tamez85.
00:05:53.657 --> 00:05:55.250
Eu não sei quem é esse usuário,
00:05:55.250 --> 00:05:57.595
mas ele, ou ela, usou o nosso código
00:05:57.595 --> 00:06:01.150
para ampliar pequenos movimentos
da barriga durante a gravidez.
00:06:01.150 --> 00:06:02.802
É meio assustador.
00:06:02.802 --> 00:06:04.525
(Risos)
00:06:04.525 --> 00:06:09.486
Pessoas ampliaram as veias em suas mãos.
00:06:09.486 --> 00:06:13.268
E sabemos que não é ciência de verdade
a menos que se use cobaias,
00:06:13.268 --> 00:06:16.508
e, aparentemente, esta cobaia
se chama Tiffany,
00:06:16.508 --> 00:06:19.607
e esse usuário do YouTube
diz que ela é o primeiro roedor na Terra
00:06:19.607 --> 00:06:22.295
a ter os movimentos ampliados.
00:06:22.295 --> 00:06:24.483
Você também pode fazer arte.
00:06:24.483 --> 00:06:27.421
Este vídeo me foi enviado por uma
estudante de design em Yale.
00:06:27.421 --> 00:06:29.338
Ela queria ver se há alguma diferença
00:06:29.338 --> 00:06:31.680
na forma como seus
colegas de classe se movem.
00:06:31.680 --> 00:06:35.369
Ela fez com que todos ficassem parados,
então ampliou seus movimentos.
00:06:35.369 --> 00:06:38.747
É como ver fotografias ganharem vida.
00:06:38.747 --> 00:06:41.180
E a coisa legal nesses exemplos
00:06:41.180 --> 00:06:43.476
é que não tivemos nada a ver com eles.
00:06:43.476 --> 00:06:47.330
Nós apenas provemos essa nova ferramenta,
uma nova maneira de olhar o mundo,
00:06:47.330 --> 00:06:52.462
e então as pessoas acham outras formas
interessantes e criativas de usá-la.
00:06:52.462 --> 00:06:54.226
Mas não paramos por aí.
00:06:54.226 --> 00:06:57.477
Esta ferramenta não só nos permite
ver o mundo de uma nova maneira,
00:06:57.477 --> 00:07:01.305
ela também redefine e expande
os limites do que podemos fazer
00:07:01.305 --> 00:07:02.886
com nossas câmeras.
00:07:02.886 --> 00:07:05.255
Então, como cientistas,
começamos a nos perguntar,
00:07:05.255 --> 00:07:09.040
quais outros tipos de fenômenos físicos
produzem pequenos movimentos
00:07:09.040 --> 00:07:11.943
que podemos usar
nossas câmeras para medir?
00:07:11.943 --> 00:07:15.944
Um desses fenômenos no qual recentemente
nos concentramos é o som.
00:07:15.944 --> 00:07:18.049
O som, como sabemos,
é basicamente mudanças
00:07:18.049 --> 00:07:20.232
de pressão se propagam no ar.
00:07:20.232 --> 00:07:23.853
Essas ondas de pressão batem em objetos
e criam pequenas vibrações neles,
00:07:23.853 --> 00:07:26.385
é assim que ouvimos e gravamos o som.
00:07:26.385 --> 00:07:30.053
Mas acontece que o som
também produz movimentos visuais.
00:07:30.053 --> 00:07:32.666
Esses movimentos
não são visíveis para nós,
00:07:32.666 --> 00:07:35.507
mas são visíveis para uma câmera
com o tratamento correto.
00:07:35.507 --> 00:07:37.260
Então, aqui estão dois exemplos.
00:07:37.260 --> 00:07:40.994
Esse sou eu demonstrando
minhas grandes habilidades de canto.
00:07:41.064 --> 00:07:42.698
(Cantando)
00:07:42.698 --> 00:07:43.944
(Risos)
00:07:43.944 --> 00:07:47.250
Fiz um vídeo em câmera lenta da minha
garganta enquanto cantava.
00:07:47.250 --> 00:07:49.324
Novamente, se vocês olharem para o vídeo,
00:07:49.324 --> 00:07:50.960
não há muito que conseguirão ver,
00:07:50.960 --> 00:07:55.132
mas ao ampliarmos os movimentos 100 vezes,
vemos todos os movimentos e ondulações
00:07:55.132 --> 00:07:58.566
do pescoço que estão envolvidos
na produção do som.
00:07:58.566 --> 00:08:01.306
Esse sinal está alí naquele vídeo.
00:08:01.306 --> 00:08:03.726
Também sabemos que cantores
podem quebrar uma taça
00:08:03.726 --> 00:08:05.439
se atingirem a nota correta.
00:08:05.439 --> 00:08:07.064
Aqui, vamos tocar uma nota
00:08:07.064 --> 00:08:09.730
que está em ressonância
com a frequência da taça
00:08:09.730 --> 00:08:12.038
através de um alto-falante
que está ao lado dela.
00:08:12.038 --> 00:08:16.197
Uma vez que tocamos essa nota
e ampliamos os movimentos 250 vezes,
00:08:16.197 --> 00:08:18.535
podemos ver muito claramente
como o vidro vibra
00:08:18.535 --> 00:08:22.105
e ressoa em resposta ao som.
00:08:22.105 --> 00:08:24.295
Não é algo que vemos todos os dias.
00:08:24.295 --> 00:08:28.054
Mas isso nos fez pensar.
Isso nos deu uma ideia maluca.
00:08:28.054 --> 00:08:33.662
Será que podemos inverter este processo
e recuperar o som a partir do vídeo
00:08:33.662 --> 00:08:37.697
através da análise de minúsculas vibrações
que as ondas sonoras criam em objetos,
00:08:37.697 --> 00:08:42.474
e, essencialmente, convertê-las
de volta para os sons que as produziram?
00:08:42.474 --> 00:08:46.931
Desta forma, podemos transformar
objetos do cotidiano em microfones.
00:08:46.931 --> 00:08:49.163
Então, isso é exatamente o que fizemos.
00:08:49.163 --> 00:08:51.979
Aqui está um saco de batatas vazio
que estava em uma mesa,
00:08:51.979 --> 00:08:54.684
e vamos transformar esse saco
de batatas em um microfone
00:08:54.684 --> 00:08:56.335
filmando-o com uma câmera de vídeo
00:08:56.335 --> 00:08:59.623
e analisando os mínimos movimentos
que as ondas sonoras criam nele.
00:08:59.623 --> 00:09:02.419
Aqui está o som que tocamos no quarto.
00:09:02.419 --> 00:09:09.707
(Música: "Mary Had a Little Lamb")
00:09:09.707 --> 00:09:13.272
E este é um vídeo em alta velocidade
desse saco de batatas fritas.
00:09:13.272 --> 00:09:14.656
A música está tocando.
00:09:14.656 --> 00:09:17.228
Não há como vocês verem
nada acontecendo nesse vídeo
00:09:17.228 --> 00:09:18.476
somente olhando para ele,
00:09:18.476 --> 00:09:21.970
mas aqui está o som que conseguimos
recuperar apenas por meio da análise
00:09:21.970 --> 00:09:23.873
dos minúsculos movimentos no vídeo.
00:09:23.873 --> 00:09:29.535
(Música: "Mary Had a Little Lamb")
00:09:40.475 --> 00:09:42.471
Eu chamo isso de... Obrigado.
00:09:42.471 --> 00:09:47.696
(Aplausos)
00:09:49.388 --> 00:09:52.053
Eu chamo isso de microfone visual.
00:09:52.053 --> 00:09:55.473
Nós realmente extraímos sinais de áudio
a partir de sinais de vídeo.
00:09:55.473 --> 00:09:58.794
E só para dar-lhes um sentido
da escala dos movimentos aqui,
00:09:58.799 --> 00:10:03.885
um som bem alto fará com que o saco
de batatas se mova menos de um micrômetro.
00:10:03.885 --> 00:10:06.874
Isso é um milésimo de um milímetro.
00:10:06.874 --> 00:10:10.435
Esses são os movimentos minúsculos
que agora somos capazes de obter
00:10:10.435 --> 00:10:13.678
apenas observando como a luz
rebate em objetos
00:10:13.678 --> 00:10:15.814
e é gravada por nossas câmeras.
00:10:15.814 --> 00:10:19.064
Podemos recuperar sons a partir
de outros objetos, tais como plantas.
00:10:19.064 --> 00:10:25.040
(Música: "Mary Had a Little Lamb")
00:10:27.214 --> 00:10:29.211
E podemos recuperar falas também.
00:10:29.211 --> 00:10:31.708
Então aqui está uma pessoa
falando em um quarto.
00:10:31.708 --> 00:10:35.991
Voz (em inglês): Mary had a little lamb
whose fleece was white as snow,
00:10:35.991 --> 00:10:40.221
and everywhere that Mary went,
that lamb was sure to go.
00:10:40.221 --> 00:10:42.980
Michael Rubinstein: E aqui está
a fala recuperada
00:10:42.980 --> 00:10:46.254
a partir desse mesmo vídeo
do batatas fritas.
00:10:46.254 --> 00:10:51.085
Voz (em inglês): Mary had a little lamb
whose fleece was white as snow,
00:10:51.085 --> 00:10:55.644
and everywhere that Mary went,
that lamb was sure to go.
00:10:55.644 --> 00:10:58.290
MR: Usamos "Mary Had a Little Lamb"
00:10:58.290 --> 00:11:00.993
porque acredita-se que foram
as primeiras palavras
00:11:00.993 --> 00:11:04.574
que Thomas Edison falou
em seu fonógrafo em 1877.
00:11:04.574 --> 00:11:07.802
Ele foi um dos primeiros
gravadores de som na história.
00:11:07.802 --> 00:11:11.129
Ele basicamente direcionava o som
para um diafragma
00:11:11.129 --> 00:11:15.008
que vibrava uma agulha que, basicamente,
gravava o som em papel alumínio
00:11:15.008 --> 00:11:17.483
enrolado em torno de um cilindro.
00:11:17.483 --> 00:11:23.086
Aqui está uma demonstração de gravação e
reprodução de som no fonógrafo de Edison:
00:11:23.086 --> 00:11:26.236
(Video) Voz: Testando,
testando, um, dois, três.
00:11:26.236 --> 00:11:29.859
Mary had a little lamb
whose fleece was white as snow,
00:11:29.859 --> 00:11:33.528
and everywhere that Mary went,
the lamb was sure to go.
00:11:33.528 --> 00:11:36.268
Testando, testando, um, dois, três.
00:11:36.268 --> 00:11:40.424
Mary had a little lamb
whose fleece was white as snow,
00:11:40.424 --> 00:11:45.648
and everywhere that Mary went,
the lamb was sure to go.
00:11:45.648 --> 00:11:49.665
MR: E agora, 137 anos depois,
00:11:49.665 --> 00:11:53.752
somos capazes de obter som
praticamente com a mesma qualidade
00:11:53.752 --> 00:11:57.831
apenas observando objetos
vibrando ao som com câmeras,
00:11:57.831 --> 00:11:59.765
e podemos fazer isso mesmo com a câmera
00:11:59.765 --> 00:12:03.999
a 4,5 metros de distância do objeto,
e atrás de um vidro à prova de som.
00:12:03.999 --> 00:12:07.219
Este é o som que conseguimos
recuperar nesse caso.
00:12:07.219 --> 00:12:12.513
Voz: Mary had a little lamb
whose fleece was white as snow,
00:12:12.513 --> 00:12:17.272
and everywhere that Mary went,
the lamb was sure to go.
00:12:17.404 --> 00:12:21.034
MR: E, claro, vigilância é a primeira
aplicação que vem em mente.
00:12:21.034 --> 00:12:24.029
(Risos)
00:12:24.029 --> 00:12:28.085
Mas isso pode ser realmente útil
para outras coisas também.
00:12:28.085 --> 00:12:30.925
Talvez no futuro, sejamos capazes
para usá-lo, por exemplo,
00:12:30.925 --> 00:12:33.177
para recuperar som através do espaço,
00:12:33.177 --> 00:12:36.753
porque o som não pode viajar
no espaço, mas a luz pode.
00:12:36.753 --> 00:12:39.157
Nós apenas começamos a explorar
00:12:39.157 --> 00:12:41.746
outros usos possíveis
para esta nova tecnologia.
00:12:41.746 --> 00:12:45.008
Ela nos permite ver processos físicos
que sabemos que estão lá
00:12:45.008 --> 00:12:48.564
mas que nunca pudemos ver
com nossos próprios olhos até agora.
00:12:48.564 --> 00:12:49.768
Esta é a nossa equipe.
00:12:49.768 --> 00:12:52.567
Tudo o que eu mostrei hoje
é o resultado de uma colaboração
00:12:52.567 --> 00:12:55.188
com este incrível grupo
de pessoas que vocês veem aqui,
00:12:55.188 --> 00:12:58.005
e encorajo e convido vocês
a conhecerem nosso site,
00:12:58.005 --> 00:12:59.451
experimentá-lo vocês mesmos,
00:12:59.451 --> 00:13:02.933
e se juntarem a nós na exploração
desse mundo de pequenos movimentos.
00:13:02.933 --> 00:13:04.048
Obrigado.
00:13:04.048 --> 00:13:05.302
(Aplausos)