WEBVTT

00:00:01.006 --> 00:00:06.156
역사적인 기록을 통해 
고대 그리스인들이 어떤 옷을 입었고

00:00:06.180 --> 00:00:08.974
어떻게 살았고, 어떻게 싸웠는지 알죠.

00:00:09.004 --> 00:00:10.528
하지만 그들은 어떻게 생각했을 까요?

NOTE Paragraph

00:00:11.432 --> 00:00:15.872
한 가지 자연스런 생각은 
인간 사고의 가장 심오한 면인

00:00:15.896 --> 00:00:17.768
상상하는 능력

00:00:17.792 --> 00:00:19.189
의식하는 것

00:00:19.213 --> 00:00:20.444
꿈 꾸는 능력이

00:00:20.468 --> 00:00:22.087
늘 동일했다고 합니다.

00:00:22.872 --> 00:00:24.371
다른 가능성도 있습니다.

00:00:24.395 --> 00:00:28.118
문화를 만든 사회적 변화가
인간 사고의 구조적 기둥도

00:00:28.142 --> 00:00:31.927
변화시켰을 수도 있다는거죠.

NOTE Paragraph

00:00:32.911 --> 00:00:35.435
이것에 대한 견해는
각자 다를 수 있습니다.

00:00:35.459 --> 00:00:38.176
사실 이건 오랫동안 이어져온
철학적 논쟁입니다.

00:00:38.644 --> 00:00:41.371
하지만 이 질문이 과학과
상통하기는 할까요?

NOTE Paragraph

00:00:42.834 --> 00:00:45.340
저는 이런 얘기를 하고 싶습니다.

00:00:45.364 --> 00:00:50.136
벽돌 몇 개로 그리스 도시 모습을
재구성하는 것과

00:00:50.160 --> 00:00:52.548
같은 방법으로

00:00:52.572 --> 00:00:56.698
어떤 문화의 문서들은
인간 사고의 고고학적 기록이자

00:00:56.722 --> 00:00:58.865
화석이라고요.

NOTE Paragraph

00:00:59.905 --> 00:01:01.079
사실

00:01:01.103 --> 00:01:03.309
인간 문화에 대한 가장 오래된 서적에

00:01:03.333 --> 00:01:06.877
몇 가지 심리학적 분석을 해봄으로써

00:01:06.901 --> 00:01:12.856
줄리안 제인스는 70년대에 매우
무모하고 급진적인 가설을 냈습니다.

00:01:12.880 --> 00:01:15.293
불과 3,000년 전만 해도

00:01:15.317 --> 00:01:20.205
사람들은 모두
정신분열증 환자였다는 겁니다.

00:01:21.753 --> 00:01:23.261
줄리안의 주장의 근거는

00:01:23.285 --> 00:01:26.586
이 고서들에 묘사된 첫 인류가

00:01:26.610 --> 00:01:28.514
다른 전통에서나

00:01:28.538 --> 00:01:31.554
다른 지역에서 신이나 뮤즈의 목소리로

00:01:31.578 --> 00:01:35.110
여겨졌던 목소리를

00:01:35.134 --> 00:01:39.464
듣고 복종하는 것처럼 
항상 행동했다는 겁니다.

00:01:40.063 --> 00:01:42.832
오늘날 환각이라고 하는 거죠.

00:01:43.888 --> 00:01:46.514
그리고 시간이 흐르면서

00:01:46.538 --> 00:01:50.189
사람들은 자신이 창조자이자
내면의 소리의 주인이라는 걸

00:01:50.213 --> 00:01:52.728
인식하기 시작한겁니다.

00:01:53.316 --> 00:01:56.031
이걸 인식하면서 사람들은
자아 성찰을 할 수 있게 됩니다.

00:01:56.055 --> 00:01:58.538
자신의 생각에 대해
생각할 수 있는 능력이죠.

NOTE Paragraph

00:01:59.785 --> 00:02:03.182
그러니까 제인스의 이론이 주장하는 건

00:02:03.206 --> 00:02:06.372
적어도 오늘날 우리가

00:02:06.396 --> 00:02:09.936
존재의 주도권을 자신이 갖고 있다는
느낌이라고 여기는 의식에 한해서는

00:02:09.960 --> 00:02:12.697
의식은 최근에 일어난
문화적 발전이라는 겁니다.

00:02:13.456 --> 00:02:15.242
꽤 멋있는 이론입니다.

00:02:15.266 --> 00:02:16.699
하지만 명백히 보이는 문제도 있죠.

00:02:16.723 --> 00:02:20.715
몇 개의 매우 특수한 예시에
근거한다는 겁니다.

00:02:21.085 --> 00:02:22.848
그러니까 문제는

00:02:22.872 --> 00:02:27.623
인간 역사에서 3,000년 전에서부터
자아 성찰이 시작됐다는 이론이

00:02:27.647 --> 00:02:30.631
양적이고 객관적인 방법으로
검토될 수 있는가 입니다.

NOTE Paragraph

00:02:31.543 --> 00:02:35.106
이렇게 하기 힘든 이유는 뻔합니다.

00:02:35.130 --> 00:02:38.590
플라톤이 어느날 아침에 일어나서
이렇게 적은 건 아니잖아요.

00:02:38.614 --> 00:02:40.273
"안녕. 난 플라톤이야.

00:02:40.297 --> 00:02:43.186
오늘부터 난 완전한 자아 성찰을
할 수 있는 의식이 있어."

NOTE Paragraph

00:02:43.210 --> 00:02:45.503
(웃음)

NOTE Paragraph

00:02:45.527 --> 00:02:48.860
이게 사실은 문제의 본질을 보여줍니다.

00:02:49.467 --> 00:02:53.522
기록된 적 없는 관념의 출현을
찾아내야 합니다.

00:02:54.434 --> 00:02:58.744
문자를 통한 성찰은
우리가 분석하려는 서적에

00:02:58.768 --> 00:03:00.687
여러 번 나옵니다.

NOTE Paragraph

00:03:01.728 --> 00:03:05.815
이것에 대한 우리의 해결방법은
단어로 된 공간을 만드는 겁니다.

00:03:06.571 --> 00:03:09.858
이 커다란 공간에는
온갖 단어가 다 들어있는데

00:03:09.882 --> 00:03:12.684
어떤 두 단어 사이의 거리는

00:03:12.708 --> 00:03:15.591
그 둘이 얼마나 밀접한 관계를
갖는지 알려줍니다.

00:03:16.460 --> 00:03:17.365
예를 들어

00:03:17.365 --> 00:03:20.532
"개"와 "고양이"는
가까이 있어야겠지만

00:03:20.556 --> 00:03:24.387
"자몽"과 "로그"는 매우 멀리
떨어져 있어야겠죠.

00:03:24.809 --> 00:03:28.705
공간 안에 있는 어느 두 단어에나
해당되는 일입니다.

NOTE Paragraph

00:03:29.626 --> 00:03:32.967
단어 공간을 만드는 데는
여러 방법이 있습니다.

00:03:32.991 --> 00:03:34.634
하나는 전문가의
자문을 구하는 것입니다.

00:03:34.658 --> 00:03:36.554
사전으로 하는 것처럼요.

00:03:36.896 --> 00:03:38.324
다른 방법은

00:03:38.348 --> 00:03:42.063
두 단어가 연관이 있으면,
확률상으로보다 더 자주

00:03:42.087 --> 00:03:47.046
같은 문장이나, 같은 단락, 
같은 문서에

00:03:47.051 --> 00:03:50.913
등장하는 경향이 있다는 
단순한 추정을 따르는 것입니다.

00:03:52.231 --> 00:03:54.281
이 단순한 가설은

00:03:54.305 --> 00:03:55.611
이 단순한 방식은

00:03:55.635 --> 00:03:57.242
이게 굉장히 복잡하고

00:03:57.266 --> 00:03:58.655
고차원적인 공간이라는 사실과

00:03:58.679 --> 00:04:01.743
관련된 계산 요령 몇 가지와 함께

00:04:01.767 --> 00:04:03.432
굉장히 효과가 있습니다.

NOTE Paragraph

00:04:04.155 --> 00:04:06.957
이게 얼마나 효과있는지
조금 보여드릴게요.

00:04:06.981 --> 00:04:10.893
이 단어들을 익숙한 단어로
분석했을 때의 결과입니다.

00:04:11.607 --> 00:04:12.792
먼저 단어들이 자동적으로

00:04:12.816 --> 00:04:16.094
의미론적 집합으로 구성되는 걸
보실 수 있을 겁니다.

00:04:16.118 --> 00:04:17.949
과일이 있고, 신체부위가 있고

00:04:17.949 --> 00:04:20.784
컴퓨터 부품, 과학 용어 등등이요.

NOTE Paragraph

00:04:21.119 --> 00:04:25.341
이 알고리즘은 우리가 개념을 계층적으로
체계화한다는 것도 보여줍니다.

00:04:25.852 --> 00:04:27.003
예를 들어

00:04:27.027 --> 00:04:30.624
과학 용어가 두 개의 하위 범주로
나눠지는 걸 볼 수 있습니다.

00:04:30.648 --> 00:04:32.748
천문학 용어와 물리 용어로요.

00:04:33.338 --> 00:04:35.584
그리고 세세한 부분들이 있습니다.

00:04:35.608 --> 00:04:37.513
예를 들어, 천문학이라는 단어는

00:04:37.537 --> 00:04:39.352
저기 있는 게 이상해 보이지만

00:04:39.376 --> 00:04:41.424
사실은 있어야 할 곳에 있습니다.

00:04:41.448 --> 00:04:43.043
천문학의 본질인

00:04:43.067 --> 00:04:44.337
실제 과학과

00:04:44.361 --> 00:04:45.897
천문학이 나타내는

00:04:45.921 --> 00:04:47.413
천문학적 용어 사이에 있어요.

NOTE Paragraph

00:04:48.182 --> 00:04:50.073
더 얘기할 수도 있습니다.

00:04:50.097 --> 00:04:52.157
사실, 이걸 오랫동안 쳐다보면서

00:04:52.181 --> 00:04:54.039
임의의 궤적을 그려나가면

00:04:54.063 --> 00:04:57.229
시를 쓰는 것과 같다는 느낌을
받을 수 있을 겁니다.

00:04:58.018 --> 00:04:59.900
그 이유는, 공간 안에서 걷는 것이

00:04:59.924 --> 00:05:03.154
마음 속에서 걷는 것과 한편으로
유사하기 때문입니다.

NOTE Paragraph

00:05:04.027 --> 00:05:05.644
마지막 방법은 이 알고리즘인데

00:05:05.668 --> 00:05:09.708
어떤 단어들이 성찰의
이웃에 속하는지와

00:05:09.732 --> 00:05:13.628
우리의 직감이 무엇인지를
밝혀주는 것입니다.

00:05:13.652 --> 00:05:14.875
예를 들어

00:05:14.899 --> 00:05:18.878
자신, 죄책감, 이성,
감성같은 단어들은

00:05:18.902 --> 00:05:20.791
"성찰"과 매우 가깝습니다.

00:05:20.815 --> 00:05:21.740
하지만 다른 단어들은

00:05:21.740 --> 00:05:24.157
빨강, 축구, 양초, 바나나는

00:05:24.181 --> 00:05:25.633
매우 멀어요.

NOTE Paragraph

00:05:26.054 --> 00:05:28.816
공간을 세우고 나면

00:05:28.840 --> 00:05:31.666
이전에는 추상적이고

00:05:31.690 --> 00:05:34.023
모호해 보였던

00:05:34.047 --> 00:05:38.826
성찰이나 다른 관념들의
역사에 관한 질문이

00:05:38.850 --> 00:05:40.454
구체화됩니다.

00:05:40.478 --> 00:05:43.216
정량과학에 부합될 수 있습니다.

NOTE Paragraph

00:05:44.216 --> 00:05:46.978
우리가 해야하는 일은 책을 가지고

00:05:47.002 --> 00:05:48.383
디지털화 시켜서

00:05:48.407 --> 00:05:51.216
일련의 단어들을 궤적에 만들고

00:05:51.240 --> 00:05:53.209
공간에 투영시켜서

00:05:53.233 --> 00:05:56.987
이 궤적이 많은 시간동안
성찰이라는 개념에 근접하게

00:05:57.011 --> 00:06:00.003
선회하는지 묻는 것이 전부입니다.

NOTE Paragraph

00:06:00.760 --> 00:06:01.956
이걸 통해서

00:06:01.980 --> 00:06:04.092
우리에게 가장 잘 명문화되어있는

00:06:04.116 --> 00:06:06.037
고대 그리스 전통 속의

00:06:06.061 --> 00:06:08.663
성찰의 역사를 분석할 수 있습니다.

00:06:09.631 --> 00:06:11.886
그래서 우리는 모든 서적들을 가져다가

00:06:11.910 --> 00:06:14.194
시간에 따라 나열하고

00:06:14.218 --> 00:06:15.970
각각의 서적에서 단어를 가져다가

00:06:15.994 --> 00:06:17.955
공간에 투영시켜서

00:06:17.979 --> 00:06:21.011
각 단어가 성찰과 얼마나 가까운지 묻고

00:06:21.035 --> 00:06:22.265
그것으로 평균을 냈습니다.

00:06:22.590 --> 00:06:25.788
그리고 시간이 흐르면서
이 고서들이 점점 더

00:06:25.812 --> 00:06:30.864
성찰의 개념에 근접하게 
다가가는지를 물었습니다.

NOTE Paragraph

00:06:30.866 --> 00:06:34.667
바로 이게 고대 그리스의
전통에서 일어나는 일입니다.

00:06:35.698 --> 00:06:38.825
호메로스의 전통의
가장 오래된 고서들에서 볼 수 있듯

00:06:38.849 --> 00:06:42.261
성찰에 가까워지는 책이
약간 증가합니다.

00:06:42.285 --> 00:06:44.491
하지만 서력 기원전 약 4세기 쯤에

00:06:44.515 --> 00:06:49.223
성찰에 더 가까워지는 고서의 양이

00:06:49.247 --> 00:06:51.747
거의 5배 가까이

00:06:51.771 --> 00:06:53.453
급격히 증가하기 시작합니다.

00:06:54.159 --> 00:06:56.583
이것의 좋은 점 중 하나는

00:06:56.607 --> 00:06:57.805
우리가 이제

00:06:57.829 --> 00:07:01.976
다른, 독립적인 관습에도 똑같이
해당되는지 물을 수 있다는 겁니다.

NOTE Paragraph

00:07:02.962 --> 00:07:06.138
그래서 유대교와 기독교의
공통적인 관습에 대해서도

00:07:06.162 --> 00:07:08.883
똑같은 분석을 하여
사실상 똑같은 패턴을 얻었습니다.

00:07:09.548 --> 00:07:14.183
똑같이, 구약성서의 가장 오래된
서적에서 약간의 증가를 볼 수 있고

00:07:14.207 --> 00:07:16.121
신약성서의 새 책에서

00:07:16.145 --> 00:07:17.984
더 급격히 증가합니다.

00:07:18.008 --> 00:07:20.040
그리고 성찰의 정점을

00:07:20.064 --> 00:07:22.191
"성 어거스틴의 참회록"에서
볼 수 있습니다.

00:07:22.215 --> 00:07:24.072
서력 기원전 4세기 쯤에요.

00:07:24.897 --> 00:07:26.841
이게 굉장히 중요한 이유는

00:07:26.865 --> 00:07:31.528
성 어거스틴이 학자들이나,
문헌학자, 사학자들에게

00:07:31.528 --> 00:07:34.714
성찰의 창설자 중 한 사람으로 
인정받기 때문입니다.

00:07:35.060 --> 00:07:38.357
사실 일부는 성 어거스틴이
근대 심리학의 아버지라고 생각합니다.

NOTE Paragraph

00:07:39.012 --> 00:07:40.851
그래서 정량적이고

00:07:40.875 --> 00:07:43.717
객관적인 미덕을 지닌

00:07:43.741 --> 00:07:45.754
그리고 찰나에 계산이 가능해서

00:07:45.754 --> 00:07:49.504
매우 빠르기도 한 우리의 알고리즘은

00:07:49.504 --> 00:07:52.992
이 기나긴 역사를 가진 수사에
가장 중요한 결론들을

00:07:53.016 --> 00:07:55.238
잡아내 줄 수 있습니다.

00:07:56.317 --> 00:07:59.968
이게 사실 과학의 아름다운 이유 중의
하나라고 볼 수 있습니다.

00:07:59.992 --> 00:08:03.468
이 아이디어가 수많은 다른 영역들로

00:08:03.492 --> 00:08:06.063
번역되고 일반화될 수
있다는 것 말이죠.

NOTE Paragraph

00:08:06.769 --> 00:08:11.536
그래서 인간의 의식이 과거에 어땠는지
물었던 것과 같은 방식으로

00:08:11.560 --> 00:08:14.966
어쩌면 우리가 물을 수 있는 것 중
가장 어려운 질문을 물었습니다.

00:08:14.990 --> 00:08:19.127
이것이 우리의 정신의 미래에 대해
무언가를 말해줄 수 있는지를요.

00:08:19.550 --> 00:08:21.020
더 정확히 말하자면

00:08:21.044 --> 00:08:23.460
우리가 오늘날 쓰는 단어가

00:08:23.484 --> 00:08:28.681
며칠 뒤나, 몇 달 뒤, 혹은 
몇 년 뒤에 우리의 정신 상태가

00:08:28.705 --> 00:08:30.826
어떨지를 알려줄 수 있을지 말입니다.

NOTE Paragraph

00:08:31.597 --> 00:08:34.617
많은 사람들이 병을 예방하기 위해

00:08:34.641 --> 00:08:37.737
심박수나 호흡

00:08:37.744 --> 00:08:39.411
유전 인자를 측정하는 센서를

00:08:39.435 --> 00:08:43.086
오늘날 착용하는 것처럼

00:08:43.110 --> 00:08:46.631
우리가 말하고, 트위터에 올리고,
메일로 보내고, 쓰는 단어들을

00:08:46.655 --> 00:08:49.338
관찰하고 분석하는 것이

00:08:49.362 --> 00:08:54.170
우리의 정신에 문제가 생길지를 미리
알려줄 수 있을지를 물을 수 있습니다.

00:08:55.087 --> 00:08:56.621
저에게 이 연구를 하는 데 있어

00:08:56.645 --> 00:08:59.646
형제와도 같았던 기예르모 체키와 함께

00:08:59.670 --> 00:09:01.225
우리는 이 작업에 착수했습니다.

00:09:02.228 --> 00:09:07.760
정신분열증에 걸릴 위험이 높은
34명의 젊은이들의

00:09:07.784 --> 00:09:10.585
녹음된 발화 내용을 분석했습니다.

NOTE Paragraph

00:09:11.434 --> 00:09:14.315
우리는 첫째날에 녹음된 말을 측정하고

00:09:14.339 --> 00:09:17.581
앞으로 3년 이내의 시간 동안
정신병에 걸릴지를

00:09:17.605 --> 00:09:20.101
그들이 한 말의 특징들로

00:09:20.125 --> 00:09:22.160
예측할 수 있는지 물었습니다.

00:09:23.427 --> 00:09:25.793
하지만 안타깝게도

00:09:25.817 --> 00:09:28.934
계속 실패했습니다.

00:09:29.793 --> 00:09:33.675
미래의 정신 구조를 예측하기엔

00:09:33.699 --> 00:09:36.492
의미론에 있는 정보가
충분하지 않았습니다.

00:09:36.516 --> 00:09:38.325
고대 문서로 했던 것처럼

00:09:38.349 --> 00:09:40.908
정신분열증 환자 집단과

00:09:40.908 --> 00:09:45.260
통제 집단을 구분짓기에는 충분했지만

00:09:45.284 --> 00:09:48.278
미래의 정신병 발달 가능성을
예측하기엔 부족했습니다.

NOTE Paragraph

00:09:49.164 --> 00:09:50.870
그런데 우리는 깨달았습니다.

00:09:50.894 --> 00:09:54.982
가장 중요한 것은 그들의
말의 내용이 아니라

00:09:55.006 --> 00:09:56.679
말하는 방법일지도 모른다고요.

00:09:57.679 --> 00:09:58.899
더 자세히 말하자면

00:09:58.923 --> 00:10:01.750
의미론적으로 어느 단어 집단에
근접하느냐가 아니라

00:10:01.774 --> 00:10:04.374
한 의미론적 집단에서 다른 집단으로

00:10:04.398 --> 00:10:06.699
얼마나 멀리, 그리고 빠르게
건너뛰느냐는 것이죠.

00:10:07.247 --> 00:10:08.978
그래서 우리는
의미론적 일관성이라고 명명한

00:10:09.002 --> 00:10:11.391
이 측정법을 고안해냈습니다.

00:10:11.415 --> 00:10:16.219
하나의 의미론적 범주 안에 있는
하나의 의미론적 주제의 지속성을

00:10:16.243 --> 00:10:17.772
측정하는 방법이죠.

NOTE Paragraph

00:10:19.294 --> 00:10:23.341
그리고 결과적으로
의미론적 일관성에 기반한 알고리즘은

00:10:23.365 --> 00:10:26.218
이 34명으로 이루어진 집단을

00:10:26.218 --> 00:10:32.168
누가 정신병에 걸리고 안 걸릴지 
100%의 정확도로 예측할 수 있었습니다.

00:10:32.976 --> 00:10:35.913
이건 현존하는 그 어떤 임상 측정도

00:10:35.937 --> 00:10:40.545
근접하게조차 해낼 수 없었던 일입니다.

NOTE Paragraph

00:10:42.525 --> 00:10:46.104
저는 생생하게 기억납니다.
이 연구를 하는 동안

00:10:46.128 --> 00:10:48.445
저는 컴퓨터 앞에 앉아서

00:10:48.469 --> 00:10:51.104
제가 부에노스 아이레스에 있을 당시

00:10:51.128 --> 00:10:54.295
제 첫 제자였던, 그리고 연구 당시에는
뉴욕에 살고 있던 폴로가 쓴

00:10:54.319 --> 00:10:56.389
트윗을 잔뜩 읽었습니다.

00:10:56.413 --> 00:10:58.501
명시적으로 드러난 건 없었기에

00:10:58.525 --> 00:11:02.026
무엇인지 정확히 말은 못하지만
트윗에는 뭔가가 있었습니다.

00:11:02.050 --> 00:11:04.071
저는 뭔가 잘못되고 있다는 걸

00:11:04.095 --> 00:11:07.050
직감적으로 강하게 느꼈습니다.

00:11:08.347 --> 00:11:11.070
그래서 폴로에게 전화를 했는데

00:11:11.094 --> 00:11:13.013
그는 실제로 아픈 상태였습니다.

00:11:13.362 --> 00:11:15.299
그리고 이 단순한 사실을 통해서

00:11:15.323 --> 00:11:17.814
글 속의 의미를 찾아내서

00:11:17.838 --> 00:11:22.100
그의 감정을 느낄 수 있는 것이
간단하지만 매우 효과적으로

00:11:22.124 --> 00:11:24.743
도울 수 있는 방법임을
알 수 있었습니다.

NOTE Paragraph

00:11:25.987 --> 00:11:27.625
오늘 말씀드리는 것은

00:11:27.649 --> 00:11:30.157
우리 모두가 가지고 있고,
공유하는 직감을

00:11:30.181 --> 00:11:34.467
알고리즘으로 변환시키는 
방법을 이해하는 데

00:11:34.491 --> 00:11:37.356
점점 더 가까워지고 있다는 것입니다.

00:11:38.102 --> 00:11:39.563
그럼으로써

00:11:39.587 --> 00:11:44.237
정신 건강의 전혀 다른 형태를
미래에 보게 될 수도 있습니다.

00:11:44.261 --> 00:11:49.882
우리가 쓰고, 말하는 단어의

00:11:49.906 --> 00:11:53.225
객관적, 양적, 자동적 분석에 기반해서요.

NOTE Paragraph

00:11:53.225 --> 00:11:54.351
감사합니다.

NOTE Paragraph

00:11:54.375 --> 00:11:59.978
(박수)