WEBVTT 00:00:01.006 --> 00:00:06.156 역사적인 기록을 통해 고대 그리스인들이 어떤 옷을 입었고 00:00:06.180 --> 00:00:08.974 어떻게 살았고, 어떻게 싸웠는지 알죠. 00:00:09.004 --> 00:00:10.528 하지만 그들은 어떻게 생각했을 까요? NOTE Paragraph 00:00:11.432 --> 00:00:15.872 한 가지 자연스런 생각은 인간 사고의 가장 심오한 면인 00:00:15.896 --> 00:00:17.768 상상하는 능력 00:00:17.792 --> 00:00:19.189 의식하는 것 00:00:19.213 --> 00:00:20.444 꿈 꾸는 능력이 00:00:20.468 --> 00:00:22.087 늘 동일했다고 합니다. 00:00:22.872 --> 00:00:24.371 다른 가능성도 있습니다. 00:00:24.395 --> 00:00:28.118 문화를 만든 사회적 변화가 인간 사고의 구조적 기둥도 00:00:28.142 --> 00:00:31.927 변화시켰을 수도 있다는거죠. NOTE Paragraph 00:00:32.911 --> 00:00:35.435 이것에 대한 견해는 각자 다를 수 있습니다. 00:00:35.459 --> 00:00:38.176 사실 이건 오랫동안 이어져온 철학적 논쟁입니다. 00:00:38.644 --> 00:00:41.371 하지만 이 질문이 과학과 상통하기는 할까요? NOTE Paragraph 00:00:42.834 --> 00:00:45.340 저는 이런 얘기를 하고 싶습니다. 00:00:45.364 --> 00:00:50.136 벽돌 몇 개로 그리스 도시 모습을 재구성하는 것과 00:00:50.160 --> 00:00:52.548 같은 방법으로 00:00:52.572 --> 00:00:56.698 어떤 문화의 문서들은 인간 사고의 고고학적 기록이자 00:00:56.722 --> 00:00:58.865 화석이라고요. NOTE Paragraph 00:00:59.905 --> 00:01:01.079 사실 00:01:01.103 --> 00:01:03.309 인간 문화에 대한 가장 오래된 서적에 00:01:03.333 --> 00:01:06.877 몇 가지 심리학적 분석을 해봄으로써 00:01:06.901 --> 00:01:12.856 줄리안 제인스는 70년대에 매우 무모하고 급진적인 가설을 냈습니다. 00:01:12.880 --> 00:01:15.293 불과 3,000년 전만 해도 00:01:15.317 --> 00:01:20.205 사람들은 모두 정신분열증 환자였다는 겁니다. 00:01:21.753 --> 00:01:23.261 줄리안의 주장의 근거는 00:01:23.285 --> 00:01:26.586 이 고서들에 묘사된 첫 인류가 00:01:26.610 --> 00:01:28.514 다른 전통에서나 00:01:28.538 --> 00:01:31.554 다른 지역에서 신이나 뮤즈의 목소리로 00:01:31.578 --> 00:01:35.110 여겨졌던 목소리를 00:01:35.134 --> 00:01:39.464 듣고 복종하는 것처럼 항상 행동했다는 겁니다. 00:01:40.063 --> 00:01:42.832 오늘날 환각이라고 하는 거죠. 00:01:43.888 --> 00:01:46.514 그리고 시간이 흐르면서 00:01:46.538 --> 00:01:50.189 사람들은 자신이 창조자이자 내면의 소리의 주인이라는 걸 00:01:50.213 --> 00:01:52.728 인식하기 시작한겁니다. 00:01:53.316 --> 00:01:56.031 이걸 인식하면서 사람들은 자아 성찰을 할 수 있게 됩니다. 00:01:56.055 --> 00:01:58.538 자신의 생각에 대해 생각할 수 있는 능력이죠. NOTE Paragraph 00:01:59.785 --> 00:02:03.182 그러니까 제인스의 이론이 주장하는 건 00:02:03.206 --> 00:02:06.372 적어도 오늘날 우리가 00:02:06.396 --> 00:02:09.936 존재의 주도권을 자신이 갖고 있다는 느낌이라고 여기는 의식에 한해서는 00:02:09.960 --> 00:02:12.697 의식은 최근에 일어난 문화적 발전이라는 겁니다. 00:02:13.456 --> 00:02:15.242 꽤 멋있는 이론입니다. 00:02:15.266 --> 00:02:16.699 하지만 명백히 보이는 문제도 있죠. 00:02:16.723 --> 00:02:20.715 몇 개의 매우 특수한 예시에 근거한다는 겁니다. 00:02:21.085 --> 00:02:22.848 그러니까 문제는 00:02:22.872 --> 00:02:27.623 인간 역사에서 3,000년 전에서부터 자아 성찰이 시작됐다는 이론이 00:02:27.647 --> 00:02:30.631 양적이고 객관적인 방법으로 검토될 수 있는가 입니다. NOTE Paragraph 00:02:31.543 --> 00:02:35.106 이렇게 하기 힘든 이유는 뻔합니다. 00:02:35.130 --> 00:02:38.590 플라톤이 어느날 아침에 일어나서 이렇게 적은 건 아니잖아요. 00:02:38.614 --> 00:02:40.273 "안녕. 난 플라톤이야. 00:02:40.297 --> 00:02:43.186 오늘부터 난 완전한 자아 성찰을 할 수 있는 의식이 있어." NOTE Paragraph 00:02:43.210 --> 00:02:45.503 (웃음) NOTE Paragraph 00:02:45.527 --> 00:02:48.860 이게 사실은 문제의 본질을 보여줍니다. 00:02:49.467 --> 00:02:53.522 기록된 적 없는 관념의 출현을 찾아내야 합니다. 00:02:54.434 --> 00:02:58.744 문자를 통한 성찰은 우리가 분석하려는 서적에 00:02:58.768 --> 00:03:00.687 여러 번 나옵니다. NOTE Paragraph 00:03:01.728 --> 00:03:05.815 이것에 대한 우리의 해결방법은 단어로 된 공간을 만드는 겁니다. 00:03:06.571 --> 00:03:09.858 이 커다란 공간에는 온갖 단어가 다 들어있는데 00:03:09.882 --> 00:03:12.684 어떤 두 단어 사이의 거리는 00:03:12.708 --> 00:03:15.591 그 둘이 얼마나 밀접한 관계를 갖는지 알려줍니다. 00:03:16.460 --> 00:03:17.365 예를 들어 00:03:17.365 --> 00:03:20.532 "개"와 "고양이"는 가까이 있어야겠지만 00:03:20.556 --> 00:03:24.387 "자몽"과 "로그"는 매우 멀리 떨어져 있어야겠죠. 00:03:24.809 --> 00:03:28.705 공간 안에 있는 어느 두 단어에나 해당되는 일입니다. NOTE Paragraph 00:03:29.626 --> 00:03:32.967 단어 공간을 만드는 데는 여러 방법이 있습니다. 00:03:32.991 --> 00:03:34.634 하나는 전문가의 자문을 구하는 것입니다. 00:03:34.658 --> 00:03:36.554 사전으로 하는 것처럼요. 00:03:36.896 --> 00:03:38.324 다른 방법은 00:03:38.348 --> 00:03:42.063 두 단어가 연관이 있으면, 확률상으로보다 더 자주 00:03:42.087 --> 00:03:47.046 같은 문장이나, 같은 단락, 같은 문서에 00:03:47.051 --> 00:03:50.913 등장하는 경향이 있다는 단순한 추정을 따르는 것입니다. 00:03:52.231 --> 00:03:54.281 이 단순한 가설은 00:03:54.305 --> 00:03:55.611 이 단순한 방식은 00:03:55.635 --> 00:03:57.242 이게 굉장히 복잡하고 00:03:57.266 --> 00:03:58.655 고차원적인 공간이라는 사실과 00:03:58.679 --> 00:04:01.743 관련된 계산 요령 몇 가지와 함께 00:04:01.767 --> 00:04:03.432 굉장히 효과가 있습니다. NOTE Paragraph 00:04:04.155 --> 00:04:06.957 이게 얼마나 효과있는지 조금 보여드릴게요. 00:04:06.981 --> 00:04:10.893 이 단어들을 익숙한 단어로 분석했을 때의 결과입니다. 00:04:11.607 --> 00:04:12.792 먼저 단어들이 자동적으로 00:04:12.816 --> 00:04:16.094 의미론적 집합으로 구성되는 걸 보실 수 있을 겁니다. 00:04:16.118 --> 00:04:17.949 과일이 있고, 신체부위가 있고 00:04:17.949 --> 00:04:20.784 컴퓨터 부품, 과학 용어 등등이요. NOTE Paragraph 00:04:21.119 --> 00:04:25.341 이 알고리즘은 우리가 개념을 계층적으로 체계화한다는 것도 보여줍니다. 00:04:25.852 --> 00:04:27.003 예를 들어 00:04:27.027 --> 00:04:30.624 과학 용어가 두 개의 하위 범주로 나눠지는 걸 볼 수 있습니다. 00:04:30.648 --> 00:04:32.748 천문학 용어와 물리 용어로요. 00:04:33.338 --> 00:04:35.584 그리고 세세한 부분들이 있습니다. 00:04:35.608 --> 00:04:37.513 예를 들어, 천문학이라는 단어는 00:04:37.537 --> 00:04:39.352 저기 있는 게 이상해 보이지만 00:04:39.376 --> 00:04:41.424 사실은 있어야 할 곳에 있습니다. 00:04:41.448 --> 00:04:43.043 천문학의 본질인 00:04:43.067 --> 00:04:44.337 실제 과학과 00:04:44.361 --> 00:04:45.897 천문학이 나타내는 00:04:45.921 --> 00:04:47.413 천문학적 용어 사이에 있어요. NOTE Paragraph 00:04:48.182 --> 00:04:50.073 더 얘기할 수도 있습니다. 00:04:50.097 --> 00:04:52.157 사실, 이걸 오랫동안 쳐다보면서 00:04:52.181 --> 00:04:54.039 임의의 궤적을 그려나가면 00:04:54.063 --> 00:04:57.229 시를 쓰는 것과 같다는 느낌을 받을 수 있을 겁니다. 00:04:58.018 --> 00:04:59.900 그 이유는, 공간 안에서 걷는 것이 00:04:59.924 --> 00:05:03.154 마음 속에서 걷는 것과 한편으로 유사하기 때문입니다. NOTE Paragraph 00:05:04.027 --> 00:05:05.644 마지막 방법은 이 알고리즘인데 00:05:05.668 --> 00:05:09.708 어떤 단어들이 성찰의 이웃에 속하는지와 00:05:09.732 --> 00:05:13.628 우리의 직감이 무엇인지를 밝혀주는 것입니다. 00:05:13.652 --> 00:05:14.875 예를 들어 00:05:14.899 --> 00:05:18.878 자신, 죄책감, 이성, 감성같은 단어들은 00:05:18.902 --> 00:05:20.791 "성찰"과 매우 가깝습니다. 00:05:20.815 --> 00:05:21.740 하지만 다른 단어들은 00:05:21.740 --> 00:05:24.157 빨강, 축구, 양초, 바나나는 00:05:24.181 --> 00:05:25.633 매우 멀어요. NOTE Paragraph 00:05:26.054 --> 00:05:28.816 공간을 세우고 나면 00:05:28.840 --> 00:05:31.666 이전에는 추상적이고 00:05:31.690 --> 00:05:34.023 모호해 보였던 00:05:34.047 --> 00:05:38.826 성찰이나 다른 관념들의 역사에 관한 질문이 00:05:38.850 --> 00:05:40.454 구체화됩니다. 00:05:40.478 --> 00:05:43.216 정량과학에 부합될 수 있습니다. NOTE Paragraph 00:05:44.216 --> 00:05:46.978 우리가 해야하는 일은 책을 가지고 00:05:47.002 --> 00:05:48.383 디지털화 시켜서 00:05:48.407 --> 00:05:51.216 일련의 단어들을 궤적에 만들고 00:05:51.240 --> 00:05:53.209 공간에 투영시켜서 00:05:53.233 --> 00:05:56.987 이 궤적이 많은 시간동안 성찰이라는 개념에 근접하게 00:05:57.011 --> 00:06:00.003 선회하는지 묻는 것이 전부입니다. NOTE Paragraph 00:06:00.760 --> 00:06:01.956 이걸 통해서 00:06:01.980 --> 00:06:04.092 우리에게 가장 잘 명문화되어있는 00:06:04.116 --> 00:06:06.037 고대 그리스 전통 속의 00:06:06.061 --> 00:06:08.663 성찰의 역사를 분석할 수 있습니다. 00:06:09.631 --> 00:06:11.886 그래서 우리는 모든 서적들을 가져다가 00:06:11.910 --> 00:06:14.194 시간에 따라 나열하고 00:06:14.218 --> 00:06:15.970 각각의 서적에서 단어를 가져다가 00:06:15.994 --> 00:06:17.955 공간에 투영시켜서 00:06:17.979 --> 00:06:21.011 각 단어가 성찰과 얼마나 가까운지 묻고 00:06:21.035 --> 00:06:22.265 그것으로 평균을 냈습니다. 00:06:22.590 --> 00:06:25.788 그리고 시간이 흐르면서 이 고서들이 점점 더 00:06:25.812 --> 00:06:30.864 성찰의 개념에 근접하게 다가가는지를 물었습니다. NOTE Paragraph 00:06:30.866 --> 00:06:34.667 바로 이게 고대 그리스의 전통에서 일어나는 일입니다. 00:06:35.698 --> 00:06:38.825 호메로스의 전통의 가장 오래된 고서들에서 볼 수 있듯 00:06:38.849 --> 00:06:42.261 성찰에 가까워지는 책이 약간 증가합니다. 00:06:42.285 --> 00:06:44.491 하지만 서력 기원전 약 4세기 쯤에 00:06:44.515 --> 00:06:49.223 성찰에 더 가까워지는 고서의 양이 00:06:49.247 --> 00:06:51.747 거의 5배 가까이 00:06:51.771 --> 00:06:53.453 급격히 증가하기 시작합니다. 00:06:54.159 --> 00:06:56.583 이것의 좋은 점 중 하나는 00:06:56.607 --> 00:06:57.805 우리가 이제 00:06:57.829 --> 00:07:01.976 다른, 독립적인 관습에도 똑같이 해당되는지 물을 수 있다는 겁니다. NOTE Paragraph 00:07:02.962 --> 00:07:06.138 그래서 유대교와 기독교의 공통적인 관습에 대해서도 00:07:06.162 --> 00:07:08.883 똑같은 분석을 하여 사실상 똑같은 패턴을 얻었습니다. 00:07:09.548 --> 00:07:14.183 똑같이, 구약성서의 가장 오래된 서적에서 약간의 증가를 볼 수 있고 00:07:14.207 --> 00:07:16.121 신약성서의 새 책에서 00:07:16.145 --> 00:07:17.984 더 급격히 증가합니다. 00:07:18.008 --> 00:07:20.040 그리고 성찰의 정점을 00:07:20.064 --> 00:07:22.191 "성 어거스틴의 참회록"에서 볼 수 있습니다. 00:07:22.215 --> 00:07:24.072 서력 기원전 4세기 쯤에요. 00:07:24.897 --> 00:07:26.841 이게 굉장히 중요한 이유는 00:07:26.865 --> 00:07:31.528 성 어거스틴이 학자들이나, 문헌학자, 사학자들에게 00:07:31.528 --> 00:07:34.714 성찰의 창설자 중 한 사람으로 인정받기 때문입니다. 00:07:35.060 --> 00:07:38.357 사실 일부는 성 어거스틴이 근대 심리학의 아버지라고 생각합니다. NOTE Paragraph 00:07:39.012 --> 00:07:40.851 그래서 정량적이고 00:07:40.875 --> 00:07:43.717 객관적인 미덕을 지닌 00:07:43.741 --> 00:07:45.754 그리고 찰나에 계산이 가능해서 00:07:45.754 --> 00:07:49.504 매우 빠르기도 한 우리의 알고리즘은 00:07:49.504 --> 00:07:52.992 이 기나긴 역사를 가진 수사에 가장 중요한 결론들을 00:07:53.016 --> 00:07:55.238 잡아내 줄 수 있습니다. 00:07:56.317 --> 00:07:59.968 이게 사실 과학의 아름다운 이유 중의 하나라고 볼 수 있습니다. 00:07:59.992 --> 00:08:03.468 이 아이디어가 수많은 다른 영역들로 00:08:03.492 --> 00:08:06.063 번역되고 일반화될 수 있다는 것 말이죠. NOTE Paragraph 00:08:06.769 --> 00:08:11.536 그래서 인간의 의식이 과거에 어땠는지 물었던 것과 같은 방식으로 00:08:11.560 --> 00:08:14.966 어쩌면 우리가 물을 수 있는 것 중 가장 어려운 질문을 물었습니다. 00:08:14.990 --> 00:08:19.127 이것이 우리의 정신의 미래에 대해 무언가를 말해줄 수 있는지를요. 00:08:19.550 --> 00:08:21.020 더 정확히 말하자면 00:08:21.044 --> 00:08:23.460 우리가 오늘날 쓰는 단어가 00:08:23.484 --> 00:08:28.681 며칠 뒤나, 몇 달 뒤, 혹은 몇 년 뒤에 우리의 정신 상태가 00:08:28.705 --> 00:08:30.826 어떨지를 알려줄 수 있을지 말입니다. NOTE Paragraph 00:08:31.597 --> 00:08:34.617 많은 사람들이 병을 예방하기 위해 00:08:34.641 --> 00:08:37.737 심박수나 호흡 00:08:37.744 --> 00:08:39.411 유전 인자를 측정하는 센서를 00:08:39.435 --> 00:08:43.086 오늘날 착용하는 것처럼 00:08:43.110 --> 00:08:46.631 우리가 말하고, 트위터에 올리고, 메일로 보내고, 쓰는 단어들을 00:08:46.655 --> 00:08:49.338 관찰하고 분석하는 것이 00:08:49.362 --> 00:08:54.170 우리의 정신에 문제가 생길지를 미리 알려줄 수 있을지를 물을 수 있습니다. 00:08:55.087 --> 00:08:56.621 저에게 이 연구를 하는 데 있어 00:08:56.645 --> 00:08:59.646 형제와도 같았던 기예르모 체키와 함께 00:08:59.670 --> 00:09:01.225 우리는 이 작업에 착수했습니다. 00:09:02.228 --> 00:09:07.760 정신분열증에 걸릴 위험이 높은 34명의 젊은이들의 00:09:07.784 --> 00:09:10.585 녹음된 발화 내용을 분석했습니다. NOTE Paragraph 00:09:11.434 --> 00:09:14.315 우리는 첫째날에 녹음된 말을 측정하고 00:09:14.339 --> 00:09:17.581 앞으로 3년 이내의 시간 동안 정신병에 걸릴지를 00:09:17.605 --> 00:09:20.101 그들이 한 말의 특징들로 00:09:20.125 --> 00:09:22.160 예측할 수 있는지 물었습니다. 00:09:23.427 --> 00:09:25.793 하지만 안타깝게도 00:09:25.817 --> 00:09:28.934 계속 실패했습니다. 00:09:29.793 --> 00:09:33.675 미래의 정신 구조를 예측하기엔 00:09:33.699 --> 00:09:36.492 의미론에 있는 정보가 충분하지 않았습니다. 00:09:36.516 --> 00:09:38.325 고대 문서로 했던 것처럼 00:09:38.349 --> 00:09:40.908 정신분열증 환자 집단과 00:09:40.908 --> 00:09:45.260 통제 집단을 구분짓기에는 충분했지만 00:09:45.284 --> 00:09:48.278 미래의 정신병 발달 가능성을 예측하기엔 부족했습니다. NOTE Paragraph 00:09:49.164 --> 00:09:50.870 그런데 우리는 깨달았습니다. 00:09:50.894 --> 00:09:54.982 가장 중요한 것은 그들의 말의 내용이 아니라 00:09:55.006 --> 00:09:56.679 말하는 방법일지도 모른다고요. 00:09:57.679 --> 00:09:58.899 더 자세히 말하자면 00:09:58.923 --> 00:10:01.750 의미론적으로 어느 단어 집단에 근접하느냐가 아니라 00:10:01.774 --> 00:10:04.374 한 의미론적 집단에서 다른 집단으로 00:10:04.398 --> 00:10:06.699 얼마나 멀리, 그리고 빠르게 건너뛰느냐는 것이죠. 00:10:07.247 --> 00:10:08.978 그래서 우리는 의미론적 일관성이라고 명명한 00:10:09.002 --> 00:10:11.391 이 측정법을 고안해냈습니다. 00:10:11.415 --> 00:10:16.219 하나의 의미론적 범주 안에 있는 하나의 의미론적 주제의 지속성을 00:10:16.243 --> 00:10:17.772 측정하는 방법이죠. NOTE Paragraph 00:10:19.294 --> 00:10:23.341 그리고 결과적으로 의미론적 일관성에 기반한 알고리즘은 00:10:23.365 --> 00:10:26.218 이 34명으로 이루어진 집단을 00:10:26.218 --> 00:10:32.168 누가 정신병에 걸리고 안 걸릴지 100%의 정확도로 예측할 수 있었습니다. 00:10:32.976 --> 00:10:35.913 이건 현존하는 그 어떤 임상 측정도 00:10:35.937 --> 00:10:40.545 근접하게조차 해낼 수 없었던 일입니다. NOTE Paragraph 00:10:42.525 --> 00:10:46.104 저는 생생하게 기억납니다. 이 연구를 하는 동안 00:10:46.128 --> 00:10:48.445 저는 컴퓨터 앞에 앉아서 00:10:48.469 --> 00:10:51.104 제가 부에노스 아이레스에 있을 당시 00:10:51.128 --> 00:10:54.295 제 첫 제자였던, 그리고 연구 당시에는 뉴욕에 살고 있던 폴로가 쓴 00:10:54.319 --> 00:10:56.389 트윗을 잔뜩 읽었습니다. 00:10:56.413 --> 00:10:58.501 명시적으로 드러난 건 없었기에 00:10:58.525 --> 00:11:02.026 무엇인지 정확히 말은 못하지만 트윗에는 뭔가가 있었습니다. 00:11:02.050 --> 00:11:04.071 저는 뭔가 잘못되고 있다는 걸 00:11:04.095 --> 00:11:07.050 직감적으로 강하게 느꼈습니다. 00:11:08.347 --> 00:11:11.070 그래서 폴로에게 전화를 했는데 00:11:11.094 --> 00:11:13.013 그는 실제로 아픈 상태였습니다. 00:11:13.362 --> 00:11:15.299 그리고 이 단순한 사실을 통해서 00:11:15.323 --> 00:11:17.814 글 속의 의미를 찾아내서 00:11:17.838 --> 00:11:22.100 그의 감정을 느낄 수 있는 것이 간단하지만 매우 효과적으로 00:11:22.124 --> 00:11:24.743 도울 수 있는 방법임을 알 수 있었습니다. NOTE Paragraph 00:11:25.987 --> 00:11:27.625 오늘 말씀드리는 것은 00:11:27.649 --> 00:11:30.157 우리 모두가 가지고 있고, 공유하는 직감을 00:11:30.181 --> 00:11:34.467 알고리즘으로 변환시키는 방법을 이해하는 데 00:11:34.491 --> 00:11:37.356 점점 더 가까워지고 있다는 것입니다. 00:11:38.102 --> 00:11:39.563 그럼으로써 00:11:39.587 --> 00:11:44.237 정신 건강의 전혀 다른 형태를 미래에 보게 될 수도 있습니다. 00:11:44.261 --> 00:11:49.882 우리가 쓰고, 말하는 단어의 00:11:49.906 --> 00:11:53.225 객관적, 양적, 자동적 분석에 기반해서요. NOTE Paragraph 00:11:53.225 --> 00:11:54.351 감사합니다. NOTE Paragraph 00:11:54.375 --> 00:11:59.978 (박수)