"몇몇은 위대하게 타고났고,
몇몇은 위대한 것을 이루며,
몇몇은 위대한 추진력을 지녔다"라고
셰익스피어는 말했습니다.
정말 그가 남긴 격언일까요?
몇몇의 사람들은 셰익스피어의 작품이
과연 그의 것인지 의심하기도 하며,
존재 자체에 대한
의문을 갖기도 합니다.
그들은 '셰익스피어'라는 이름이
다른 작가 또는
여러 작가들의 필명일것이라 추측합니다.
'진짜 셰익스피어'로
예측된 이들 중에는
유명한 각본가, 정치인 그리고
저명한 여성들이 포함이 되어있습니다.
실제로 영국의 문호가는
그의 각본만큼 허구적인 인물이었을까요?
셰익스피어를 연구한 많은학자들은
역사적, 생물학적 증거들에 기반한
이 이론을 묵살하곤 합니다.
하지만, 셰익스피어의 유명한 명언들이
다른 이들에 의해 쓰여진 것인지를
알 수 있는 방법이 있습니다.
언어를 다루는 언어학은
통사론, 문법, 의미론, 어휘의
검증에 의해서
우리가 말하고 쓰는 방식에 대해
많은 것을 알려줍니다.
1800년대 후반,
폴란드 철학자인 윈센티 루토스와스키는
계량문체론(작가의 문체를 통계적 분석)
을 만들었고,
문학 작품들의 원저자를 찾는데에
이 이론을 이용하기 시작했습니다.
이 이론은 어떻게 적용되는 것일까요?
이 이론은 작가들의 작품은
각각 고유의 특징이 있고,
그 특징은 각기 다른 글에서
일관성있게 나타난다고 말합니다.
예를 들자면 한 문장의 평균 길이,
단어의 배치 방식,
한 문장 속 단어가 반복되는
정도도 이에 포합됩니다.
"Thee"라는 단어의 사용을
범위 또는 축으로 상상해봅시다.
셰익스피어의 작품은 한 축에 존재하고,
작품 속 특정단어의 빈도수가
측정점이 됩니다.
통계학적으로, 이 점들 간의 관련성은
우리에게 '변화량', 즉
이 데이터의 예상측정치를 알려줍니다.
그러나, 이것은 고차원적인 이론 중
단 한가지에 불과합니다.
주요 성분 분석으로 불리우는
집단화를 이용해
다차원의 공간을 단순한
성분요소들로 줄여,
셰익스피어 작품 속에 나타나는 변화를
총괄하여 측정할 수 있습니다.
그 다음, 후보자들(셰익스피어로
예측된 사람들)의 작품을
주성분 분석에 대입하여
실험을 해볼 수 있습니다.
예를 들어,
프란시스 베이컨의 작품들이
셰익스피어 작품의 빈도수와 비슷하다면
이 설득력있는 연구가
프란시스 베이컨과 셰익스피어는
동일인물이라고 얘기해주는 셈 입니다.
결과는 무엇이었을까요?
이 이론을 만든 통계학자가 말하기를,
셰익스피어는 셰익스피어
자신이라고 했습니다.
즉, 시인은 시인이란 것입니다.
다른 이들의 작품은 셰익스피어 고유의
특징을 갖고있지 않았습니다.
그러나, 우리의 대담한 통계학자들은
공동집필이라는 설득력있는
증거들을 찾아내었습니다.
예를 들어, 최근 한 연구에서는
셰익스피어가 극작가 크리스토퍼 말로와
"Henry VI"의 제 1부와 2부를
공동으로 집필했다는 결과가 나왔습니다.
셰익스피어의 정체성은 이 이론이 해결할
수 있는 수 많은 문제중 하나입니다.
그래서 이 이론은, 작품이 쓰여졌을 때
그것이 고대 작품을 위조한 것인지
학생이 표절을 한 것인지
당신이 받은 메일이 중요한 것인지,
그저 스팸인지 알려주는 역할을 합니다.
시대를 뛰어넘는 그 격언이
셰익스피어의 것인지를
단지 숫자와 통계의 문제만으로
보아도 되는 것일까요?
그렇지 않습니다.
이 이론은 셰익스피어 작품이 뚜렷한
구조를 가진다는 걸 보여줄지는 모르지만
이 이론은 작품들이 표현하는
정서와 감정들의 아름다움과
그것이 우리에게 영향을 미치는 이유에
대해서는 설명하지는 못합니다.
최소한 아직까지는 그렇습니다.