Return to Video

컴퓨터는 어떻게 언어를 번역할까? |이오니스 파파치모나스(Ioannis Papachimonas)

  • 0:07 - 0:11
    영화나 텔레비전에 등장하는
    수많은 외계 종족들은
  • 0:11 - 0:14
    어떻게 완벽한 영어를
    구사하는 걸까요?
  • 0:14 - 0:18
    간단히 말하자면, 우주 승무원이
    수년 간 외계어 사전을 번역하는 것을
  • 0:18 - 0:22
    아무도 보고 싶어하지
    않기 때문일 겁니다.
  • 0:22 - 0:23
    그러나 일관성을 유지하기 위해서
  • 0:23 - 0:27
    "스타 트렉"과 다른
    공상과학영화 제작자들은
  • 0:27 - 0:31
    '만능 번역기'라는
    개념을 만들어냈습니다.
  • 0:31 - 0:35
    어떤 언어라도 바로
    번역해주는 휴대용 번역기이죠.
  • 0:35 - 0:39
    그런데 과연 이게
    현실에서 가능한 걸까요?
  • 0:39 - 0:42
    사실 그런 기능이 있다고 '주장'하는
    프로그램들은 이미 많이 있습니다.
  • 0:42 - 0:46
    한 언어로 된 단어나 문장,
    아니면 책 전체를
  • 0:46 - 0:49
    거의 모든 언어로 번역해주는 것이죠.
  • 0:49 - 0:52
    현대 영어로든,
    고대 산스크리트어로든요.
  • 0:52 - 0:56
    만약 번역이 단순히 사전에서
    단어를 찾는 것의 문제였다면
  • 0:56 - 1:00
    이런 번역 프로그램들은
    인간을 훨씬 능가했을 겁니다.
  • 1:00 - 1:03
    하지만 현실은 좀 더 복잡합니다.
  • 1:03 - 1:07
    규칙 기반 번역 프로그램의 경우에는
    '어휘 데이터베이스'를 사용하는데,
  • 1:07 - 1:10
    이는 사람들이 사전에서 찾는 단어와
  • 1:10 - 1:13
    사용하는 문법의 구조와
  • 1:13 - 1:19
    입력된 언어의 기본적인 요소들을
    인식하는 법칙들을 모두 포함합니다.
  • 1:19 - 1:22
    '아이들이 머핀을 먹는다.'와 같이
    간단해 보이는 문장의 경우에
  • 1:22 - 1:27
    번역 프로그램은 가장 먼저
    구문이나 문법구조를 분석합니다.
  • 1:27 - 1:30
    '아이들'을 주어로
  • 1:30 - 1:32
    그리고 문장의 나머지 부분들은
  • 1:32 - 1:34
    '먹다'라는 동사와
  • 1:34 - 1:37
    '머핀'이라는 직접 목적어로
    구성된 술부로 인식하는 거죠.
  • 1:37 - 1:40
    다음 단계로 프로그램은
    영어를 형태론적으로 인지하거나
  • 1:40 - 1:45
    의미를 갖는 가장 작은 단위로
    언어가 어떻게 분해되는지를 찾게 됩니다.
  • 1:45 - 1:46
    단어 'muffins'가 'muffin'과
  • 1:46 - 1:50
    복수형을 나타내는
    접미사 's'로 나뉘는 것처럼요.
  • 1:50 - 1:52
    마지막으로 의미론에 대한
    이해가 필요합니다.
  • 1:52 - 1:56
    다시 말해, 문장 각 부분의
    실제 의미를 파악하는 거죠.
  • 1:56 - 1:58
    이 문장을 제대로 번역하기 위해
  • 1:58 - 2:02
    프로그램은 각각의 단어와 법칙들을
  • 2:02 - 2:05
    번역하려는 언어의
    각 요소에 적용합니다.
  • 2:05 - 2:07
    하지만 이 과정은 정말 까다롭습니다.
  • 2:07 - 2:12
    몇몇 언어의 구문론에서는
    단어를 어떤 순서로 배열하든 상관 없지만
  • 2:12 - 2:17
    어떤 언어의 경우에는 순서가 잘못되었을 때
    '머핀이 아이들을 먹게' 될 수도 있습니다.
  • 2:17 - 2:20
    형태론과 관련해서도
    문제가 발생할 수 있습니다.
  • 2:20 - 2:23
    슬로베니아어의 경우에는
    두 명, 세 명, 또는 그 이상의 아이들을
  • 2:23 - 2:27
    다른 많은 언어에서는 볼 수 없는
    '이중 접미사'를 이용해 구분합니다.
  • 2:27 - 2:31
    반면 러시아어에는
    정관사가 부족하기 때문에
  • 2:31 - 2:34
    아이들이 '특정한 머핀'을 먹는 건지
  • 2:34 - 2:37
    아니면 '그냥 머핀'을 먹는 건지
    의문을 남길 수 있습니다.
  • 2:37 - 2:40
    마지막으로 의미적인 부분이
    기술적으로는 정확하다고 해도
  • 2:40 - 2:43
    번역 프로그램은
    미세한 점을 놓칠 수 있습니다.
  • 2:43 - 2:46
    아이들이 머핀을 '그냥' 먹는지
  • 2:46 - 2:48
    아니면 '게걸스럽게' 먹는지요.
  • 2:48 - 2:52
    또 다른 번역 방식은
    통계에 근거한 번역 시스템입니다.
  • 2:52 - 2:56
    이 프로그램의 경우에는
    사람들이 이미 번역해 놓은
  • 2:56 - 2:59
    책, 기사 또는 문서들의 통계 자료를
    분석해서 언어를 번역합니다.
  • 2:59 - 3:03
    원본과 번역본에서 어떤 부분이
    우연히 일치할 가능성은 거의 없기 때문에
  • 3:03 - 3:05
    원본과 번역본 사이에
    일치하는 부분을 찾음으로써
  • 3:05 - 3:09
    프로그램은 서로의 언어에 부합하는
    구절과 패턴을 찾을 수 있고
  • 3:09 - 3:12
    이를 앞으로의 번역 과정에
    사용할 수 있습니다.
  • 3:12 - 3:15
    하지만 이런 방식의 번역은
  • 3:15 - 3:18
    초기 데이터베이스의 규모와
  • 3:18 - 3:21
    특정 언어나 문체의 예시가
    존재하는지의 여부에 따라
  • 3:21 - 3:23
    번역의 질이 좌우됩니다.
  • 3:23 - 3:27
    예외적 요소들이나 불규칙한 부분들,
    혹은 말의 뉘앙스와 같이
  • 3:27 - 3:31
    인간에게 자연스러운 요소들이
    컴퓨터에게는 어려운 점일 수 있으며
  • 3:31 - 3:35
    때문에 어떤 연구자들은 언어의 이해가
  • 3:35 - 3:39
    생물학적 뇌 구조의
    독특한 산물이라고 봅니다.
  • 3:39 - 3:43
    실제로, 유명한 가상 번역기 중 하나인
  • 3:43 - 3:46
    '은하수를 여행하는
    히치하이커를 위한 안내서'의 '바벨 피쉬'도
  • 3:46 - 3:50
    기계가 아닌 하나의 작은 생명체로서
  • 3:50 - 3:54
    텔레파시를 통해 지각이 있는 생명체들의
  • 3:54 - 3:57
    뇌파와 신경 신호를 번역합니다.
  • 3:57 - 4:00
    당분간은 컴퓨터 번역 프로그램을
    사용하는 것보다
  • 4:00 - 4:05
    지금까지 그랬던 것처럼
    언어를 배우는 게 더 나을 겁니다.
  • 4:05 - 4:07
    물론 언어를 배우는 일이
    결코 쉬운 일은 아닙니다.
  • 4:07 - 4:09
    하지만 전 세계적으로
    수많은 언어가 존재하고
  • 4:09 - 4:13
    다양한 언어를 사용하는 사람들 간의
    의사소통이 증가하고 있는 만큼
  • 4:13 - 4:18
    자동 번역기의 발전을 위한
    노력도 계속될 것입니다.
  • 4:18 - 4:21
    아마도 우리가 외계인을
    만나게 될 때쯤이면
  • 4:21 - 4:25
    작고 간단한 장치를 통해
    그들과 의사소통을 할 수 있을 겁니다.
  • 4:25 - 4:29
    아니면 결국 외계어 사전 편찬을
    시작해야 할 지도 모르는 일이죠.
Title:
컴퓨터는 어떻게 언어를 번역할까? |이오니스 파파치모나스(Ioannis Papachimonas)
Speaker:
Ioannis Papachimonas
Description:

전체 강의 보기: http://ed.ted.com/lessons/how-computers-translate-human-language-ioannis-papachimonas

만능 번역기가 실제로 가능할까요? 단어, 문장, 또는 책 전체를 거의 모든 언어로 번역해준다는 프로그램들이 이미 많이 있습니다. 하지만 현실은 좀더 복잡합니다. 이오니스 파파치모나스는 이런 기계 번역기가 어떻게 작동하고 왜 자주 좀 뒤죽박죽이 되는지 설명합니다.

강의: 이오니스 파파치모나스
애니메이션: 노웨이 비디오 클럽

more » « less
Video Language:
English
Team:
closed TED
Project:
TED-Ed
Duration:
04:45

Korean subtitles

Revisions