Return to Video

How computers translate human language

  • 0:06 - 0:11
    Làm cách nào mà sinh vật
    giữa các thiên hà trên phim, TV
  • 0:11 - 0:14
    có thể nói tiếng Anh một cách
    trôi chảy nhỉ?
  • 0:14 - 0:18
    Ngắn gọn đó là chả ai muốn xem một
    thuyền trưởng phi hành đoàn
  • 0:18 - 0:22
    dành nhiều năm trời để tìm hiểu từ điển
    của người ngoài hành tinh.
  • 0:22 - 0:23
    Nhưng để cho hợp lí
  • 0:23 - 0:27
    các nhà sản xuất phim Chiến tranh giữa
    các vì sao và những phim khác
  • 0:27 - 0:31
    đã đưa ra một khái niệm máy phiên dịch
    vũ trụ-
  • 0:31 - 0:35
    một thiết bị cầm tay có thể dịch tức thì
    ngôn ngữ nào.
  • 0:35 - 0:39
    Liệu máy phiên dịch vũ trụ có tồn tại
    trong đời thật?
  • 0:39 - 0:42
    Chúng ta đã có nhiều chương trình
    máy tính chứng minh được khả năng này
  • 0:42 - 0:46
    đánh 1 từ, 1 câu hoặc cả 1 cuốn sách
    bằng 1 ngôn ngữ
  • 0:46 - 0:49
    và dịch ra bất kì ngôn ngữ nào khác
  • 0:49 - 0:52
    cho dù đó là tiếng Anh hiện đại hay tiếng
    Phạn cổ.
  • 0:52 - 0:56
    Nếu như việc dịch thuật chỉ đơn thuần là
    tra nghĩa trong từ điển
  • 0:56 - 1:00
    thì những chương trình này sẽ dịch
    còn tốt hơn so với con người.
  • 1:00 - 1:03
    Thực tế là, câu chuyện phức tạp hơn
    như thế một chút.
  • 1:03 - 1:07
    Nguyên tắc cơ bản của một chương
    trình dịch là sử dụng hệ thông tin từ vựng
  • 1:07 - 1:10
    bao gồm tất cả những từ mà bạn sẽ tìm
    thấy trong từ điển
  • 1:10 - 1:13
    và các dạng ngữ pháp có thể có thể có
  • 1:13 - 1:19
    và bộ nguyên tắc để nhận diện thành
    phần ngôn ngữ học thiết yếu cần dịch.
  • 1:19 - 1:22
    Thử lấy một ví dụ có vẻ đơn giản:
    "The children eat the muffins"
  • 1:22 - 1:27
    chương trình sẽ đầu tiên phân tích cấu
    trúc ngữ pháp câu
  • 1:27 - 1:30
    bằng cách định dạng "The children" là
    chủ ngữ
  • 1:30 - 1:32
    và phần còn lại của câu là vị ngữ
  • 1:32 - 1:34
    động từ là "eat",
  • 1:34 - 1:37
    và tân ngữ trực tiếp là "the muffins".
  • 1:37 - 1:40
    Sau đó nó cần nhận diện hình thái ngôn
    ngữ của tiếng Anh
  • 1:40 - 1:45
    hay làm cách nào mà ngôn ngữ này có thể
    chia thành những đơn vị nghĩa nhỏ nhất,
  • 1:45 - 1:46
    ví dụ từ "muffin"
  • 1:46 - 1:50
    và hậu tố "s", sử dụng để chỉ số nhiều.
  • 1:50 - 1:53
    Cuối cùng câu dịch cần được hiểu về ngữ
    nghĩa học,
  • 1:53 - 1:56
    mỗi phần của câu thực tế ra có nghĩa gì.
  • 1:56 - 1:58
    Để dịch một câu chính xác,
  • 1:58 - 2:02
    chương trình sẽ quy ra hệ từ
    vựng và quy tắc
  • 2:02 - 2:05
    của mỗi thành phần trong ngôn ngữ đích.
  • 2:05 - 2:07
    Nhưng đây là lúc dễ gây ra nhầm lẫn.
  • 2:07 - 2:12
    Cú pháp của một số ngôn ngữ cho phép
    từ được đặt không cần theo trật tự,
  • 2:12 - 2:17
    trong khi có những ngôn ngữ có thể khiến
    câu trở thành "The muffin eat the child".
  • 2:17 - 2:20
    Hình thái ngôn ngữ cũng có thể
    gây ra rắc rối khi dịch.
  • 2:20 - 2:23
    Tiếng Slovene có sự phân biệt giữa 2 đứa
    trẻ và 3 đứa trẻ hoặc nhiều hơn
  • 2:23 - 2:27
    khi sử dụng cặp hậu tố mà những ngôn
    ngữ khác không có,
  • 2:27 - 2:31
    trong khi tiếng Nga lại không sử dụng
    mạo từ có thể khiến bạn băn khoăn
  • 2:31 - 2:34
    liệu là bọn trẻ đang ăn những cái bánh
    muffin cụ thể
  • 2:34 - 2:37
    hay chỉ là ăn theo nghĩa chung.
  • 2:37 - 2:40
    Cuối cùng, cho dù ngữ nghĩa có đúng
    về mặt kĩ thuật,
  • 2:40 - 2:43
    chương trình có thể dịch chưa phù hợp,
  • 2:43 - 2:46
    như bọn trẻ ăn bánh muffin một cách
    bình thường,
  • 2:46 - 2:48
    hay ăn một cách ngấu nghiến.
  • 2:48 - 2:52
    Một phương thức dịch khác
    là máy dịch dữ liệu,
  • 2:52 - 2:56
    phân tích những dữ liệu trong sách, báo
    hay tài liệu
  • 2:56 - 2:59
    mà đã được dịch sẵn.
  • 2:59 - 3:03
    Bằng cách tìm ra sự phù hợp giữa dữ
    liệu nguồn và bài đã được dịch,
  • 3:03 - 3:05
    điều mà khó xảy ra một cách ngẫu nhiên,
  • 3:05 - 3:09
    chương trình này có thể xác định những cụm
    và mẫu câu tương đương
  • 3:09 - 3:12
    và sử dụng chúng khi cần đến trong
    tương lai
  • 3:12 - 3:15
    Tuy nhiên chất lượng dịch kiểu này
  • 3:15 - 3:18
    phụ thuộc vào dữ liệu ban đầu
  • 3:18 - 3:21
    và sự sẵn có các mẫu trong những ngôn
    ngữ nhất định
  • 3:21 - 3:23
    hay phong cách viết.
  • 3:23 - 3:27
    Khó khăn mà máy tính gặp phải với
    những ngoại lệ và trường hợp bất quy tắc
  • 3:27 - 3:31
    và nghĩa có vẻ tự nhiên như con người
  • 3:31 - 3:35
    đã khiến các nhà khoa học tin rằng thấu
    hiểu ngôn ngữ
  • 3:35 - 3:39
    là sản phẩm đặc trưng của cấu trúc sinh
    học của não bộ.
  • 3:39 - 3:43
    Thực tế, một trong những máy phiên
    dịch ảo vũ trụ nổi tiếng nhất,
  • 3:43 - 3:46
    Babel fish, trong phim
    "The Hitchhiker's Guide to the Galaxy",
  • 3:46 - 3:50
    không hoàn toàn là 1 cái máy, mà
    là 1 sinh vật bé
  • 3:50 - 3:54
    có thể dịch được sóng não và tín hiệu
    thần kinh của những sinh vật có tri giác
  • 3:54 - 3:57
    thông qua một dạng cảm nhận.
  • 3:57 - 4:00
    Cho đến nay, học một ngôn ngữ nào
    theo cách truyền thống
  • 4:00 - 4:05
    đều đem lại kết quả tốt hơn so với
    các chương trình dịch có sẵn.
  • 4:05 - 4:07
    Nhưng đây không là cách đơn giản
  • 4:07 - 4:09
    và số lượng lớn các ngôn ngữ trên
    thế giới
  • 4:09 - 4:13
    cũng như việc ngày càng tăng số lượng
    người nói chúng,
  • 4:13 - 4:18
    điều này sẽ tiếp tục khuyến khích phát
    triển các máy phiên dịch tự động.
  • 4:18 - 4:21
    Đến khi chúng ta tiếp xúc với
    dạng thể sống khác trong các dãi ngân hà
  • 4:21 - 4:25
    chúng ta có thể giao tiếp với họ bằng 1
    thiết bị gọn nhẹ
  • 4:25 - 4:29
    hoặc chúng ta tiếp tục phải tra từ điển
    như cũ.
Title:
How computers translate human language
Speaker:
Ioannis Papachimonas
Description:

more » « less
Video Language:
English
Team:
closed TED
Project:
TED-Ed
Duration:
04:45

Vietnamese subtitles

Revisions