Return to Video

Tôi đã xây dựng một cỗ máy thông tin thời gian như thế nào

  • 0:00 - 0:03
    Đây là hình ảnh của hành tinh Trái Đất.
  • 0:03 - 0:06
    Nó trông giống với hình ảnh của Apollo
  • 0:06 - 0:08
    mà chúng ta thường biết.
  • 0:08 - 0:10
    Nhưng có một số khác biệt;
  • 0:10 - 0:11
    bạn có thể click vào nó,
  • 0:11 - 0:13
    và nếu click vào,
  • 0:13 - 0:16
    bạn có thể nhìn rõ hơn
    từ bất cứ nơi nào trên Trái Đất.
  • 0:16 - 0:18
    Ví dụ, đây là hình ảnh bao quát
  • 0:18 - 0:20
    của khuôn viên EPFL.
  • 0:20 - 0:22
    Trong nhiều trường hợp,
    bạn cũng có thể nhìn thấy
  • 0:22 - 0:26
    một tòa nhà trông như thế nào
    từ một con phố gần đó.
  • 0:26 - 0:28
    Điều này quả thực tuyệt vời.
  • 0:28 - 0:31
    Nhưng còn thiếu một điều trong
    chuyến hành trình thú vị này:
  • 0:31 - 0:33
    Đó là thời gian.
  • 0:33 - 0:36
    Tôi không chắc chắn là
    bức tranh này được chụp khi nào.
  • 0:36 - 0:38
    Tôi còn không chắc chắn
    liệu nó có được chụp
  • 0:38 - 0:44
    cùng thời điểm với khung cảnh
    nhìn từ trên cao.
  • 0:44 - 0:46
    Trong phòng thí nghiệm của tôi,
    chúng tôi phát triển các công cụ
  • 0:46 - 0:48
    để di chuyển không chỉ qua không gian
  • 0:48 - 0:50
    mà còn qua thời gian.
  • 0:50 - 0:52
    Loại câu hỏi
    mà chúng tôi thường đặt ra là
  • 0:52 - 0:54
    Liệu có thể xây dựng một cái gì đó
  • 0:54 - 0:56
    giống với Bản đồ Google
    trong quá khứ không?
  • 0:56 - 0:59
    Tôi có thể thêm một thanh trượt
    trên đầu Bản đồ Google
  • 0:59 - 1:01
    và điều chỉnh năm,
  • 1:01 - 1:03
    để xem nó có gì khác
    so với 100 năm trước,
  • 1:03 - 1:04
    1000 năm trước đây không?
  • 1:04 - 1:06
    Điều đó có thể không?
  • 1:06 - 1:09
    Tôi có thể thiết lập lại
    mạng lưới xã hội của quá khứ không?
  • 1:09 - 1:12
    Tôi có thể làm một trang Facebook
    của thời Trung cổ không?
  • 1:12 - 1:16
    Hay, tôi có thể làm một cỗ máy thời gian không?
  • 1:16 - 1:18
    Có lẽ chúng ta chỉ có thể nói rằng,
    "Không, tuyệt đối không thể."
  • 1:18 - 1:22
    Hoặc, có thể, chúng ta sẽ nghĩ về nó
    từ một cách nhìn thông tin khác.
  • 1:22 - 1:25
    Đây là cái mà tôi gọi là nấm thông tin.
  • 1:25 - 1:27
    Theo chiều dọc, bạn có thời gian.
  • 1:27 - 1:29
    Và theo chiều ngang
    là lượng thông tin số có sẵn.
  • 1:29 - 1:33
    Rõ ràng là, trong 10 năm qua,
    chúng ta có rất nhiều thông tin.
  • 1:33 - 1:36
    Và có thể thấy, chúng càng đi sâu vào quá khứ
    thì thông tin chúng ta có càng ít.
  • 1:36 - 1:39
    Nếu chúng ta muốn tạo ra một kiểu
    như Bản đồ Google của quá khứ
  • 1:39 - 1:40
    hoặc Facebook của quá khứ,
  • 1:40 - 1:42
    thì chúng ta cần mở rộng khu vực này,
  • 1:42 - 1:44
    chúng ta cần làm cho nó
    giống một hình chữ nhật.
  • 1:44 - 1:45
    Làm thế nào mà chúng ta làm được điều đó?
  • 1:45 - 1:47
    Có một cách là số hóa.
  • 1:47 - 1:49
    Có rất nhiều nguồn có sẵn --
  • 1:49 - 1:55
    báo chí, sách in, hàng ngàn cuốn sách in.
  • 1:55 - 1:57
    Tôi có thể số hóa tất cả.
  • 1:57 - 2:00
    Tôi có thể chọn lọc thông tin từ đó.
  • 2:00 - 2:04
    Dĩ nhiên là bạn càng lùi về quá khứ
    thì sẽ có ít thông tin hơn.
  • 2:04 - 2:06
    Nên, có thể sẽ không có đủ thông tin.
  • 2:06 - 2:09
    Nên, tôi có thể làm như các nhà sử học.
  • 2:09 - 2:10
    Tôi có thể ngoại suy.
  • 2:10 - 2:15
    Điều này là cái trong khoa học máy tính
    vẫn gọi là mô phỏng.
  • 2:15 - 2:16
    Nếu tôi có một quyển nhật kỳ hàng hải,
  • 2:16 - 2:19
    tôi có thể xem xét, nó không chỉ là
    một quyển nhật ký hàng hải
  • 2:19 - 2:22
    của một thuyền trưởng người Venice
    trên một hành trình đặc biệt.
  • 2:22 - 2:23
    Tôi có thể xem
    nó là một quyển nhật ký hàng hải thực sự
  • 2:23 - 2:26
    phản ánh rất nhiều hành trình
    trong giai đoạn đó.
  • 2:26 - 2:28
    Tôi đang ngoại suy.
  • 2:28 - 2:30
    Nếu có một bức tranh về bề ngoài,
  • 2:30 - 2:33
    tôi có thể nó như không phải là
    một tòa nhà bình thường,
  • 2:33 - 2:37
    mà nó còn chắc chắn
    chia sẻ cùng nguyên lý
  • 2:37 - 2:41
    tòa nhà nơi mà chúng ta
    đánh mất bất kỳ thông tin nào.
  • 2:41 - 2:44
    Vì thể nếu chúng ta muốn tạo ra
    một cỗ máy thời gian,
  • 2:44 - 2:45
    chúng ta cần 2 thứ.
  • 2:45 - 2:47
    Chúng ta cần một lượng tài liệu lớn,
  • 2:47 - 2:50
    và cần những chuyên gia xuất sắc.
  • 2:50 - 2:52
    Cỗ máy thời gian thành Venice,
  • 2:52 - 2:54
    dự án mà tôi đang nói với các bạn,
  • 2:54 - 2:57
    là một dự án hợp tác giữa EPFL
  • 2:57 - 3:00
    và trường Đại học Venice Ca'Foscari.
  • 3:00 - 3:02
    Có một điều rất khác biệt ở Venice,
  • 3:02 - 3:05
    làm cho việc quản lý nó trở nên
  • 3:05 - 3:07
    rất rất quan liêu.
  • 3:07 - 3:09
    Họ đã giữ gìn tất cả mọi thứ,
  • 3:09 - 3:12
    gần giống như Google ngày nay.
  • 3:12 - 3:13
    Ở Archivio di Stato,
  • 3:13 - 3:15
    bạn có 80 cây số dữ liệu
  • 3:15 - 3:17
    ghi chép mọi điều
  • 3:17 - 3:19
    về cuộc sống ở Venice
    hơn 100 năm qua.
  • 3:19 - 3:21
    Bạn có ghi chép về từng con thuyền đi ra,
  • 3:21 - 3:22
    đi vào cảng.
  • 3:22 - 3:25
    Bạn có tất cả mọi thay đổi
    có ở thành phố.
  • 3:25 - 3:29
    Tất cả đều ở đó.
  • 3:29 - 3:32
    Chúng tôi đang thiết lập
    một chương trình số hóa 10 năm
  • 3:32 - 3:34
    với mục tiêu là chuyển
  • 3:34 - 3:35
    những con số bị quên lãng này
  • 3:35 - 3:38
    vào trong một hệ thống thông tin khổng lồ.
  • 3:38 - 3:40
    Loại mục tiêu mà chúng tôi hướng đến
  • 3:40 - 3:45
    là số hóa 450 quyển sách một ngày.
  • 3:45 - 3:47
    Tất nhiên nếu chỉ số hóa thôi
    thì vẫn chưa đủ,
  • 3:47 - 3:48
    bởi vì những tài liệu này,
  • 3:48 - 3:51
    phần lớn là bằng tiếng Latin, bằng tiếng Ý,
  • 3:51 - 3:52
    bằng tiếng địa phương Venice,
  • 3:52 - 3:54
    vì thế bạn cần chuyển ngữ,
  • 3:54 - 3:56
    dịch thuật trong một số trường hợp,
  • 3:56 - 3:57
    và tra cứu.
  • 3:57 - 3:59
    và điều này rõ ràng là
    không hề dễ dàng.
  • 3:59 - 4:03
    Đặc biệt là phương pháp nhận biết
    bằng quang học các ký tự cổ
  • 4:03 - 4:04
    mà có thể được sử dụng với các bản in,
  • 4:04 - 4:08
    lại không hiệu quả
    đối với các bản viết tay.
  • 4:08 - 4:10
    Vì thế giải pháp là
    cần phải có sự giúp đỡ
  • 4:10 - 4:13
    từ một nguồn khác:
    nhận biết bằng giọng nói.
  • 4:13 - 4:15
    Đây là nguồn nghe có vẻ như không tưởng,
  • 4:15 - 4:18
    nhưng có thể được hoàn thiện
  • 4:18 - 4:20
    một cách đơn giản bằng việc
    cho thêm các ràng buộc.
  • 4:20 - 4:22
    Nếu bạn sử dụng một mô hình
  • 4:22 - 4:23
    ngôn ngữ tốt,
  • 4:23 - 4:25
    nếu bạn có một mô hình văn bản tốt,
  • 4:25 - 4:27
    thì cấu trúc của nó cũng sẽ rất tuyệt.
  • 4:27 - 4:28
    Và đây là những văn bản hành chính.
  • 4:28 - 4:30
    Chúng đều có cấu trúc tốt
    trong nhiều trường hợp.
  • 4:30 - 4:33
    Nếu bạn chia lượng dữ liệu lớn này
    thành các tập con nhỏ hơn
  • 4:33 - 4:36
    nơi mà một tập con nhỏ hơn
    chia sẻ các tài nguyên tương tự nhau,
  • 4:36 - 4:40
    thì có cơ hội để thành công.
  • 4:43 - 4:45
    Nếu chúng ta làm được điều đó
    thì còn một vấn đề nữa:
  • 4:45 - 4:49
    chúng ta có thể chọn lọc sự kiện
    từ những tài liệu này.
  • 4:49 - 4:51
    Có tới 10 tỷ sự kiện
  • 4:51 - 4:53
    có thể được chọn ra từ dữ liệu này.
  • 4:53 - 4:55
    Và hệ thống thông tin khổng lồ này
  • 4:55 - 4:56
    có thể được tìm thấy bằng nhiều cách.
  • 4:56 - 4:58
    Bạn có thể hỏi các câu kiểu như,
  • 4:58 - 5:01
    "Ai sống trong tòa nhà này vào năm 1323?"
  • 5:01 - 5:03
    "Một con cá tráp biển có giá bao nhiêu
    ở siêu thị Realto
  • 5:03 - 5:05
    vào năm 1434?"
  • 5:05 - 5:06
    "Mức lương của một thợ làm kính
  • 5:06 - 5:08
    ở Murano có thể có được
  • 5:08 - 5:09
    sau hơn mười năm là bao nhiêu?"
  • 5:09 - 5:11
    Bạn cũng có thể hỏi những câu hỏi rộng hơn
  • 5:11 - 5:14
    bởi nó được mã hóa bằng từ ngữ.
  • 5:14 - 5:16
    Và sau đó cái mà bạn có thể làm
    là cho nó vào không gian,
  • 5:16 - 5:18
    vì phần lớn những thông tin thuộc về không gian.
  • 5:18 - 5:20
    Và từ đó, bạn có thể làm những việc như
  • 5:20 - 5:22
    xây dựng lại một hành trình không tưởng
  • 5:22 - 5:25
    về thành phố đã có được
    một sự phát triển bền vững
  • 5:25 - 5:27
    qua hàng nghìn năm,
  • 5:27 - 5:29
    đang cố để luôn giữ được
  • 5:29 - 5:32
    một hình thái cân bằng với môi trường.
  • 5:32 - 5:33
    Bạn có thể tái dựng lại hành trình đó,
  • 5:33 - 5:36
    mường tượng nó theo nhiều cách.
  • 5:36 - 5:39
    Nhưng đương nhiên, bạn không thể hiểu được
    Venice, nếu chỉ nhìn vào thành phố.
  • 5:39 - 5:41
    Bạn phải đặt nó
    trong một hệ thống châu Âu rộng hơn.
  • 5:41 - 5:44
    Vì thế, ý tưởng cũng là
    để ghi chép tất cả mọi việc
  • 5:44 - 5:46
    được làm ở đẳng cấp châu Âu.
  • 5:46 - 5:48
    Chúng tôi cũng có thể tái dựng hành trình
  • 5:48 - 5:50
    của Đế chế hàng hải Venice,
  • 5:50 - 5:54
    cách nó dần dần điều khiển
    tiến trình biển Adriatic,
  • 5:54 - 5:57
    cách nó trở thành đế chế trung cổ
    quyền lực nhất
  • 5:57 - 5:59
    thời đó,
  • 5:59 - 6:01
    quản lý phần lớn các lộ trình biển
  • 6:01 - 6:04
    từ bắc tới nam.
  • 6:05 - 6:08
    Nhưng bạn thậm chí
    còn làm được những thứ khác,
  • 6:08 - 6:10
    vì trong những hành trình hàng hải này,
  • 6:10 - 6:12
    có những mô hình quen thuộc.
  • 6:12 - 6:14
    Bạn có thể đi trước một bước
  • 6:14 - 6:17
    và thực sự tạo ra
    một hệ thống mô phỏng,
  • 6:17 - 6:19
    tạo ra một bản mô phỏng Địa Trung Hải
  • 6:19 - 6:22
    mà có thể thực sự tái dựng lại
  • 6:22 - 6:24
    cả những thông tin còn thiếu,
  • 6:24 - 6:27
    và cho phép chúng ta
    đặt ra mọi câu hỏi
  • 6:27 - 6:30
    như thể bạn đang sử dụng
    một bản kế hoạch hải trình vậy.
  • 6:30 - 6:33
    "Nếu tôi đang ở đảo Corfu
    vào tháng 6/1323
  • 6:33 - 6:36
    và muốn đến thành phố Constantinople,
  • 6:36 - 6:38
    tôi có thể đi thuyền từ đâu?"
  • 6:38 - 6:39
    Chắc chắn chúng ta có thể trả lời câu hỏi đó
  • 6:39 - 6:44
    với độ chính xác từ một, hai, hay ba ngày.
  • 6:44 - 6:45
    "Sẽ mất khoảng bao nhiêu tiền?"
  • 6:45 - 6:49
    "Cơ hội gặp phải cướp biển là bao nhiêu?"
  • 6:49 - 6:51
    Dĩ nhiên, bạn hiểu rằng,
  • 6:51 - 6:53
    thách thức khoa học chính
    của một dự án như thế này
  • 6:53 - 6:57
    là việc xác định tiêu chuẩn,
    số lượng và biểu đạt
  • 6:57 - 7:00
    sự không chắc chắn và mâu thuẫn
    ở mỗi bước của quá trình.
  • 7:00 - 7:03
    Có nhiều lỗi sai, trong văn bản,
  • 7:03 - 7:06
    có thể là sai tên thuyền trưởng,
  • 7:06 - 7:09
    một số thuyền thực ra
    chưa bao giờ ra khơi.
  • 7:09 - 7:14
    Có lỗi sai trong việc dịch,
    chênh lệch về trích dẫn,
  • 7:14 - 7:17
    và hơn hết là,
    nếu bạn thêm vào các quá trình thuật toán,
  • 7:17 - 7:20
    bạn sẽ có các lỗi sai trong việc nhận diện,
  • 7:20 - 7:22
    trong việc chắt lọc thông tin,
  • 7:22 - 7:26
    hay bạn có một dữ liệu
    rất không chắc chắn.
  • 7:26 - 7:30
    Thế thì làm thế nào chúng ta có thể phát hiện
    và sửa chữa những mâu thuẫn đó?
  • 7:30 - 7:34
    Làm thế nào để trình bày
    các hình thái không chắc chắn đó?
  • 7:34 - 7:36
    Rất khó. Điều duy nhất bạn có thể làm
  • 7:36 - 7:38
    là ghi chép từng quá trình một,
  • 7:38 - 7:41
    không chỉ việc mã hóa thông tin lịch sử
  • 7:41 - 7:43
    mà còn là cái được gọi là
    thông tin lịch sử bên lề,
  • 7:43 - 7:46
    cách các hiểu biết về lịch sử
    được xây dựng,
  • 7:46 - 7:48
    ghi chép từng bước một.
  • 7:48 - 7:50
    Điều đó không chỉ đảm bảo rằng
    chúng ta đang thực sự nói về
  • 7:50 - 7:52
    một câu chuyện Venice độc nhất,
  • 7:52 - 7:54
    mà còn chắc chắn được
    chúng ta đang tái dựng
  • 7:54 - 7:57
    một câu chuyện của Venice
    được ghi chép lại đầy đủ.
  • 7:57 - 7:59
    Có thể sẽ không chỉ có
    một bản đồ duy nhất.
  • 7:59 - 8:01
    Có thể sẽ có vài bản đồ.
  • 8:01 - 8:03
    Hệ thống nên cho phép điều đó,
  • 8:03 - 8:06
    bởi vì chúng ta phải chấp nhận
    một hình thái không chắc chắn mới,
  • 8:06 - 8:11
    cái thực sự mới
    đối với loại dữ liệu khổng lồ này.
  • 8:11 - 8:13
    Và chúng ta nên truyền đạt nghiên cứu mới này
  • 8:13 - 8:17
    tới lượng lớn khán giả bằng cách nào?
  • 8:17 - 8:19
    Một lần nữa, Venice lại là một ngoại lệ.
  • 8:19 - 8:22
    Với hàng tỷ du khách đến đây, hàng năm,
  • 8:22 - 8:23
    Venice thực sự
    là một trong những địa điểm lý tưởng
  • 8:23 - 8:26
    để thử nghiệm việc tạo ra bảo tàng của tương lai.
  • 8:26 - 8:30
    Hãy tưởng tượng, theo chiều ngang
    bạn nhìn thấy bản đồ được tái dựng
  • 8:30 - 8:31
    trong một năm bất kỳ được chọn,
  • 8:31 - 8:34
    và theo chiều dọc ,bạn sẽ thấy các số liệu
  • 8:34 - 8:35
    phục vụ cho việc tái dựng đó,
  • 8:35 - 8:39
    chẳng hạn như các bức vẽ.
  • 8:39 - 8:41
    Tưởng tượng một hệ thống chìm cho phép
  • 8:41 - 8:45
    đi đến, nghiên cứu và tái dựng lại
    Venice của một năm cho trước,
  • 8:45 - 8:48
    một vài kinh nghiệm
    mà bạn có thể chia sẻ trong một nhóm.
  • 8:48 - 8:50
    Trái lại, tưởng tượng rằng
    bạn đang thực sự bắt đầu
  • 8:50 - 8:52
    từ một dữ liệu, một bản chép tay
    tiếng Venice địa phương,
  • 8:52 - 8:55
    và bạn chỉ ra
    cái mà bạn có thể xây dựng được từ nó,
  • 8:55 - 8:57
    nó được giải mã như thế nào,
  • 8:57 - 8:59
    nội dung của dữ liệu đó
    có thể được tái tạo ra sao.
  • 8:59 - 9:01
    Đây là một bức tranh từ một triển lãm
  • 9:01 - 9:03
    đang diễn ra tại Geneva
  • 9:03 - 9:06
    về loại hệ thống đó.
  • 9:06 - 9:08
    Vì thế tóm lại, chúng ta có thể nói rằng
  • 9:08 - 9:11
    nghiên cứu về nhân loại
    là việc trải qua
  • 9:11 - 9:13
    một cuộc tiến hóa
  • 9:13 - 9:17
    có thể giống như những gì xảy ra
    với khoa học cuộc sống 30 năm trước.
  • 9:17 - 9:22
    Đó thực sự là một câu hỏi về quy mô.
  • 9:22 - 9:25
    Chúng tôi thấy dự án này
  • 9:25 - 9:29
    không thể do bất kỳ đội nghiên cứu riêng biệt nào
    đảm nhiệm,
  • 9:29 - 9:32
    và điều này thực sự mới mẻ đối với nhân loại,
  • 9:32 - 9:35
    cái thường đòi hỏi việc phải làm
  • 9:35 - 9:39
    theo từng nhóm nhỏ hoặc
    chỉ với một vài nhà nghiên cứu.
  • 9:39 - 9:42
    Khi đến thăm Archivio di Stato,
  • 9:42 - 9:44
    bạn sẽ nhận ra việc này
    vượt xa khả năng của bất kỳ một đội đơn lẻ nào,
  • 9:44 - 9:48
    và nó nên có một nỗ lực hợp tác cùng nhau.
  • 9:48 - 9:51
    Vì thế, cái mà chúng tôi có thể
    làm được cho tiến trình biến hóa này
  • 9:51 - 9:53
    là ấp ủ một thế hệ mới
  • 9:53 - 9:55
    của "nhân văn số học"
  • 9:55 - 9:57
    cái đang ngày một sẵn sàng
    cho bước chuyển mình này.
  • 9:57 - 9:59
    Xin cảm ơn rất nhiều.
  • 9:59 - 10:03
    (Vỗ tay)
Title:
Tôi đã xây dựng một cỗ máy thông tin thời gian như thế nào
Speaker:
Frederic Kaplan
Description:

Hãy tưởng tượng nếu bạn có thể lướt Facebook... từ thời Trung cổ. Việc đó có thể sẽ không còn xa nữa. Bằng cách nói chuyện thú vị và hài hước, nhà nghiên cứu và kĩ sư Frederic Kaplan đã giới thiệu Cỗ máy thời gian thành Venice, một dư án số hóa 80 cây số dữ liệu nhằm tạo ra một mô phỏng về địa lý và lịch sử thành Venice qua 1000 năm. (Ghi hình tại TEDxCaFoscariU.)

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
10:20
  • Bài dịch rất tốt. Lưu ý thêm về bỏ dấu nha bạn.
    Mình chỉnh sửa lại một vài chỗ. Bạn xem qua lại nhé.

    Thân,
    Như

Vietnamese subtitles

Revisions