Return to Video

Big data (dữ liệu lớn) là dữ liệu tốt hơn

  • 0:01 - 0:05
    Loại bánh ưa thích tại Mỹ là ?
  • 0:05 - 0:08
    Khán giả: Bánh táo.
    Kenneth Cukier: Bánh táo. Tất nhiên rồi.
  • 0:08 - 0:09
    Làm sao ta biết được?
  • 0:09 - 0:12
    Nhờ có dữ liệu.
  • 0:12 - 0:14
    Nhìn vào doanh số bán hàng siêu thị.
  • 0:14 - 0:17
    Nhìn vào doanh số bán của các
    loại bánh đường kính 30cm
  • 0:17 - 0:21
    được đông lạnh,
    và bánh táo thắng tuyệt đối.
  • 0:21 - 0:26
    Phần lớn bánh bán ra là bánh táo.
  • 0:26 - 0:29
    Nhưng đến khi
    các siêu thị bắt đầu bán
  • 0:29 - 0:32
    loại nhỏ hơn, cỡ 11 cm,
  • 0:32 - 0:36
    thì đột nhiên, bánh táo tụt
    xuống hạng tư hay năm.
  • 0:36 - 0:39
    Tại sao? Điều gì đã xảy ra?
  • 0:39 - 0:42
    Hãy cùng suy nghĩ về điều này.
  • 0:42 - 0:46
    Khi bạn mua bánh cỡ 30 cm,
  • 0:46 - 0:48
    cả gia đình bạn phải đồng ý,
  • 0:48 - 0:52
    thực tế, bánh táo chỉ đứng thứ hai
    trong danh sách yêu thích của mọi người.
  • 0:52 - 0:54
    (tiếng cười)
  • 0:54 - 0:57
    Nhưng khi mua một cái
    bánh cỡ 11 cm,
  • 0:57 - 1:01
    bạn có thể mua cái mà bạn muốn.
  • 1:01 - 1:05
    Bạn có thể mua loại
    mà mình thích nhất.
  • 1:05 - 1:07
    Bạn có nhiều dữ liệu hơn.
  • 1:07 - 1:08
    Bạn có thể thấy được những thứ
  • 1:08 - 1:13
    không thể thấy
    khi chỉ có một lượng nhỏ dữ liệu.
  • 1:13 - 1:16
    Điểm mấu chốt ở đây là,
    có nhiều dữ liệu hơn
  • 1:16 - 1:18
    không những giúp ta thấy nhiều hơn,
  • 1:18 - 1:20
    nhiều hơn về thứ ta đang nhìn.
  • 1:20 - 1:23
    Nhiều dữ liệu hơn còn giúp ta
    thấy được những điều mới,
  • 1:23 - 1:27
    mang đến một góc nhìn tốt hơn,
  • 1:27 - 1:30
    cho phép ta thấy khác đi.
  • 1:30 - 1:33
    Trong trường hợp này,
    nó cho phép ta thấy
  • 1:33 - 1:36
    thứ bánh nào được ưa chuộng ở Mỹ:
  • 1:36 - 1:39
    không phải bánh táo.
  • 1:39 - 1:42
    Các bạn chắc hẳn đã từng
    nghe về khái niệm Big data (dữ liệu lớn).
  • 1:42 - 1:46
    Đúng hơn, hẳn các bạn
    đã chán ngấy về nó.
  • 1:46 - 1:49
    Thật đúng khi cho rằng có nhiều
    sự thổi phồng xung quanh khái niệm trên,
  • 1:49 - 1:52
    và điều đó thật đáng tiếc,
  • 1:52 - 1:55
    vì Big data là một công cụ
    cực kì quan trọng
  • 1:55 - 1:59
    mà nhờ đó,
    xã hội sẽ trở nên tiến bộ hơn.
  • 1:59 - 2:02
    Trong quá khứ, chúng ta thường
    nhìn vào những dữ liệu nhỏ,
  • 2:02 - 2:04
    tìm hiểu ý nghĩa của chúng,
  • 2:04 - 2:05
    để cố gắng hiểu về thế giới,
  • 2:05 - 2:07
    và giờ, ta có nhiều dữ liệu hơn,
  • 2:07 - 2:10
    nhiều hơn bao giờ hết.
  • 2:10 - 2:12
    Những gì ta biết là khi có
  • 2:12 - 2:15
    một lượng lớn dữ liệu,
    ta có thể làm những điều
  • 2:15 - 2:18
    mà trước kia không thể.
  • 2:18 - 2:21
    Big data rất quan trọng,
    và mới mẻ,
  • 2:21 - 2:22
    và đó có thể là
  • 2:22 - 2:25
    cách duy nhất mà hành tinh này sẽ
  • 2:25 - 2:26
    đối phó với những thử thách toàn cầu:
  • 2:26 - 2:30
    đảm bảo thức ăn cho mọi người,
    cung cấp dịch vụ y tế,
  • 2:30 - 2:33
    cung cấp năng lượng, điện,
  • 2:33 - 2:34
    và đảm bảo người dân
    không bị thiêu rụi
  • 2:34 - 2:36
    bởi sự nóng lên toàn cầu -
  • 2:36 - 2:40
    tất cả nhờ vào
    việc sử dụng dữ liệu hiệu quả.
  • 2:40 - 2:44
    Vậy thì, Big data có gì mới?
    Có gì mà to tát như vậy?
  • 2:44 - 2:46
    Được, để trả lời câu hỏi đó,
    hãy nghĩ về
  • 2:46 - 2:51
    thông tin trông như thế nào,
    trước kia.
  • 2:51 - 2:55
    Vào năm 1908, trên đảo Crete,
  • 2:55 - 3:00
    các nhà khảo cổ học tìm ra
    một cái đĩa đất sét.
  • 3:00 - 3:04
    Họ xác định nó từ là 2000 năm trước
    Công nguyên, vậy nó 4000 tuổi.
  • 3:04 - 3:07
    Trên đĩa có khắc chữ
    nhưng ta không hiểu nó có nghĩa gì.
  • 3:07 - 3:09
    Hoàn toàn là một bí ẩn,
    nhưng vấn đề là
  • 3:09 - 3:13
    thông tin đã từng trông như thế
    4000 năm trước.
  • 3:13 - 3:16
    Đây là cách xã hội lưu trữ
  • 3:16 - 3:19
    và truyền tải thông tin.
  • 3:19 - 3:23
    Bây giờ, xã hội chưa tân tiến đến mức đó.
  • 3:23 - 3:27
    Chúng ta vẫn lưu trữ thông tin trên đĩa,
  • 3:27 - 3:31
    nhưng giờ, có thể lưu trữ
    nhiều thông tin hơn trước kia.
  • 3:31 - 3:34
    Tìm kiếm nó thì dễ hơn.
    Sao chép nó cũng dễ hơn.
  • 3:34 - 3:38
    Chia sẻ cũng dễ hơn.
    Xử lý dễ hơn.
  • 3:38 - 3:40
    Những gì ta có thể làm là
    sử dụng lại thông tin này
  • 3:40 - 3:43
    vào việc mà thậm chí
    chưa bao giờ tưởng tượng ra
  • 3:43 - 3:46
    khi mới bắt đầu thu thập dữ liệu.
  • 3:46 - 3:48
    Về lĩnh vực này, dữ liệu đã phát triển
  • 3:48 - 3:51
    từ một kho tích trữ về một dòng chảy ,
  • 3:51 - 3:55
    từ thứ bất động và cố định
  • 3:55 - 3:59
    sang linh hoạt và năng động.
  • 3:59 - 4:03
    Có một thanh khoản thông tin.
  • 4:03 - 4:06
    Cái đĩa được tìm thấy ở Crete
  • 4:06 - 4:10
    đã 4000 năm tuổi, rất nặng,
  • 4:10 - 4:12
    nó không lưu trữ được nhiều thông tin,
  • 4:12 - 4:15
    và số thông tin đó không thể thay đổi.
  • 4:15 - 4:19
    Ngược lại, tất cả những hồ sơ
  • 4:19 - 4:21
    mà Edward Snowden lấy
  • 4:21 - 4:24
    từ Cục An ninh Quốc gia Hoa Kỳ
  • 4:24 - 4:26
    chứa vừa trong một thẻ nhớ
  • 4:26 - 4:29
    bằng kích thước của móng tay,
  • 4:29 - 4:34
    và có thể được chia sẻ
    với tốc độ ánh sáng.
  • 4:34 - 4:38
    Nhiều dữ liệu hơn, hơn rất nhiều.
  • 4:38 - 4:41
    Một lý do tại sao có quá nhiều
    dữ liệu trên thế giới hiện nay
  • 4:41 - 4:43
    là vì chúng ta đang
    thu thập những thứ
  • 4:43 - 4:46
    ta vẫn luôn thu thập,
  • 4:46 - 4:49
    một lý do khác để giải thích
    việc chúng ta lấy những thứ
  • 4:49 - 4:51
    trước đây, cũng cung cấp thông tin
  • 4:51 - 4:54
    nhưng chưa bao giờ
    được làm thành dạng dữ liệu
  • 4:54 - 4:56
    và bỏ vào dữ liệu.
  • 4:56 - 5:00
    Lấy ví dụ, câu hỏi về địa điểm
  • 5:00 - 5:02
    Lấy ví dụ, Martin Luther.
  • 5:02 - 5:03
    Nếu muốn biết vào năm 1500
  • 5:03 - 5:06
    Martin Luther ở đâu,
  • 5:06 - 5:08
    ta sẽ phải theo dõi ông ấy
    mọi lúc,
  • 5:08 - 5:10
    kèm theo một cây bút lông
    và một lọ mực
  • 5:10 - 5:12
    để ghi chép lại.
  • 5:12 - 5:14
    Hãy nghĩ nó
    sẽ như thế nào ngày nay.
  • 5:14 - 5:16
    Bạn biết rằng ở một nơi nào đó,
  • 5:16 - 5:19
    có thể là trong cơ sở dữ liệu
    của một hãng viễn thông
  • 5:19 - 5:22
    có một bảng tính hoặc ít nhất
    một mục cơ sở dữ liệu
  • 5:22 - 5:24
    lưu trữ lại thông tin của bạn,
  • 5:24 - 5:26
    những nơi bạn đã đến
    tại mọi thời điểm.
  • 5:26 - 5:27
    Nếu bạn có điện thoại di động,
  • 5:27 - 5:30
    và nó đó có GPS,
    ngay cả khi không có GPS,
  • 5:30 - 5:33
    nó vẫn có thể
    lưu trữ thông tin của bạn.
  • 5:33 - 5:37
    Trong lĩnh vực này, việc định vị
    đã được dữ liệu hóa.
  • 5:37 - 5:41
    Bây giờ, lấy ví dụ
    vấn đề về tư thế
  • 5:41 - 5:46
    các bạn đang ngồi bây giờ
  • 5:46 - 5:48
    Chúng đều khác nhau,
  • 5:48 - 5:51
    và là chức năng giữa chiều dài chân,
    lưng và đường nét của lưng,
  • 5:51 - 5:54
    và nếu bây giờ, đặt thiết bị cảm biến
  • 5:54 - 5:56
    vào tất cả các ghế,
  • 5:56 - 5:59
    tôi có thể tạo ra một chỉ số
    tương đối độc nhất về bạn,
  • 5:59 - 6:04
    ví dụ như dấu vân tay,
    nhưng không phải là ngón tay của bạn.
  • 6:04 - 6:07
    Vậy ta có thể làm gì với nó?
  • 6:07 - 6:09
    Các nhà nghiên cứu ở Tokyo
    đang dùng dấu vân tay
  • 6:09 - 6:14
    để tạo ra một thiết bị có tiềm năng
    chống trộm xe hơi.
  • 6:14 - 6:16
    Ý tưởng là nếu tên trộm
    ngồi đằng sau tay lái
  • 6:16 - 6:18
    và cố lái đi,
    nhưng nếu chiếc xe nhận ra
  • 6:18 - 6:21
    đằng sau bánh lái là một
    tài xế không được xác duyệt,
  • 6:21 - 6:23
    động cơ sẽ tự động dừng, trừ khi
  • 6:23 - 6:26
    bạn nhập mật khẩu vào bảng điều khiển
  • 6:26 - 6:31
    để báo rằng: "Tôi có sự cho phép".
    Tuyệt.
  • 6:31 - 6:33
    Nếu như mọi chiếc xe ở Châu Âu
  • 6:33 - 6:35
    đều có công nghệ này thì sao?
  • 6:35 - 6:38
    Chúng ta có thể làm gì lúc đó?
  • 6:38 - 6:40
    Nếu có thể tập hợp dữ liệu,
  • 6:40 - 6:44
    có thể ta sẽ khám phá ra
    các dấu hiệu
  • 6:44 - 6:47
    dự đoán tốt nhất rằng
    một tai nạn xe hơi
  • 6:47 - 6:53
    sẽ xảy ra trong 5 giây tiếp theo.
  • 6:53 - 6:55
    Rồi những gì chúng ta sẽ
    dữ liệu hóa
  • 6:55 - 6:57
    sẽ là sự mệt mỏi của tài xế,
  • 6:57 - 6:59
    và dịch vụ lúc đó sẽ là
    khi cảm nhận được
  • 6:59 - 7:03
    tài xế đang rơi
    vào tình trạng mệt mỏi
  • 7:03 - 7:07
    chiếc xe sẽ tự động
    cài một báo động bên trong
  • 7:07 - 7:09
    để làm rung bánh lái, và
    bóp kèn
  • 7:09 - 7:11
    báo rằng: "Này! dậy đi,
  • 7:11 - 7:12
    chú ý đường đi kìa."
  • 7:12 - 7:14
    Đây là những thứ ta có thể làm
  • 7:14 - 7:17
    khi dữ liệu hóa nhiều khía cạnh hơn
    trong cuộc sống.
  • 7:17 - 7:21
    Vậy thì giá trị của Big data là gì?
  • 7:21 - 7:23
    Nào, hãy nghĩ xem.
  • 7:23 - 7:25
    Bạn có nhiều thông tin hơn.
  • 7:25 - 7:28
    Bạn có thể làm những việc
    không thể làm trước đó.
  • 7:28 - 7:30
    Một trong những lĩnh vực ấn tượng nhất
  • 7:30 - 7:32
    mà khái niệm này đang diễn ra
  • 7:32 - 7:35
    là máy học.
  • 7:35 - 7:39
    Máy học là một nhánh của
    trí tuệ nhân tạo
  • 7:39 - 7:42
    mà bản thân nó là một nhánh của
    khoa học máy tính.
  • 7:42 - 7:43
    Ý tưởng chung là thay vì
  • 7:43 - 7:46
    phải hướng dẫn máy tính
    những gì phải làm,
  • 7:46 - 7:48
    chúng ta sẽ chỉ đưa vào dữ liệu
    liên quan đến vấn đề
  • 7:48 - 7:51
    và bảo máy tính tự tính toán.
  • 7:51 - 7:53
    Để hiểu thêm về vấn đề này,
  • 7:53 - 7:57
    hãy cùng nhìn lại nguồn gốc của nó.
  • 7:57 - 7:59
    Vào những năm 1950,
  • 7:59 - 8:03
    một nhà khoa học máy tính của IBM
    tên Arthur Samuel thích chơi cờ,
  • 8:03 - 8:07
    ông ấy viết một chương trình
    để có thể chơi cờ với máy tính.
  • 8:07 - 8:10
    Ông ấy chơi. Ông ấy thắng.
  • 8:10 - 8:12
    Ông ấy chơi. Ông ấy thắng,
  • 8:12 - 8:15
    Ông ấy chơi. Ông ấy thắng,
  • 8:15 - 8:17
    vì máy tính chỉ biết
  • 8:17 - 8:19
    nước đi đúng luật là thế nào.
  • 8:19 - 8:21
    Arthur Samuel biết một số thứ khác.
  • 8:21 - 8:25
    Arthur Samuel biết chiến lược.
  • 8:25 - 8:28
    Thế nên, bên cạnh đó, ông
    viết một chương trình con,
  • 8:28 - 8:32
    hoạt động trên nền chương trình chính,
    và ghi lại xác suất
  • 8:32 - 8:34
    của bàn cờ cho sẵn
    có khả năng dẫn đến
  • 8:34 - 8:37
    một ván thắng hoặc một ván thua
  • 8:37 - 8:40
    sau mỗi nước đi.
  • 8:40 - 8:43
    Ông ấy chơi với máy tính. Ông ấy thắng
  • 8:43 - 8:45
    Ông ấy chơi với máy tính. Ông ấy thắng
  • 8:45 - 8:49
    Ông ấy chơi với máy tính. Ông ấy thắng
  • 8:49 - 8:51
    Và rồi Arthur Samuel để máy tính
  • 8:51 - 8:54
    tự chơi cờ với chính nó.
  • 8:54 - 8:57
    Nó tự chơi cờ.
    Nó thu thập nhiều dữ liệu hơn.
  • 8:57 - 9:01
    Nó thu thập nhiều dữ liệu hơn.
    Nó tăng độ chính xác về khả năng dự đoán
  • 9:01 - 9:03
    Và rồi Arthur Samuel quay lại máy tính
  • 9:03 - 9:06
    và chơi cờ với nó, và ông ấy thua
  • 9:06 - 9:08
    và ông ấy chơi, ông ấy thua
  • 9:08 - 9:10
    và ông ấy chơi, ông ấy thua
  • 9:10 - 9:13
    và Arthur Samuel đã tạo ra một cỗ máy
  • 9:13 - 9:19
    vượt qua khả năng của ông ấy
    trong một lĩnh vực mà chính ông đã dạy nó.
  • 9:19 - 9:21
    Ý tưởng này trong lĩnh vực máy học
  • 9:21 - 9:25
    đang được ứng dụng ở mọi nơi.
  • 9:25 - 9:28
    Bạn nghĩ làm thế nào ta có
    xe hơi lái tự động?
  • 9:28 - 9:31
    Xã hội chúng ta có khá hơn không
  • 9:31 - 9:34
    khi nhập tất cả các
    luật giao thông vào phần mềm?
  • 9:34 - 9:36
    Không. Bộ nhớ rẻ hơn? Không
  • 9:36 - 9:40
    Các thuật toán xử lý nhanh hơn? Không
    Bộ vi xử lý tốt hơn? Không
  • 9:40 - 9:43
    Tất cả đều quan trọng,
    nhưng đó không phải là lý do.
  • 9:43 - 9:46
    Mà là vì chúng ta
    đã thay đổi bản chất của vấn đề.
  • 9:46 - 9:48
    Từ một vấn đề,
    ta tìm cách giải thích
  • 9:48 - 9:50
    rõ ràng, dứt khoát
  • 9:50 - 9:53
    cho máy tính hiểu
    làm thế nào để lái xe
  • 9:53 - 9:56
    đến việc nói rằng:
    "Đây là tập dữ liệu xung quanh chiếc xe.
  • 9:56 - 9:57
    Hãy tự xử lý chúng.
  • 9:57 - 9:59
    Hãy nhận ra
    đó là đèn giao thông,
  • 9:59 - 10:01
    rằng đó đang là đèn đỏ
    không phải đèn xanh
  • 10:01 - 10:03
    rằng điều đó có nghĩa là
    phải dừng lại
  • 10:03 - 10:06
    và không đi về phía trước."
  • 10:06 - 10:08
    Máy học là nền tảng cơ bản
  • 10:08 - 10:10
    của rất nhiều thứ chúng ta làm trên mạng:
  • 10:10 - 10:12
    các công cụ tìm kiếm,
  • 10:12 - 10:16
    thuật toán cá nhân hóa của Amazon,
  • 10:16 - 10:18
    máy tính dịch thuật,
  • 10:18 - 10:22
    hệ thống xác nhận giọng nói.
  • 10:22 - 10:25
    Gần đây, các nhà nghiên cứu đã tìm hiểu
  • 10:25 - 10:28
    về các vấn đề sinh thiết
  • 10:28 - 10:31
    sinh thiết ung thư,
  • 10:31 - 10:33
    và họ đã nhờ máy tính xác định,
  • 10:33 - 10:36
    bằng cách nhìn vào dữ liệu và
    chỉ số sống sót
  • 10:36 - 10:40
    để xác nhận rằng những tế bào này
  • 10:40 - 10:43
    có thật sự bị ung thư hay không,
  • 10:43 - 10:47
    chắc chắn rằng, khi nhập dữ liệu
    vào máy tính qua một thuật toán máy học
  • 10:47 - 10:49
    cỗ máy có thể xác định
  • 10:49 - 10:51
    những dấu hiệu dự đoán tốt nhất
  • 10:51 - 10:54
    rằng sinh thiết của các
    tế bào ung thư vú này
  • 10:54 - 10:57
    thật sự bị ung thư.
  • 10:57 - 11:00
    Vấn đề: Tài liệu y học
  • 11:00 - 11:03
    chỉ biết được 9 dấu hiệu.
  • 11:03 - 11:04
    Trong đó, có 3 dấu hiệu
  • 11:04 - 11:07
    mà mọi người không cần phải tìm kiếm
  • 11:07 - 11:13
    nhưng cỗ máy phát hiện ra.
  • 11:13 - 11:19
    Big data cũng có mặt tối của nó.
  • 11:19 - 11:21
    Nó sẽ cải thiện cuộc sống,
    nhưng có những vấn đề
  • 11:21 - 11:24
    mà ta nên cảnh giác,
  • 11:24 - 11:26
    và điều đầu tiên đó là quan niệm
  • 11:26 - 11:29
    rằng ta có thể bị trừng phạt
    do các dự đoán,
  • 11:29 - 11:33
    rằng cảnh sát có thể sử dụng Big data
    cho mục đích của họ,
  • 11:33 - 11:35
    tựa như phim "Minority Report"
  • 11:35 - 11:38
    Nó là một thuật ngữ gọi là
    giám sát dự báo
  • 11:38 - 11:40
    hoặc thuật toán tội phạm học,
  • 11:40 - 11:42
    và khái niệm đó là:
    nếu lấy nhiều dữ liệu,
  • 11:42 - 11:44
    ví dụ, dữ liệu về các địa điểm
    xảy ra tội phạm
  • 11:44 - 11:47
    ta sẽ biết nơi cần gửi
    đội tuần tra.
  • 11:47 - 11:49
    Điều đó là hợp lý,
    nhưng vấn đề, dĩ nhiên
  • 11:49 - 11:53
    không phải chỉ dừng lại
    ở dữ liệu định vị,
  • 11:53 - 11:56
    nó sẽ xuống cấp độ thu thập dữ liệu
    của từng cá nhân.
  • 11:56 - 11:59
    Tại sao không dùng dữ liệu
    để biết về
  • 11:59 - 12:01
    bảng điểm cấp 3 của một người nào đó?
  • 12:01 - 12:02
    Có thể nên dùng sự thật như
  • 12:02 - 12:04
    họ thất nghiệp hay không,
    điểm tín dụng,
  • 12:04 - 12:06
    cách họ lướt web,
  • 12:06 - 12:08
    hay họ có thức khuya hay không.
  • 12:08 - 12:11
    Chỉ số Fitbit có khả năng
    xác định các hóa sinh,
  • 12:11 - 12:15
    sẽ chỉ ra rằng
    họ có suy nghĩ hiếu chiến.
  • 12:15 - 12:17
    Có thể có những thuật toán
    có khả năng dự đoán
  • 12:17 - 12:19
    những gì chúng ta sẽ làm,
  • 12:19 - 12:23
    liệu ta có phải chịu trách nhiệm
    trước khi thật sự làm những điều đó?
  • 12:23 - 12:25
    Bảo mật là thách thức trọng tâm
  • 12:25 - 12:28
    trong thời đại small data (dữ liệu nhỏ).
  • 12:28 - 12:30
    Trong thời đại Big data (dữ liệu lớn),
  • 12:30 - 12:34
    thách thức sẽ là bảo vệ tự do,
  • 12:34 - 12:38
    lựa chọn đạo đức, ý chí con người,
  • 12:38 - 12:42
    tính chủ thể.
  • 12:42 - 12:45
    Còn có một vấn đề nữa:
  • 12:45 - 12:48
    Big data sẽ cướp đi
    việc làm của chúng ta.
  • 12:48 - 12:52
    Big data và các thuật toán
    sẽ thách thức
  • 12:52 - 12:55
    công việc văn phòng,
    công việc chuyên môn
  • 12:55 - 12:57
    trong thế kỷ 21
  • 12:57 - 12:59
    theo cùng một cách
    mà máy móc tự động
  • 12:59 - 13:01
    và dây chuyền lắp ráp
  • 13:01 - 13:04
    thách thức công nhân ở thế kỉ 20.
  • 13:04 - 13:06
    Hãy nghĩ về kỹ thuật viên phòng thí nghiệm
  • 13:06 - 13:08
    sử dụng một cái kính hiển vi
  • 13:08 - 13:09
    ở viện sinh thiết ung thư
  • 13:09 - 13:12
    và xác định xem sinh thiết này
    có bị ung thư hay không.
  • 13:12 - 13:14
    Người này đã học xong đại học
  • 13:14 - 13:16
    Người này mua nhà.
  • 13:16 - 13:18
    Anh ấy hoặc cô ấy bỏ phiếu.
  • 13:18 - 13:21
    Anh ấy hoặc cô ấy là
    một nhân tố trong xã hội.
  • 13:21 - 13:24
    Và việc làm của người đó,
    cũng như toàn bộ đội ngũ
  • 13:24 - 13:26
    những người chuyên môn
    như vậy
  • 13:26 - 13:29
    sẽ thấy công việc của họ
    bị thay đổi một cách triệt để
  • 13:29 - 13:31
    hoặc bị loại bỏ hoàn toàn.
  • 13:31 - 13:33
    Chúng ta thích nghĩ rằng
  • 13:33 - 13:36
    công nghệ sẽ tạo nên việc làm
    sau một khoảng thời gian
  • 13:36 - 13:39
    sau khoản thời gian
    rối loạn tạm thời,
  • 13:39 - 13:41
    điều đó đúng
    cho các khung tham chiếu
  • 13:41 - 13:43
    mà chúng ta sống,
    Cách mạng công nghiệp,
  • 13:43 - 13:46
    vì đó chính xác là những gì đã xảy ra.
  • 13:46 - 13:48
    Nhưng ta quên điều gì đó
    trong bài phân tích đấy:
  • 13:48 - 13:50
    Có một số loại công việc
  • 13:50 - 13:53
    đơn giản là bị loại bỏ hoàn toàn và
    không bao giờ quay trở lại.
  • 13:53 - 13:55
    Cách mạng công nghiệp không hề tốt
  • 13:55 - 13:59
    nếu bạn là một con ngựa.
  • 13:59 - 14:01
    Do đó, phải thận trọng
  • 14:01 - 14:05
    trong việc sử dụng Big data và
    điều chỉnh nó phù hợp với
  • 14:05 - 14:08
    nhu cầu rất con người của chúng ta.
  • 14:08 - 14:10
    Chúng ta phải làm chủ công nghệ này,
  • 14:10 - 14:12
    chứ không phải là người hầu của nó.
  • 14:12 - 14:15
    Chỉ mới là khởi đầu kỷ nguyên
    của big date
  • 14:15 - 14:18
    và thành thật mà nói,
    chúng ta không hề giỏi
  • 14:18 - 14:22
    trong việc xử lý tất cả các dữ liệu
    có thể thu thập.
  • 14:22 - 14:25
    Nó không chỉ là vấn đề cho
    Cục An ninh Quốc gia.
  • 14:25 - 14:28
    Các doanh nghiệp thu thập rất nhiều
    dữ liệu và họ cũng lạm dụng nó.
  • 14:28 - 14:32
    Chúng ta phải làm tốt hơn và điều này
    sẽ tốn nhiều thời gian.
  • 14:32 - 14:34
    Nó giống như là thử thách mà
  • 14:34 - 14:36
    người nguyên thủy gặp phải với lửa
  • 14:36 - 14:38
    Đây là một công cụ,
    nhưng là một công cụ
  • 14:38 - 14:44
    mà nếu không cẩn thận,
    sẽ thiêu cháy chúng ta.
  • 14:44 - 14:47
    Big data sẽ thay đổi
    cách sống,
  • 14:47 - 14:50
    cách ta làm việc và
    cách ta suy nghĩ.
  • 14:50 - 14:52
    Nó sẽ giúp chúng ta quản lý
    sự nghiệp của mình
  • 14:52 - 14:55
    và dẫn đến cuộc sống
    hài lòng và hy vọng,
  • 14:55 - 14:58
    hạnh phúc và sức khỏe.
  • 14:58 - 15:02
    Nhưng trong quá khứ, ta
    thường nhìn vào công nghệ thông tin
  • 15:02 - 15:04
    và chỉ thấy những thứ như,
  • 15:04 - 15:06
    công nghệ, phần mềm,
  • 15:06 - 15:08
    những thứ vật chất.
  • 15:08 - 15:11
    Phải đúc kết lại
    cái nhìn của chúng ta,
  • 15:11 - 15:12
    nhìn vào thông tin,
  • 15:12 - 15:14
    dù nó không mấy rõ ràng
  • 15:14 - 15:18
    nhưng trong một số khía cạnh
    quan trọng hơn rất nhiều.
  • 15:18 - 15:21
    Nhân loại cuối cùng cũng có thể
    học hỏi từ những thông tin
  • 15:21 - 15:24
    mà nó có thể thu thập,
  • 15:24 - 15:26
    như một phần
    của cuộc thám hiểm vô tận
  • 15:26 - 15:29
    để hiểu về thế giới và vị trí
    của chúng ta trong đó,
  • 15:29 - 15:34
    và đó là lý do tại sao Big data
    là một vấn đề quan trọng.
  • 15:34 - 15:38
    (vỗ tay)
Title:
Big data (dữ liệu lớn) là dữ liệu tốt hơn
Speaker:
Kenneth Cukier
Description:

Ô tô tự lái mới chỉ là bắt đầu. Tương lai của Big data (dữ liệu lớn) sẽ ra sao dưới sự ảnh hưởng của công nghệ và thiết kế? Trong bài nói chuyện khoa học thú vị của mình, Kenneth Cukier đi sâu vào tương lai của máy học và tri thức con người.

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
15:51

Vietnamese subtitles

Revisions Compare revisions