Return to Video

Big data (dữ liệu lớn) là dữ liệu tốt hơn

  • 0:01 - 0:05
    Loại bánh ưa thích tại Mỹ là ?
  • 0:05 - 0:08
    Khán giả: Bánh táo.
    Kenneth Cukier: Bánh táo. Tất nhiên rồi.
  • 0:08 - 0:09
    Làm sao ta biết được?
  • 0:09 - 0:12
    Nhờ có dữ liệu.
  • 0:12 - 0:14
    Nhìn vào doanh số bán hàng siêu thị.
  • 0:14 - 0:17
    Nhìn vào doanh số bán của các
    loại bánh đường kính 30cm
  • 0:17 - 0:21
    được đông lạnh,
    và bánh táo thắng tuyệt đối.
  • 0:21 - 0:26
    Phần lớn bánh bán ra là bánh táo.
  • 0:26 - 0:29
    Nhưng đến khi
    các siêu thị bắt đầu bán
  • 0:29 - 0:32
    loại nhỏ hơn, cỡ 11 cm,
  • 0:32 - 0:36
    thì đột nhiên, bánh táo tụt
    xuống hạng tư hay năm.
  • 0:36 - 0:39
    Tại sao? Điều gì đã xảy ra?
  • 0:39 - 0:42
    Hãy cùng suy nghĩ về điều này.
  • 0:42 - 0:46
    Khi bạn mua bánh cỡ 30 cm,
  • 0:46 - 0:48
    cả gia đình bạn phải đồng ý,
  • 0:48 - 0:52
    thực tế, bánh táo chỉ đứng thứ hai
    trong danh sách yêu thích của mọi người.
  • 0:52 - 0:54
    (tiếng cười)
  • 0:54 - 0:57
    Nhưng khi mua một cái
    bánh cỡ 11 cm,
  • 0:57 - 1:01
    bạn có thể mua cái mà bạn muốn.
  • 1:01 - 1:05
    Bạn có thể mua loại
    mà mình thích nhất.
  • 1:05 - 1:07
    Bạn có nhiều dữ liệu hơn.
  • 1:07 - 1:08
    Bạn có thể thấy được những thứ
  • 1:08 - 1:13
    không thể thấy
    khi chỉ có một lượng nhỏ dữ liệu.
  • 1:13 - 1:16
    Điểm mấu chốt ở đây là,
    có nhiều dữ liệu hơn
  • 1:16 - 1:18
    không những giúp ta thấy nhiều hơn,
  • 1:18 - 1:20
    nhiều hơn về thứ ta đang nhìn.
  • 1:20 - 1:23
    Nhiều dữ liệu hơn còn giúp ta
    thấy được những điều mới,
  • 1:23 - 1:27
    mang đến một góc nhìn tốt hơn,
  • 1:27 - 1:30
    cho phép ta thấy khác đi.
  • 1:30 - 1:33
    Trong trường hợp này,
    nó cho phép ta thấy
  • 1:33 - 1:36
    thứ bánh nào được ưa chuộng ở Mỹ:
  • 1:36 - 1:39
    không phải bánh táo.
  • 1:39 - 1:42
    Các bạn chắc hẳn đã từng
    nghe về khái niệm big data (dữ liệu lớn).
  • 1:42 - 1:46
    Đúng hơn, hẳn các bạn
    đã chán ngấy về nó.
  • 1:46 - 1:49
    Thật đúng khi cho rằng có nhiều
    sự thổi phồng xung quanh khái niệm trên,
  • 1:49 - 1:52
    và điều đó thật đáng tiếc,
  • 1:52 - 1:55
    vì big data là một công cụ
    cực kì quan trọng
  • 1:55 - 1:59
    mà nhờ đó,
    xã hội sẽ trở nên tiến bộ hơn.
  • 1:59 - 2:02
    Trong quá khứ, chúng ta thường
    nhìn vào những dữ liệu nhỏ,
  • 2:02 - 2:04
    tìm hiểu ý nghĩa của chúng,
  • 2:04 - 2:05
    để cố gắng hiểu về thế giới,
  • 2:05 - 2:07
    và giờ, ta có nhiều dữ liệu hơn,
  • 2:07 - 2:10
    nhiều hơn bao giờ hết.
  • 2:10 - 2:12
    Những gì ta biết là khi có
  • 2:12 - 2:15
    một lượng lớn dữ liệu,
    ta có thể làm những điều
  • 2:15 - 2:18
    mà trước kia không thể.
  • 2:18 - 2:21
    Dữ liệu lớn rất quan trọng,
    và mới mẻ,
  • 2:21 - 2:22
    và đó có thể là
  • 2:22 - 2:25
    cách duy nhất mà hành tinh này sẽ
  • 2:25 - 2:26
    đối phó với những thử thách toàn cầu:
  • 2:26 - 2:30
    đảm bảo thức ăn cho mọi người,
    cung cấp dịch vụ y tế,
  • 2:30 - 2:33
    cung cấp năng lượng, điện,
  • 2:33 - 2:34
    và đảm bảo người dân
    không bị thiêu rụi
  • 2:34 - 2:36
    bởi sự nóng lên toàn cầu -
  • 2:36 - 2:40
    tất cả nhờ vào
    việc sử dụng dữ liệu hiệu quả.
  • 2:40 - 2:44
    Vậy thì, có gì mới về dữ liệu lớn?
    Có gì mà to tát vậy chứ?
  • 2:44 - 2:46
    Được, để trả lời câu hỏi đó, hãy nghĩ về
  • 2:46 - 2:51
    thông tin trông như thế nào,
    trước kia.
  • 2:51 - 2:55
    Vào năm 1908, trên đảo Crete,
  • 2:55 - 3:00
    các nhà khảo cổ học tìm ra
    một cái đĩa đất sét.
  • 3:00 - 3:04
    Họ xác định nó từ là 2000 năm trước
    Công nguyên, vậy nó 4000 tuổi.
  • 3:04 - 3:07
    Có chữ khắc trên tấm đĩa,
    nhưng ta không hiểu nó có nghĩa gì.
  • 3:07 - 3:09
    Hoàn toàn là một bí ẩn,
    nhưng vấn đề là
  • 3:09 - 3:13
    thông tin đã từng trông như thế
    4000 năm trước.
  • 3:13 - 3:16
    Đây là cách xã hội lưu trữ
  • 3:16 - 3:19
    và truyền tải thông tin.
  • 3:19 - 3:23
    Bây giờ, xã hội chưa tân tiến đến mức đó.
  • 3:23 - 3:27
    Chúng ta vẫn lưu trữ thông tin trên đĩa,
  • 3:27 - 3:31
    nhưng giờ, có thể lưu trữ
    nhiều thông tin hơn trước kia.
  • 3:31 - 3:34
    Tìm kiếm nó thì dễ hơn.
    Sao chép nó cũng dễ hơn.
  • 3:34 - 3:38
    Chia sẻ cũng dễ hơn.
    Xử lý dễ hơn.
  • 3:38 - 3:40
    Những gì ta có thể làm là
    sử dụng lại thông tin này
  • 3:40 - 3:43
    vào việc mà thậm chí
    chưa bao giờ tưởng tượng ra
  • 3:43 - 3:46
    khi mới bắt đầu thu thập dữ liệu.
  • 3:46 - 3:48
    Về lĩnh vực này, dữ liệu đã đi
  • 3:48 - 3:51
    từ một kho tích trữ về một dòng chảy ,
  • 3:51 - 3:55
    từ thứ bất động và cố định
  • 3:55 - 3:59
    sang linh hoạt và năng động.
  • 3:59 - 4:03
    Có một thanh khoản thông tin.
  • 4:03 - 4:06
    Cái đĩa được tìm thấy ở Crete
  • 4:06 - 4:10
    đã 4000 năm tuổi, rất nặng,
  • 4:10 - 4:12
    nó không lưu trữ được nhiều thông tin,
  • 4:12 - 4:15
    và số thông tin đó không thể thay đổi.
  • 4:15 - 4:19
    Ngược lại, tất cả những hồ sơ
  • 4:19 - 4:21
    mà Edward Snowden lấy
  • 4:21 - 4:24
    từ Cục An ninh Quốc gia Hoa Kỳ
  • 4:24 - 4:26
    chứa vừa trong một thẻ nhớ
  • 4:26 - 4:29
    bằng kích thước của móng tay,
  • 4:29 - 4:34
    và có thể được chia sẻ
    với tốc độ ánh sáng.
  • 4:34 - 4:38
    Nhiều dữ liệu hơn, hơn rất nhiều.
  • 4:38 - 4:41
    Một lý do tại sao có quá nhiều
    dữ liệu trên thế giới hiện nay
  • 4:41 - 4:43
    là vì chúng ta đang
    thu thập những thứ
  • 4:43 - 4:46
    ta vẫn luôn thu thập,
  • 4:46 - 4:49
    một lý do khác để giải thích
    việc chúng ta lấy những thứ
  • 4:49 - 4:51
    đã luôn cung cấp thông tin
  • 4:51 - 4:54
    nhưng chưa bao giờ được làm thành dạng dữ liệu
  • 4:54 - 4:56
    và do đó,
    chúng ta bỏ những thứ đấy vào dữ liệu
  • 4:56 - 5:00
    Lấy ví dụ, câu hỏi về địa điểm
  • 5:00 - 5:02
    Lấy ví dụ, Martin Luther
  • 5:02 - 5:03
    Nếu chúng ta muốn biết vào năm 1500
  • 5:03 - 5:06
    Martin Luther ở đâu,
  • 5:06 - 5:08
    chúng ta sẽ phải theo dõi ông ấy
    mọi lúc,
  • 5:08 - 5:10
    kèm theo một cây bút lông
    và một lọ mực
  • 5:10 - 5:12
    để ghi chép lại.
  • 5:12 - 5:14
    Nhưng bây giờ hãy nghĩ nó
    sẽ như thế nào ngày nay.
  • 5:14 - 5:16
    Bạn biết rằng ở một nơi nào đó,
  • 5:16 - 5:19
    khả năng là trong cơ sở dữ liệu
    của một hãng viễn thông
  • 5:19 - 5:22
    có một bảng tính hoặc ít nhất
    một mục cơ sở dữ liệu
  • 5:22 - 5:24
    lưu trữ lại thông tin của bạn
  • 5:24 - 5:26
    những nơi bạn đã đến
    tại mọi thời điểm
  • 5:26 - 5:27
    Nếu bạn có điện thoại di động,
  • 5:27 - 5:30
    và chiếc điện thoại đó có GPS,
    nhưng ngay cả khi nó không có GPS,
  • 5:30 - 5:33
    nó vẫn có thể lưu trữ thông tin của bạn
  • 5:33 - 5:37
    Trong lĩnh vực này, việc định vị
    đã được dữ liệu hóa
  • 5:37 - 5:41
    Bây giờ, lấy ví dụ
    vấn đề về tư thế
  • 5:41 - 5:42
    tư thế mà các bạn đang ngồi bây giờ
  • 5:42 - 5:45
    tư thế mà bạn ngồi,
  • 5:45 - 5:47
    tư thế mà bạn ngồi, tư thế mà bạn ngồi
  • 5:47 - 5:49
    Nó đều khác nhau, và đó là một chức năng
    giữa chiều dài chân bạn
  • 5:49 - 5:51
    lưng bạn và những đường nét của lưng bạn
  • 5:51 - 5:54
    và nếu bây giờ tôi đặt thiết bị cảm biến
  • 5:54 - 5:56
    vào tất cả các ghế
  • 5:56 - 5:59
    Tôi có thể tạo ra một chỉ số
    tương đối độc nhất về bạn,
  • 5:59 - 6:04
    ví dụ như dấu vân tây,
    nhưng không phải là ngón tay của bạn
  • 6:04 - 6:07
    Vậy chúng ta có thể làm gì với nó?
  • 6:07 - 6:09
    Các nhà nghiên cứu ở Tokyo đang dùng
    dấu vân tay
  • 6:09 - 6:14
    để tạo ra một thiết bị có tiềm năng
    chống trộm xe hơi.
  • 6:14 - 6:16
    Ý tưởng là nếu tên trộm ngồi đằng sau
    tay lái
  • 6:16 - 6:19
    và cố lái đi, nhưng nếu chiếc xe nhận ra
  • 6:19 - 6:21
    rằng đằng sau bánh lái là một
    tài xế không được xác duyệt,
  • 6:21 - 6:23
    thì động cơ sẽ tự động dừng, trừ khi
  • 6:23 - 6:26
    bạn nhập mật khẩu vào bảng điều khiển
  • 6:26 - 6:31
    để báo rằng "Tôi có sự cho phép". Tuyệt.
  • 6:31 - 6:33
    Nếu như mọi chiếc xe ở Châu Âu
  • 6:33 - 6:35
    đều có công nghệ này thì sao?
  • 6:35 - 6:38
    Chúng ta có thể làm gì lúc đó?
  • 6:38 - 6:40
    Nếu chúng ta có thể tập hợp dữ liệu
  • 6:40 - 6:44
    có thể chúng ta sẽ khám phá ra
    các dấu hiệu
  • 6:44 - 6:47
    dự đoán tốt nhất rằng
    một tai nạn xe hơi
  • 6:47 - 6:53
    sẽ xảy ra trong 5 giây tiếp theo.
  • 6:53 - 6:55
    Và rồi những gì chúng ta sẽ
    dữ liệu hóa
  • 6:55 - 6:57
    sẽ là sự mệt mỏi của tài xế,
  • 6:57 - 6:59
    và dịch vụ lúc đó sẽ là
    khi chiếc xe cảm nhận được
  • 6:59 - 7:03
    rằng người tài xế đang rơi
    vào tình trạng mệt mỏi
  • 7:03 - 7:07
    nó sẽ tự động biết và rồi
    cài một báo động bên trong
  • 7:07 - 7:09
    để làm rung bánh lái, và
    bóp kèn ở trong xe
  • 7:09 - 7:11
    báo rằng, "Này! dậy đi,
  • 7:11 - 7:12
    chú ý đường đi kìa"
  • 7:12 - 7:14
    Đây là những thứ mà chúng ta có thể làm
  • 7:14 - 7:17
    khi chúng ta dữ liệu hóa các khía cạnh
    trong cuộc sống của chúng ta nhiều hơn
  • 7:17 - 7:21
    Vậy thì giá trị của dữ liệu lớn là gì?
  • 7:21 - 7:23
    Nào, hãy nghĩ xem.
  • 7:23 - 7:25
    Bạn có nhiều thông tin hơn.
  • 7:25 - 7:29
    Bạn có thể làm những việc mà
    bạn không thể làm trước đó
  • 7:29 - 7:30
    Một trong những lĩnh vực ấn tượng nhất
  • 7:30 - 7:32
    mà khái niệm này đang diễn ra
  • 7:32 - 7:35
    là trong lĩnh vực máy học.
  • 7:35 - 7:39
    Máy học là một nhánh của
    trí tuệ nhân tạo
  • 7:39 - 7:42
    mà bản thân nó là một nhánh của
    khoa học máy tính.
  • 7:42 - 7:43
    Ý tưởng chung là thay vì
  • 7:43 - 7:46
    phải hướng dẫn máy tính những gì phải làm
  • 7:46 - 7:48
    chúng ta sẽ chỉ ném dữ liệu
    liên quan đến vấn đề
  • 7:48 - 7:51
    và bảo máy tính tự tính toán.
  • 7:51 - 7:53
    Và để giúp bạn hiểu vấn đề này
  • 7:53 - 7:57
    hãy cùng nhìn lại nguồn gốc của nó.
  • 7:57 - 7:59
    Vào những năm 1950,
  • 7:59 - 8:03
    Một nhà khoa học máy tính của IBM
    tên Arthur Samuel thích chơi cờ,
  • 8:03 - 8:04
    nên ông ấy viết một chương trình máy tính
  • 8:04 - 8:07
    để ông ấy có thể chơi cờ với máy tính
  • 8:07 - 8:10
    Ông ấy chơi. Ông ấy thắng.
  • 8:10 - 8:12
    Ông ấy chơi. Ông ấy thắng,
  • 8:12 - 8:15
    Ông ấy chơi. Ông ấy thắng,
  • 8:15 - 8:17
    vì máy tính chỉ biết
  • 8:17 - 8:19
    nước đi đúng luật là thế nào.
  • 8:19 - 8:21
    Arthur Samuel biết một số thứ khác.
  • 8:21 - 8:26
    Arthur Samuel biết chiến lược.
  • 8:26 - 8:28
    Và như thế, bên cạnh đó, ông ấy
    viết một chương trình con.
  • 8:28 - 8:30
    hoạt động trên nền của
    chương trình chính, và những gì nó làm
  • 8:30 - 8:32
    chỉ là ghi xác suất
  • 8:32 - 8:34
    của bàn cờ cho sẵn có khả năng dẫn đến
  • 8:34 - 8:37
    một ván thắng hoặc một vấn thua
  • 8:37 - 8:40
    sau mỗi nước đi.
  • 8:40 - 8:43
    Ông ấy chơi với máy tính. Ông ấy thắng
  • 8:43 - 8:45
    Ông ấy chơi với máy tính. Ông ấy thắng
  • 8:45 - 8:49
    Ông ấy chơi với máy tính. Ông ấy thắng
  • 8:49 - 8:51
    Và rồi Arthur Samuel để máy tính
  • 8:51 - 8:54
    tự chơi cờ với chính nó.
  • 8:54 - 8:57
    Nó tự chơi cờ.
    Nó thu thập nhiều dữ liệu hơn.
  • 8:57 - 9:01
    Nó thu thập nhiều dữ liệu hơn.
    Nó tăng độ chính xác về khả năng dự đoạn
  • 9:01 - 9:03
    Và rồi Arthur Samuel quay lại máy tính
  • 9:03 - 9:06
    và ông ấy chơi cờ với nó, và ông ấy thua
  • 9:06 - 9:08
    và ông ấy chơi, ông ấy thua
  • 9:08 - 9:10
    và ông ấy chơi, ông ấy thua
  • 9:10 - 9:13
    và Arthur Samuel đã tạo ra một cỗ máy
  • 9:13 - 9:19
    vượt qua khả năng của ông ấy
    trong một việc mà chính ông ấy dạy nó.
  • 9:19 - 9:21
    Và ý tưởng này trong lĩnh vực máy học
  • 9:21 - 9:25
    đang được ứng dụng ở mọi nơi.
  • 9:25 - 9:28
    Bạn nghĩ làm sao chúng ta có
    xe hơi lái tự động?
  • 9:28 - 9:31
    Xã hội chúng ta có khá hơn không
  • 9:31 - 9:34
    khi chúng ta nhập tất cả các
    luật giao thông vào phần mềm?
  • 9:34 - 9:36
    Không. Bộ nhớ rẻ hơn? Không
  • 9:36 - 9:40
    Các thuật toán xử lý nhanh hơn? Không
    Bộ vi xử lý tốt hơn? Không
  • 9:40 - 9:43
    Tất cả những điều này đều quan trọng,
    nhưng đó không phải là lý do.
  • 9:43 - 9:46
    Mà là vì chúng ta đã thay đổi bản chất
    của vấn đề.
  • 9:46 - 9:48
    Từ một vấn đề mà chúng ta
    tìm cách để giải thích
  • 9:48 - 9:50
    rõ ràng và dứt khoát
  • 9:50 - 9:53
    cho máy tính hiểu rằng
    làm thế nào để lái xe
  • 9:53 - 9:54
    đến một vấn đề mà chúng ta nói rằng,
  • 9:54 - 9:56
    "Đây là tập dữ liệu xung quanh chiếc xe.
  • 9:56 - 9:57
    Hãy tự xử lý dữ liệu này.
  • 9:57 - 9:59
    Hãy tự luận ra rằng đó là đèn giao thông,
  • 9:59 - 10:01
    rằng đèn giao thông đó đang là đèn đỏ
    không phải đèn xanh
  • 10:01 - 10:03
    rằng điều đó có nghĩa là bạn phải dừng lại
  • 10:03 - 10:06
    và không đi về phía trước."
  • 10:06 - 10:08
    Máy học là nền tảng cơ bản
  • 10:08 - 10:10
    của rất nhiều thứ chúng ta làm trên mạng:
  • 10:10 - 10:12
    các công cụ tìm kiếm,
  • 10:12 - 10:16
    Thuật toán cá nhân hóa của Amazon,
  • 10:16 - 10:18
    máy tính dịch thuật,
  • 10:18 - 10:22
    hệ thống xác nhận giọng nói.
  • 10:22 - 10:25
    Gần đây, các nhà nghiên cứu đã tìm hiểu
  • 10:25 - 10:28
    về các vấn đề sinh thiết
  • 10:28 - 10:31
    sinh thiết ung thư,
  • 10:31 - 10:33
    và họ đã nhờ máy tính xác định,
  • 10:33 - 10:36
    bằng cách nhìn vào dữ liệu và
    chỉ số sống sót
  • 10:36 - 10:40
    để xác nhận rằng những tế bào này
  • 10:40 - 10:43
    có thật sự bị ung thư hay không,
  • 10:43 - 10:45
    và chắc chắn rằng, khi bạn nhập dữ liệu
    vào máy tính,
  • 10:45 - 10:47
    qua một thuật toán máy học
  • 10:47 - 10:49
    cỗ máy có thể xác định
  • 10:49 - 10:51
    những dấu hiệu dự đoán tốt nhất
  • 10:51 - 10:54
    rằng sinh thiết của các
    tế bào ung thư vú này
  • 10:54 - 10:57
    thật sự bị ung thư.
  • 10:57 - 11:00
    Vấn đề: Tài liệu y học
  • 11:00 - 11:03
    chỉ biết được 9 dấu hiệu.
  • 11:03 - 11:04
    Trong đó, có 3 dấu hiệu
  • 11:04 - 11:07
    mà mọi người không cần phải tìm kiếm
  • 11:07 - 11:13
    nhưng cỗ máy phát hiện ra.
  • 11:13 - 11:19
    Dữ liệu lớn cũng có mặt tối của nó.
  • 11:19 - 11:21
    Nó sẽ cải thiện cuộc sống của chúng ta,
    nhưng có những vấn đề
  • 11:21 - 11:24
    mà chúng ta nên cảnh giác,
  • 11:24 - 11:26
    và điều đầu tiên đó là quan niệm
  • 11:26 - 11:29
    rằng chúng ta có thể bị trừng phạt
    do các dự đoán,
  • 11:29 - 11:33
    rằng cảnh sát có thể sử dụng dữ liệu lớn
    cho mục đích của họ,
  • 11:33 - 11:35
    tựa như phim "Minority Report"
  • 11:35 - 11:38
    Nó là một thuật ngữ gọi là giám sát dự báo
  • 11:38 - 11:40
    hoặc thuật toán tội phạm học,
  • 11:40 - 11:42
    và khái niệm đó là: nếu chúng ta lấy
    nhiều dữ liệu,
  • 11:42 - 11:44
    ví dụ dữ liệu về các địa điểm
    xảy ra tội phạm
  • 11:44 - 11:47
    chúng ta sẽ biết nơi cần gửi
    đội tuần tra.
  • 11:47 - 11:49
    Điều đó là hợp lý, nhưng vấn đề, dĩ nhiên
  • 11:49 - 11:53
    không phải chỉ dừng về ở dữ liệu định vị,
  • 11:53 - 11:56
    nó sẽ xuống cấp độ thu thập dữ liệu
    của từng cá nhân
  • 11:56 - 11:59
    Tại sao chúng ta không dùng dữ liệu
    để biết về
  • 11:59 - 12:01
    bảng điểm cấp 3 của một người nào đó?
  • 12:01 - 12:02
    Có thể chúng ta nên dùng sự thật như
  • 12:02 - 12:04
    họ thất nghiệp hay không, điểm tín dụng,
  • 12:04 - 12:06
    cách họ lướt web
  • 12:06 - 12:08
    hay họ có thức khuya hay không.
  • 12:08 - 12:11
    Chí số Fitbit, khi nó có khả năng
    xác định các hóa sinh,
  • 12:11 - 12:15
    sẽ chỉ ra rằng họ có suy nghĩ hiếu chiến.
  • 12:15 - 12:17
    Chúng ta có thể có những thuật toán
    có khả năng dự đoán
  • 12:17 - 12:19
    những gì chúng ta sẽ làm,
  • 12:19 - 12:20
    và chúng ta có phải chịu trách nhiệm
  • 12:20 - 12:23
    trước khi chúng ta
    thật sự làm những điều đó
  • 12:23 - 12:25
    Bảo mật là thách thức trọng tâm
  • 12:25 - 12:28
    trong thời đại dữ liệu nhỏ.
  • 12:28 - 12:30
    Trong thời đại dữ liệu lớn,
  • 12:30 - 12:34
    thách thức sẽ là bảo vệ tự do,
  • 12:34 - 12:38
    lựa chọn đạo đức, ý chí con người,
  • 12:38 - 12:41
    tính chủ thể.
  • 12:43 - 12:45
    Còn có một vấn đề nữa:
  • 12:45 - 12:48
    Dữ liệu lớn sẽ cướp đi
    việc làm của chúng ta.
  • 12:48 - 12:52
    Dữ liệu lớn và các thuật toán
    sẽ thách thức
  • 12:52 - 12:55
    công việc văn phòng,
    công việc chuyên môn
  • 12:55 - 12:57
    trong thế kỷ 21
  • 12:57 - 12:59
    trong cùng một cách mà máy móc tự động
  • 12:59 - 13:01
    và dây chuyền lắp ráp
  • 13:01 - 13:04
    thách thức công nhân ở thế kỉ 20
  • 13:04 - 13:06
    Hãy nghĩ về kỹ thuật viên phòng thí nghiệm
  • 13:06 - 13:08
    người tìm hiểu vấn đề qua
    một cái kính hiển vi
  • 13:08 - 13:09
    ở viện sinh thiết ung thư
  • 13:09 - 13:12
    và xác định xem sinh thiết này
    có bị ung thư hay không.
  • 13:12 - 13:14
    Người này đã học xong đại học
  • 13:14 - 13:15
    Người này mua nhà.
  • 13:15 - 13:17
    Anh ấy hoặc cô ấy bỏ phiếu.
  • 13:19 - 13:21
    Anh ấy hoặc cô ấy là một nhân tố
    trong xã hội.
  • 13:21 - 13:22
    Và việc làm của người đó,
  • 13:22 - 13:24
    cũng như toàn bộ đội ngũ
  • 13:24 - 13:26
    của những người chuyên môn
    giống như người đó
  • 13:26 - 13:29
    sẽ thấy rằng việc làm của họ
    bị thay đổi một cách triệt để
  • 13:29 - 13:31
    hoặc bị loại bỏ hoàn toàn.
  • 13:31 - 13:33
    Chúng ta thích nghĩ rằng
  • 13:33 - 13:36
    công nghệ sẽ tạo nên việc làm
    sau một khoảng thời gian
  • 13:36 - 13:39
    sau khoản thời gian rối loạn tạm thời,
  • 13:39 - 13:41
    và điều đó là đúng
    cho các khung tham chiếu
  • 13:41 - 13:43
    mà chúng ta sống, Cách mạng công nghiệp,
  • 13:43 - 13:46
    vì đó chính xác là những gì đã xảy ra.
  • 13:46 - 13:48
    Nhưng chúng ta quên điều gì đó
    trong bài phân tích đấy:
  • 13:48 - 13:50
    Có một số loại công việc
  • 13:50 - 13:53
    đơn giản là bị loại bỏ hoàn toàn và
    không bao giờ quay lại.
  • 13:53 - 13:55
    Cách mạng công nghiệp không hề tốt
  • 13:55 - 13:59
    nếu bạn là một con ngựa.
  • 13:59 - 14:01
    Do đó chúng ta phải thận trọng
  • 14:01 - 14:05
    trong việc sử dụng dữ liệu lớn và
    điều chỉnh nó cho nhu cầu của chúng ta
  • 14:05 - 14:08
    nhu cầu rất con người của chúng ta.
  • 14:08 - 14:10
    Chúng ta phải là chủ của công nghệ này,
  • 14:10 - 14:12
    chứ không phải là người hầu của nó.
  • 14:12 - 14:15
    Chúng ta chỉ khởi đầu một kỷ nguyên
    của dữ liệu lớn
  • 14:15 - 14:18
    và thành thật mà nói,
    chúng ta không hề giỏi
  • 14:18 - 14:22
    trong việc xử lý tất cả các dữ liệu
    mà chúng ta có thể thu thập.
  • 14:22 - 14:25
    Nó không chỉ là vấn đề cho
    Cục An ninh Quốc gia.
  • 14:25 - 14:28
    Các doanh nghiệp thu thập rất nhiều
    dữ liệu và họ cũng lạm dụng nó.
  • 14:28 - 14:32
    Chúng ta phải làm tốt hơn và điều này
    sẽ tốn nhiều thời gian.
  • 14:32 - 14:34
    Nó giống như là thử thách mà
  • 14:34 - 14:36
    người nguyên thủy gặp phải với lửa
  • 14:36 - 14:38
    Đây là một công cụ,
    nhưng là một công cụ mà
  • 14:38 - 14:42
    nếu chúng ta không cẩn thận,
    sẽ thiêu cháy chúng ta.
  • 14:44 - 14:47
    Dữ liệu lớn sẽ thay đổi
    cách sống của chúng ta
  • 14:47 - 14:50
    cách chúng ta làm việc và
    cách chúng ta suy nghĩ.
  • 14:50 - 14:52
    Nó sẽ giúp chúng ta quản lý
    sự nghiệp của chúng ta
  • 14:52 - 14:55
    và dẫn đến cuộc sống của
    sự hài lòng và hy vọng
  • 14:55 - 14:58
    và hạnh phúc và sức khỏe.
  • 14:58 - 15:02
    Nhưng ở trong quá khứ, chúng ta
    thường nhìn vào công nghệ thông tin
  • 15:02 - 15:04
    và con mắt chúng ta chỉ nhìn thấy
    những thứ như,
  • 15:04 - 15:06
    công nghệ, phần mềm,
  • 15:06 - 15:08
    những thứ vật chất.
  • 15:08 - 15:11
    Chúng ta phải đúc kết lại
    cái nhìn của chúng ta,
  • 15:11 - 15:12
    nhìn vào thông tin,
  • 15:12 - 15:14
    dù nó ít rõ ràng hơn
  • 15:14 - 15:18
    nhưng trong một số khía cạnh
    quan trọng hơn rất nhiều.
  • 15:18 - 15:21
    Nhân loại cuối cùng cũng có thể
    học hỏi từ những thông tin
  • 15:21 - 15:24
    mà nó có thể thu thập,
  • 15:24 - 15:26
    như một phần của cuộc thám hiểm
    vô tận của chúng ta
  • 15:26 - 15:29
    để hiểu về thế giới và vị trí của chúng ta
    trong thế giới,
  • 15:29 - 15:34
    và đó là lý do tại sao dữ liệu lớn
    là một vấn đề quan trọng.
  • 15:34 - 15:38
    (vỗ tay)
Title:
Big data (dữ liệu lớn) là dữ liệu tốt hơn
Speaker:
Kenneth Cukier
Description:

Ô tô tự lái mới chỉ là khởi đầu. Tương lai của Big date (dữ liệu lớn) sẽ ra sao dưới sự ảnh hưởng của công nghệ và thiết kế? Trong bài nói chuyện khoa học đầy thú vị của mình, Kenneth Cukier đi sâu vào tương lai của máy học và tri thức con người.

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
15:51

Vietnamese subtitles

Revisions Compare revisions