0:00:00.787,0:00:04.632 Loại bánh ưa thích tại Mỹ là ? 0:00:04.632,0:00:08.138 Khán giả: Bánh táo.[br]Kenneth Cukier: Bánh táo. Tất nhiên rồi. 0:00:08.138,0:00:09.369 Làm sao ta biết được? 0:00:09.369,0:00:12.122 Nhờ có dữ liệu. 0:00:12.122,0:00:14.188 Nhìn vào doanh số bán hàng siêu thị. 0:00:14.188,0:00:17.054 Nhìn vào doanh số bán của các [br]loại bánh đường kính 30cm 0:00:17.054,0:00:21.129 được đông lạnh, [br]và bánh táo thắng tuyệt đối. 0:00:21.129,0:00:26.309 Phần lớn bánh bán ra là bánh táo. 0:00:26.309,0:00:29.273 Nhưng đến khi [br]các siêu thị bắt đầu bán 0:00:29.273,0:00:31.856 loại nhỏ hơn, cỡ 11 cm, 0:00:31.856,0:00:36.030 thì đột nhiên, bánh táo tụt [br]xuống hạng tư hay năm. 0:00:36.030,0:00:38.905 Tại sao? Điều gì đã xảy ra? 0:00:38.905,0:00:41.723 Hãy cùng suy nghĩ về điều này. 0:00:41.723,0:00:45.571 Khi bạn mua bánh cỡ 30 cm, 0:00:45.571,0:00:47.832 cả gia đình bạn phải đồng ý, 0:00:47.832,0:00:51.623 thực tế, bánh táo chỉ đứng thứ hai [br]trong danh sách yêu thích của mọi người. 0:00:51.623,0:00:53.558 (tiếng cười) 0:00:53.558,0:00:57.173 Nhưng khi mua một cái [br]bánh cỡ 11 cm, 0:00:57.173,0:01:00.918 bạn có thể mua cái mà bạn muốn. 0:01:00.918,0:01:04.508 Bạn có thể mua loại [br]mà mình thích nhất. 0:01:04.508,0:01:06.574 Bạn có nhiều dữ liệu hơn. 0:01:06.574,0:01:08.128 Bạn có thể thấy được những thứ 0:01:08.128,0:01:12.920 không thể thấy [br]khi chỉ có một lượng nhỏ dữ liệu. 0:01:12.920,0:01:15.688 Điểm mấu chốt ở đây là, [br]có nhiều dữ liệu hơn 0:01:15.688,0:01:17.971 không những giúp ta thấy nhiều hơn, 0:01:17.971,0:01:19.825 nhiều hơn về thứ ta đang nhìn. 0:01:19.825,0:01:23.438 Nhiều dữ liệu hơn còn giúp ta [br]thấy được những điều mới, 0:01:23.438,0:01:26.532 mang đến một góc nhìn tốt hơn, 0:01:26.532,0:01:30.188 cho phép ta thấy khác đi. 0:01:30.188,0:01:33.361 Trong trường hợp này, [br]nó cho phép ta thấy 0:01:33.361,0:01:36.274 thứ bánh nào được ưa chuộng ở Mỹ: 0:01:36.274,0:01:38.816 không phải bánh táo. 0:01:38.816,0:01:42.430 Các bạn chắc hẳn đã từng [br]nghe về khái niệm big data (dữ liệu lớn). 0:01:42.430,0:01:45.717 Đúng hơn, hẳn các bạn [br]đã chán ngấy về nó. 0:01:45.717,0:01:49.447 Thật đúng khi cho rằng có nhiều [br]sự thổi phồng xung quanh khái niệm trên, 0:01:49.447,0:01:51.779 và điều đó thật đáng tiếc, 0:01:51.779,0:01:54.825 vì big data là một công cụ[br]cực kì quan trọng 0:01:54.825,0:01:58.559 mà nhờ đó, [br]xã hội sẽ trở nên tiến bộ hơn. 0:01:58.559,0:02:02.120 Trong quá khứ, chúng ta thường [br]nhìn vào những dữ liệu nhỏ, 0:02:02.120,0:02:03.824 tìm hiểu ý nghĩa của chúng, 0:02:03.824,0:02:05.320 để cố gắng hiểu về thế giới, 0:02:05.320,0:02:07.311 và giờ, ta có nhiều dữ liệu hơn, 0:02:07.311,0:02:10.033 nhiều hơn bao giờ hết. 0:02:10.033,0:02:11.910 Những gì ta biết là khi có 0:02:11.910,0:02:14.634 một lượng lớn dữ liệu, [br]ta có thể làm những điều 0:02:14.634,0:02:17.910 mà trước kia không thể. 0:02:17.910,0:02:20.551 Dữ liệu lớn rất quan trọng, [br]và mới mẻ, 0:02:20.551,0:02:22.328 và đó có thể là 0:02:22.328,0:02:24.544 cách duy nhất mà hành tinh này sẽ 0:02:24.544,0:02:26.333 đối phó với những thử thách toàn cầu: 0:02:26.333,0:02:29.870 đảm bảo thức ăn cho mọi người, [br]cung cấp dịch vụ y tế, 0:02:29.870,0:02:32.680 cung cấp năng lượng, điện, 0:02:32.680,0:02:34.469 và đảm bảo người dân[br]không bị thiêu rụi 0:02:34.469,0:02:35.707 bởi sự nóng lên toàn cầu - 0:02:35.707,0:02:39.902 tất cả nhờ vào [br]việc sử dụng dữ liệu hiệu quả. 0:02:39.902,0:02:43.772 Vậy thì, có gì mới về dữ liệu lớn? [br]Có gì mà to tát vậy chứ? 0:02:43.772,0:02:46.289 Được, để trả lời câu hỏi đó, hãy nghĩ về 0:02:46.289,0:02:50.949 thông tin trông như thế nào,[br]trước kia. 0:02:50.949,0:02:54.830 Vào năm 1908, trên đảo Crete, 0:02:54.830,0:02:59.565 các nhà khảo cổ học tìm ra [br]một cái đĩa đất sét. 0:02:59.565,0:03:03.624 Họ xác định nó từ là 2000 năm trước [br]Công nguyên, vậy nó 4000 tuổi. 0:03:03.624,0:03:07.195 Có chữ khắc trên tấm đĩa,[br]nhưng ta không hiểu nó có nghĩa gì. 0:03:07.195,0:03:09.053 Hoàn toàn là một bí ẩn, [br]nhưng vấn đề là 0:03:09.053,0:03:12.750 thông tin đã từng trông như thế[br]4000 năm trước. 0:03:12.750,0:03:15.618 Đây là cách xã hội lưu trữ 0:03:15.618,0:03:19.142 và truyền tải thông tin. 0:03:19.142,0:03:23.302 Bây giờ, xã hội chưa tân tiến đến mức đó. 0:03:23.302,0:03:26.776 Chúng ta vẫn lưu trữ thông tin trên đĩa, 0:03:26.776,0:03:31.000 nhưng giờ, có thể lưu trữ [br]nhiều thông tin hơn trước kia. 0:03:31.000,0:03:34.313 Tìm kiếm nó thì dễ hơn. [br]Sao chép nó cũng dễ hơn. 0:03:34.313,0:03:37.813 Chia sẻ cũng dễ hơn. [br]Xử lý dễ hơn. 0:03:37.813,0:03:40.319 Những gì ta có thể làm là [br]sử dụng lại thông tin này 0:03:40.319,0:03:42.933 vào việc mà thậm chí [br]chưa bao giờ tưởng tượng ra 0:03:42.933,0:03:45.608 khi mới bắt đầu thu thập dữ liệu. 0:03:45.608,0:03:47.860 Về lĩnh vực này, dữ liệu đã đi 0:03:47.860,0:03:51.392 từ một kho tích trữ về một dòng chảy , 0:03:51.392,0:03:55.330 từ thứ bất động và cố định 0:03:55.330,0:03:58.939 sang linh hoạt và năng động. 0:03:58.939,0:04:02.962 Có một thanh khoản thông tin. 0:04:02.962,0:04:06.436 Cái đĩa được tìm thấy ở Crete 0:04:06.436,0:04:10.200 đã 4000 năm tuổi, rất nặng, 0:04:10.200,0:04:12.162 nó không lưu trữ được nhiều thông tin, 0:04:12.162,0:04:15.278 và số thông tin đó không thể thay đổi. 0:04:15.278,0:04:19.289 Ngược lại, tất cả những hồ sơ 0:04:19.289,0:04:21.150 mà Edward Snowden lấy 0:04:21.150,0:04:23.771 từ Cục An ninh Quốc gia Hoa Kỳ 0:04:23.771,0:04:26.190 chứa vừa trong một thẻ nhớ 0:04:26.190,0:04:29.200 bằng kích thước của móng tay, 0:04:29.200,0:04:33.945 và có thể được chia sẻ [br]với tốc độ ánh sáng. 0:04:33.945,0:04:38.240 Nhiều dữ liệu hơn, hơn rất nhiều. 0:04:38.240,0:04:41.174 Một lý do tại sao có quá nhiều [br]dữ liệu trên thế giới hiện nay 0:04:41.174,0:04:43.266 là vì chúng ta đang [br]thu thập những thứ 0:04:43.266,0:04:45.886 ta vẫn luôn thu thập, 0:04:45.886,0:04:48.542 một lý do khác để giải thích[br]việc chúng ta lấy những thứ 0:04:48.542,0:04:51.354 đã luôn cung cấp thông tin 0:04:51.354,0:04:53.840 nhưng chưa bao giờ được làm thành dạng dữ liệu 0:04:53.840,0:04:56.259 và do đó,[br]chúng ta bỏ những thứ đấy vào dữ liệu 0:04:56.259,0:04:59.567 Lấy ví dụ, câu hỏi về địa điểm 0:04:59.567,0:05:01.816 Lấy ví dụ, Martin Luther 0:05:01.816,0:05:03.413 Nếu chúng ta muốn biết vào năm 1500 0:05:03.413,0:05:06.080 Martin Luther ở đâu, 0:05:06.080,0:05:08.172 chúng ta sẽ phải theo dõi ông ấy[br]mọi lúc, 0:05:08.172,0:05:10.309 kèm theo một cây bút lông [br]và một lọ mực 0:05:10.309,0:05:11.985 để ghi chép lại. 0:05:11.985,0:05:14.168 Nhưng bây giờ hãy nghĩ nó[br]sẽ như thế nào ngày nay. 0:05:14.168,0:05:16.290 Bạn biết rằng ở một nơi nào đó, 0:05:16.290,0:05:18.736 khả năng là trong cơ sở dữ liệu[br]của một hãng viễn thông 0:05:18.736,0:05:21.772 có một bảng tính hoặc ít nhất [br]một mục cơ sở dữ liệu 0:05:21.772,0:05:23.860 lưu trữ lại thông tin của bạn 0:05:23.860,0:05:25.923 những nơi bạn đã đến [br]tại mọi thời điểm 0:05:25.923,0:05:27.283 Nếu bạn có điện thoại di động, 0:05:27.283,0:05:30.130 và chiếc điện thoại đó có GPS,[br]nhưng ngay cả khi nó không có GPS, 0:05:30.130,0:05:32.515 nó vẫn có thể lưu trữ thông tin của bạn 0:05:32.515,0:05:36.599 Trong lĩnh vực này, việc định vị[br]đã được dữ liệu hóa 0:05:36.599,0:05:41.200 Bây giờ, lấy ví dụ[br]vấn đề về tư thế 0:05:41.200,0:05:42.485 tư thế mà các bạn đang ngồi bây giờ 0:05:42.485,0:05:44.515 tư thế mà bạn ngồi, 0:05:44.515,0:05:47.286 tư thế mà bạn ngồi, tư thế mà bạn ngồi 0:05:47.286,0:05:49.363 Nó đều khác nhau, và đó là một chức năng[br]giữa chiều dài chân bạn 0:05:49.363,0:05:51.456 lưng bạn và những đường nét của lưng bạn 0:05:51.456,0:05:53.987 và nếu bây giờ tôi đặt thiết bị cảm biến 0:05:53.987,0:05:55.753 vào tất cả các ghế 0:05:55.753,0:05:59.353 Tôi có thể tạo ra một chỉ số [br]tương đối độc nhất về bạn, 0:05:59.353,0:06:03.762 ví dụ như dấu vân tây, [br]nhưng không phải là ngón tay của bạn 0:06:03.762,0:06:06.731 Vậy chúng ta có thể làm gì với nó? 0:06:06.731,0:06:09.128 Các nhà nghiên cứu ở Tokyo đang dùng[br]dấu vân tay 0:06:09.128,0:06:13.516 để tạo ra một thiết bị có tiềm năng[br]chống trộm xe hơi. 0:06:13.516,0:06:16.440 Ý tưởng là nếu tên trộm ngồi đằng sau[br]tay lái 0:06:16.440,0:06:18.544 và cố lái đi, nhưng nếu chiếc xe nhận ra 0:06:18.544,0:06:20.906 rằng đằng sau bánh lái là một[br]tài xế không được xác duyệt, 0:06:20.906,0:06:23.070 thì động cơ sẽ tự động dừng, trừ khi 0:06:23.070,0:06:26.247 bạn nhập mật khẩu vào bảng điều khiển 0:06:26.247,0:06:30.905 để báo rằng "Tôi có sự cho phép". Tuyệt. 0:06:30.905,0:06:33.458 Nếu như mọi chiếc xe ở Châu Âu 0:06:33.458,0:06:34.915 đều có công nghệ này thì sao? 0:06:34.915,0:06:38.080 Chúng ta có thể làm gì lúc đó? 0:06:38.080,0:06:40.320 Nếu chúng ta có thể tập hợp dữ liệu 0:06:40.320,0:06:44.134 có thể chúng ta sẽ khám phá ra [br]các dấu hiệu 0:06:44.134,0:06:46.843 dự đoán tốt nhất rằng [br]một tai nạn xe hơi 0:06:46.843,0:06:52.736 sẽ xảy ra trong 5 giây tiếp theo. 0:06:52.736,0:06:55.293 Và rồi những gì chúng ta sẽ[br]dữ liệu hóa 0:06:55.293,0:06:57.076 sẽ là sự mệt mỏi của tài xế, 0:06:57.076,0:06:59.410 và dịch vụ lúc đó sẽ là [br]khi chiếc xe cảm nhận được 0:06:59.410,0:07:02.847 rằng người tài xế đang rơi[br]vào tình trạng mệt mỏi 0:07:02.847,0:07:06.841 nó sẽ tự động biết và rồi[br]cài một báo động bên trong 0:07:06.841,0:07:08.866 để làm rung bánh lái, và [br]bóp kèn ở trong xe 0:07:08.866,0:07:10.587 báo rằng, "Này! dậy đi, 0:07:10.587,0:07:12.491 chú ý đường đi kìa" 0:07:12.491,0:07:14.344 Đây là những thứ mà chúng ta có thể làm 0:07:14.344,0:07:17.165 khi chúng ta dữ liệu hóa các khía cạnh[br]trong cuộc sống của chúng ta nhiều hơn 0:07:17.165,0:07:20.840 Vậy thì giá trị của dữ liệu lớn là gì? 0:07:20.840,0:07:23.030 Nào, hãy nghĩ xem. 0:07:23.030,0:07:25.442 Bạn có nhiều thông tin hơn. 0:07:25.442,0:07:28.783 Bạn có thể làm những việc mà[br]bạn không thể làm trước đó 0:07:28.783,0:07:30.459 Một trong những lĩnh vực ấn tượng nhất 0:07:30.459,0:07:32.188 mà khái niệm này đang diễn ra 0:07:32.188,0:07:35.495 là trong lĩnh vực máy học. 0:07:35.495,0:07:38.572 Máy học là một nhánh của [br]trí tuệ nhân tạo 0:07:38.572,0:07:41.950 mà bản thân nó là một nhánh của[br]khoa học máy tính. 0:07:41.950,0:07:43.493 Ý tưởng chung là thay vì 0:07:43.493,0:07:45.610 phải hướng dẫn máy tính những gì phải làm 0:07:45.610,0:07:48.230 chúng ta sẽ chỉ ném dữ liệu [br]liên quan đến vấn đề 0:07:48.230,0:07:51.436 và bảo máy tính tự tính toán. 0:07:51.436,0:07:53.213 Và để giúp bạn hiểu vấn đề này 0:07:53.213,0:07:56.765 hãy cùng nhìn lại nguồn gốc của nó. 0:07:56.765,0:07:59.153 Vào những năm 1950, 0:07:59.153,0:08:02.745 Một nhà khoa học máy tính của IBM[br]tên Arthur Samuel thích chơi cờ, 0:08:02.745,0:08:04.147 nên ông ấy viết một chương trình máy tính 0:08:04.147,0:08:06.960 để ông ấy có thể chơi cờ với máy tính 0:08:06.960,0:08:09.671 Ông ấy chơi. Ông ấy thắng. 0:08:09.671,0:08:11.774 Ông ấy chơi. Ông ấy thắng, 0:08:11.774,0:08:14.789 Ông ấy chơi. Ông ấy thắng, 0:08:14.789,0:08:16.567 vì máy tính chỉ biết 0:08:16.567,0:08:18.794 nước đi đúng luật là thế nào. 0:08:18.794,0:08:20.881 Arthur Samuel biết một số thứ khác. 0:08:20.881,0:08:25.510 Arthur Samuel biết chiến lược. 0:08:25.510,0:08:27.906 Và như thế, bên cạnh đó, ông ấy[br]viết một chương trình con.[br] 0:08:27.906,0:08:29.880 hoạt động trên nền của [br]chương trình chính, và những gì nó làm 0:08:29.880,0:08:31.697 chỉ là ghi xác suất 0:08:31.697,0:08:34.260 của bàn cờ cho sẵn có khả năng dẫn đến 0:08:34.260,0:08:37.170 một ván thắng hoặc một vấn thua 0:08:37.170,0:08:39.678 sau mỗi nước đi. 0:08:39.678,0:08:42.828 Ông ấy chơi với máy tính. Ông ấy thắng 0:08:42.828,0:08:45.336 Ông ấy chơi với máy tính. Ông ấy thắng 0:08:45.336,0:08:49.067 Ông ấy chơi với máy tính. Ông ấy thắng 0:08:49.067,0:08:51.344 Và rồi Arthur Samuel để máy tính 0:08:51.344,0:08:53.571 tự chơi cờ với chính nó. 0:08:53.571,0:08:57.080 Nó tự chơi cờ. [br]Nó thu thập nhiều dữ liệu hơn. 0:08:57.080,0:09:01.389 Nó thu thập nhiều dữ liệu hơn. [br]Nó tăng độ chính xác về khả năng dự đoạn 0:09:01.389,0:09:03.493 Và rồi Arthur Samuel quay lại máy tính 0:09:03.493,0:09:05.811 và ông ấy chơi cờ với nó, và ông ấy thua 0:09:05.811,0:09:07.880 và ông ấy chơi, ông ấy thua 0:09:07.880,0:09:09.927 và ông ấy chơi, ông ấy thua 0:09:09.927,0:09:12.526 và Arthur Samuel đã tạo ra một cỗ máy 0:09:12.526,0:09:18.814 vượt qua khả năng của ông ấy[br]trong một việc mà chính ông ấy dạy nó. 0:09:18.814,0:09:21.312 Và ý tưởng này trong lĩnh vực máy học 0:09:21.312,0:09:25.239 đang được ứng dụng ở mọi nơi. 0:09:25.239,0:09:28.388 Bạn nghĩ làm sao chúng ta có[br]xe hơi lái tự động? 0:09:28.388,0:09:30.525 Xã hội chúng ta có khá hơn không 0:09:30.525,0:09:33.810 khi chúng ta nhập tất cả các[br]luật giao thông vào phần mềm? 0:09:33.810,0:09:36.408 Không. Bộ nhớ rẻ hơn? Không 0:09:36.408,0:09:40.402 Các thuật toán xử lý nhanh hơn? Không[br]Bộ vi xử lý tốt hơn? Không 0:09:40.402,0:09:43.174 Tất cả những điều này đều quan trọng,[br]nhưng đó không phải là lý do. 0:09:43.174,0:09:46.315 Mà là vì chúng ta đã thay đổi bản chất[br]của vấn đề. 0:09:46.315,0:09:47.845 Từ một vấn đề mà chúng ta [br]tìm cách để giải thích 0:09:47.845,0:09:50.090 rõ ràng và dứt khoát 0:09:50.090,0:09:52.671 cho máy tính hiểu rằng[br]làm thế nào để lái xe 0:09:52.671,0:09:53.987 đến một vấn đề mà chúng ta nói rằng, 0:09:53.987,0:09:55.863 "Đây là tập dữ liệu xung quanh chiếc xe. 0:09:55.863,0:09:57.396 Hãy tự xử lý dữ liệu này. 0:09:57.396,0:09:59.263 Hãy tự luận ra rằng đó là đèn giao thông, 0:09:59.263,0:10:01.344 rằng đèn giao thông đó đang là đèn đỏ[br]không phải đèn xanh 0:10:01.344,0:10:03.358 rằng điều đó có nghĩa là bạn phải dừng lại 0:10:03.358,0:10:06.441 và không đi về phía trước." 0:10:06.441,0:10:07.959 Máy học là nền tảng cơ bản 0:10:07.959,0:10:09.950 của rất nhiều thứ chúng ta làm trên mạng: 0:10:09.950,0:10:11.807 các công cụ tìm kiếm, 0:10:11.807,0:10:15.608 Thuật toán cá nhân hóa của Amazon, 0:10:15.608,0:10:17.820 máy tính dịch thuật, 0:10:17.820,0:10:22.110 hệ thống xác nhận giọng nói. 0:10:22.110,0:10:24.945 Gần đây, các nhà nghiên cứu đã tìm hiểu 0:10:24.945,0:10:28.140 về các vấn đề sinh thiết 0:10:28.140,0:10:30.907 sinh thiết ung thư, 0:10:30.907,0:10:33.222 và họ đã nhờ máy tính xác định, 0:10:33.222,0:10:35.693 bằng cách nhìn vào dữ liệu và[br]chỉ số sống sót 0:10:35.693,0:10:40.360 để xác nhận rằng những tế bào này 0:10:40.360,0:10:42.904 có thật sự bị ung thư hay không, 0:10:42.904,0:10:44.682 và chắc chắn rằng, khi bạn nhập dữ liệu [br]vào máy tính, 0:10:44.682,0:10:46.729 qua một thuật toán máy học 0:10:46.729,0:10:48.606 cỗ máy có thể xác định 0:10:48.606,0:10:50.868 những dấu hiệu dự đoán tốt nhất 0:10:50.868,0:10:54.167 rằng sinh thiết của các [br]tế bào ung thư vú này 0:10:54.167,0:10:57.385 thật sự bị ung thư. 0:10:57.385,0:10:59.883 Vấn đề: Tài liệu y học 0:10:59.883,0:11:02.672 chỉ biết được 9 dấu hiệu. 0:11:02.672,0:11:04.472 Trong đó, có 3 dấu hiệu 0:11:04.472,0:11:07.447 mà mọi người không cần phải tìm kiếm 0:11:07.447,0:11:12.978 nhưng cỗ máy phát hiện ra. 0:11:12.978,0:11:18.903 Dữ liệu lớn cũng có mặt tối của nó. 0:11:18.903,0:11:20.977 Nó sẽ cải thiện cuộc sống của chúng ta,[br]nhưng có những vấn đề 0:11:20.977,0:11:23.617 mà chúng ta nên cảnh giác, 0:11:23.617,0:11:26.240 và điều đầu tiên đó là quan niệm 0:11:26.240,0:11:28.926 rằng chúng ta có thể bị trừng phạt[br]do các dự đoán,[br] 0:11:28.926,0:11:32.796 rằng cảnh sát có thể sử dụng dữ liệu lớn[br]cho mục đích của họ, 0:11:32.796,0:11:35.147 tựa như phim "Minority Report" 0:11:35.147,0:11:37.588 Nó là một thuật ngữ gọi là giám sát dự báo 0:11:37.588,0:11:39.951 hoặc thuật toán tội phạm học, 0:11:39.951,0:11:41.987 và khái niệm đó là: nếu chúng ta lấy [br]nhiều dữ liệu, 0:11:41.987,0:11:44.146 ví dụ dữ liệu về các địa điểm [br]xảy ra tội phạm 0:11:44.146,0:11:46.689 chúng ta sẽ biết nơi cần gửi[br]đội tuần tra. 0:11:46.689,0:11:48.804 Điều đó là hợp lý, nhưng vấn đề, dĩ nhiên 0:11:48.804,0:11:53.348 không phải chỉ dừng về ở dữ liệu định vị, 0:11:53.348,0:11:56.307 nó sẽ xuống cấp độ thu thập dữ liệu[br]của từng cá nhân 0:11:56.307,0:11:58.557 Tại sao chúng ta không dùng dữ liệu[br]để biết về 0:11:58.557,0:12:00.785 bảng điểm cấp 3 của một người nào đó? 0:12:00.785,0:12:02.346 Có thể chúng ta nên dùng sự thật như 0:12:02.346,0:12:04.374 họ thất nghiệp hay không, điểm tín dụng, 0:12:04.374,0:12:05.926 cách họ lướt web 0:12:05.926,0:12:07.804 hay họ có thức khuya hay không. 0:12:07.804,0:12:10.965 Chí số Fitbit, khi nó có khả năng[br]xác định các hóa sinh,[br] 0:12:10.965,0:12:15.201 sẽ chỉ ra rằng họ có suy nghĩ hiếu chiến. 0:12:15.201,0:12:17.422 Chúng ta có thể có những thuật toán[br]có khả năng dự đoán 0:12:17.422,0:12:19.055 những gì chúng ta sẽ làm, 0:12:19.055,0:12:20.299 và chúng ta có phải chịu trách nhiệm 0:12:20.299,0:12:22.889 trước khi chúng ta[br]thật sự làm những điều đó 0:12:22.889,0:12:24.621 Bảo mật là thách thức trọng tâm 0:12:24.621,0:12:27.501 trong thời đại dữ liệu nhỏ. 0:12:27.501,0:12:29.650 Trong thời đại dữ liệu lớn, 0:12:29.650,0:12:34.173 thách thức sẽ là bảo vệ tự do, 0:12:34.173,0:12:37.952 lựa chọn đạo đức, ý chí con người, 0:12:37.952,0:12:41.020 tính chủ thể. 0:12:42.540,0:12:44.765 Còn có một vấn đề nữa: 0:12:44.765,0:12:48.321 Dữ liệu lớn sẽ cướp đi [br]việc làm của chúng ta. 0:12:48.321,0:12:51.833 Dữ liệu lớn và các thuật toán[br]sẽ thách thức 0:12:51.833,0:12:54.894 công việc văn phòng,[br]công việc chuyên môn 0:12:54.894,0:12:56.547 trong thế kỷ 21 0:12:56.547,0:12:58.981 trong cùng một cách mà máy móc tự động 0:12:58.981,0:13:01.170 và dây chuyền lắp ráp 0:13:01.170,0:13:04.196 thách thức công nhân ở thế kỉ 20 0:13:04.196,0:13:06.288 Hãy nghĩ về kỹ thuật viên phòng thí nghiệm 0:13:06.288,0:13:07.697 người tìm hiểu vấn đề qua[br]một cái kính hiển vi 0:13:07.697,0:13:09.321 ở viện sinh thiết ung thư 0:13:09.321,0:13:11.958 và xác định xem sinh thiết này[br]có bị ung thư hay không. 0:13:11.958,0:13:13.930 Người này đã học xong đại học 0:13:13.930,0:13:15.360 Người này mua nhà. 0:13:15.360,0:13:17.162 Anh ấy hoặc cô ấy bỏ phiếu. 0:13:18.964,0:13:20.767 Anh ấy hoặc cô ấy là một nhân tố [br]trong xã hội. 0:13:20.767,0:13:22.161 Và việc làm của người đó, 0:13:22.161,0:13:23.770 cũng như toàn bộ đội ngũ 0:13:23.770,0:13:25.739 của những người chuyên môn [br]giống như người đó 0:13:25.739,0:13:28.889 sẽ thấy rằng việc làm của họ [br]bị thay đổi một cách triệt để 0:13:28.889,0:13:31.246 hoặc bị loại bỏ hoàn toàn. 0:13:31.246,0:13:32.530 Chúng ta thích nghĩ rằng 0:13:32.530,0:13:35.717 công nghệ sẽ tạo nên việc làm [br]sau một khoảng thời gian 0:13:35.717,0:13:39.182 sau khoản thời gian rối loạn tạm thời, 0:13:39.182,0:13:41.123 và điều đó là đúng [br]cho các khung tham chiếu 0:13:41.123,0:13:43.265 mà chúng ta sống, Cách mạng công nghiệp, 0:13:43.265,0:13:45.593 vì đó chính xác là những gì đã xảy ra. 0:13:45.593,0:13:47.926 Nhưng chúng ta quên điều gì đó[br]trong bài phân tích đấy: 0:13:47.926,0:13:49.756 Có một số loại công việc 0:13:49.756,0:13:53.176 đơn giản là bị loại bỏ hoàn toàn và[br]không bao giờ quay lại. 0:13:53.176,0:13:55.180 Cách mạng công nghiệp không hề tốt 0:13:55.180,0:13:59.182 nếu bạn là một con ngựa. 0:13:59.182,0:14:01.237 Do đó chúng ta phải thận trọng 0:14:01.237,0:14:04.751 trong việc sử dụng dữ liệu lớn và[br]điều chỉnh nó cho nhu cầu của chúng ta 0:14:04.751,0:14:07.936 nhu cầu rất con người của chúng ta. 0:14:07.936,0:14:09.890 Chúng ta phải là chủ của công nghệ này, 0:14:09.890,0:14:11.546 chứ không phải là người hầu của nó. 0:14:11.546,0:14:14.504 Chúng ta chỉ khởi đầu một kỷ nguyên[br]của dữ liệu lớn 0:14:14.504,0:14:17.654 và thành thật mà nói, [br]chúng ta không hề giỏi 0:14:17.654,0:14:21.861 trong việc xử lý tất cả các dữ liệu[br]mà chúng ta có thể thu thập. 0:14:21.861,0:14:25.191 Nó không chỉ là vấn đề cho[br]Cục An ninh Quốc gia. 0:14:25.191,0:14:28.229 Các doanh nghiệp thu thập rất nhiều[br]dữ liệu và họ cũng lạm dụng nó. 0:14:28.229,0:14:31.896 Chúng ta phải làm tốt hơn và điều này[br]sẽ tốn nhiều thời gian. 0:14:31.896,0:14:33.718 Nó giống như là thử thách mà 0:14:33.718,0:14:36.125 người nguyên thủy gặp phải với lửa 0:14:36.125,0:14:38.010 Đây là một công cụ, [br]nhưng là một công cụ mà 0:14:38.010,0:14:41.569 nếu chúng ta không cẩn thận,[br]sẽ thiêu cháy chúng ta. 0:14:44.008,0:14:47.128 Dữ liệu lớn sẽ thay đổi [br]cách sống của chúng ta 0:14:47.128,0:14:49.929 cách chúng ta làm việc và [br]cách chúng ta suy nghĩ. 0:14:49.929,0:14:51.818 Nó sẽ giúp chúng ta quản lý[br]sự nghiệp của chúng ta 0:14:51.818,0:14:55.452 và dẫn đến cuộc sống của[br]sự hài lòng và hy vọng 0:14:55.452,0:14:58.444 và hạnh phúc và sức khỏe. 0:14:58.444,0:15:01.750 Nhưng ở trong quá khứ, chúng ta [br]thường nhìn vào công nghệ thông tin 0:15:01.750,0:15:03.958 và con mắt chúng ta chỉ nhìn thấy [br]những thứ như, 0:15:03.958,0:15:05.644 công nghệ, phần mềm, 0:15:05.644,0:15:07.906 những thứ vật chất. 0:15:07.906,0:15:10.830 Chúng ta phải đúc kết lại [br]cái nhìn của chúng ta, 0:15:10.830,0:15:12.210 nhìn vào thông tin, 0:15:12.210,0:15:13.583 dù nó ít rõ ràng hơn 0:15:13.583,0:15:17.692 nhưng trong một số khía cạnh[br]quan trọng hơn rất nhiều. 0:15:17.692,0:15:21.157 Nhân loại cuối cùng cũng có thể[br]học hỏi từ những thông tin 0:15:21.157,0:15:23.575 mà nó có thể thu thập, 0:15:23.575,0:15:25.690 như một phần của cuộc thám hiểm[br]vô tận của chúng ta 0:15:25.690,0:15:28.849 để hiểu về thế giới và vị trí của chúng ta[br]trong thế giới, 0:15:28.849,0:15:34.480 và đó là lý do tại sao dữ liệu lớn[br]là một vấn đề quan trọng. 0:15:34.480,0:15:38.048 (vỗ tay)