WEBVTT 00:00:00.927 --> 00:00:04.632 شیرینی پایِ مورد علاقۀ آمریکایی ها چیه؟ NOTE Paragraph 00:00:04.762 --> 00:00:08.138 حضار: سیبه. کنث کوکی اِر: البته که سیبه! 00:00:08.138 --> 00:00:09.609 از کجا می دونیم؟ 00:00:09.609 --> 00:00:12.122 به خاطر داده ها. 00:00:12.712 --> 00:00:14.518 از مشاهدۀ فروش فروشگاه ها. 00:00:14.518 --> 00:00:18.364 از مشاهدۀ فروش پای های ۳۰ سانتی متریِ منجمد در فروشگاه ها 00:00:18.364 --> 00:00:20.919 و بدون هیچ مسابقه ای، سیب برنده س. 00:00:20.919 --> 00:00:23.659 اکثریت فروش متعلق به سیبه. 00:00:27.049 --> 00:00:30.443 فروشگاه ها شروع کردن به فروش پای کوچک تر، 00:00:30.443 --> 00:00:31.856 پای ۱۱ سانتی متری، 00:00:31.856 --> 00:00:36.030 و ناگهان سیب به مکان چهارم یا پنجم تنزل کرد. 00:00:36.030 --> 00:00:38.905 چرا؟ چه اتفاقی افتاد؟ 00:00:38.905 --> 00:00:41.723 بهش فکر کنید. 00:00:41.723 --> 00:00:45.571 وقتی شما پای ۳۰ سانتی متری می خرید، 00:00:45.571 --> 00:00:47.832 همه ی خانواده باید موافق باشند، 00:00:47.832 --> 00:00:51.623 و سیب، انتخابِ دوم همه ست. 00:00:51.623 --> 00:00:53.558 (خنده ی حضار) 00:00:53.558 --> 00:00:57.173 اما وقتی پای یک نفره ی ۱۱ سانتی متری می خرید، 00:00:57.173 --> 00:01:00.918 می تونید اونی رو که دوست دارید بخرید. 00:01:00.918 --> 00:01:04.933 می تونید انتخاب اول تون رو بخرید. 00:01:04.933 --> 00:01:06.964 داده های بیشتری دارید. 00:01:06.964 --> 00:01:08.348 می تونید چیزی رو ببینید 00:01:08.348 --> 00:01:10.940 که وقتی مقدار کم تری از اون رو داشتید 00:01:10.940 --> 00:01:12.133 نمی دیدید. NOTE Paragraph 00:01:13.213 --> 00:01:15.688 نکته اینجاست که داده های بیشتر 00:01:15.688 --> 00:01:17.971 فقط دیدِ وسیع تر نمی دن، 00:01:17.971 --> 00:01:19.975 داده های بیشترِ آنچه بهش نگاه می کردیم؛ 00:01:19.975 --> 00:01:23.438 داده های بیشتر به ما اجازه می دهند تازه ها رو ببینیم. 00:01:23.438 --> 00:01:26.532 اجازه می دهند بهتر ببینیم. 00:01:26.532 --> 00:01:29.978 اجازه می دهند متفاوت ببینیم. 00:01:30.188 --> 00:01:33.361 در این مورد به ما اجازه می دهند 00:01:33.361 --> 00:01:36.274 پای مورد علاقه ی آمریکایی ها رو ببینیم: 00:01:36.274 --> 00:01:38.816 که سیب نیست! NOTE Paragraph 00:01:38.816 --> 00:01:42.430 احتمالاً همۀ شما واژۀ دادۀ بزرگ رو شنیدید. 00:01:42.430 --> 00:01:44.937 در واقع حالتون از شنیدن این واژه 00:01:44.937 --> 00:01:46.117 به هم می خوره. 00:01:46.117 --> 00:01:49.447 واقعیته که اعتیاد زیادی به این واژه وجود داره، 00:01:49.447 --> 00:01:51.779 و این خیلی ناراحت کننده ست، 00:01:51.779 --> 00:01:54.825 چون دادۀ بزرگ، ابزار بسیار مهمیه 00:01:54.825 --> 00:01:58.219 برای پیشرفت جامعه. 00:01:58.669 --> 00:02:02.120 در گذشته، ما به داده های کوچک نگاه می کردیم 00:02:02.120 --> 00:02:03.824 و فکر می کردیم چطور می شه 00:02:03.824 --> 00:02:05.320 دنیا رو درک کرد، 00:02:05.320 --> 00:02:07.311 و حالا ما کلی از اون داریم، 00:02:07.311 --> 00:02:10.033 خیلی بیشتر از آنچه در گذشته داشتیم. 00:02:10.613 --> 00:02:12.520 چیزی که متوجه می شیم اینه که 00:02:12.520 --> 00:02:15.334 وقتی مقدار زیادی داده داریم، اساساً قادر به انجام کارهایی هستیم 00:02:15.334 --> 00:02:17.910 که با داشتن داده های کم نمی تونستیم. 00:02:17.910 --> 00:02:20.551 دادۀ بزرگ مهمه، و دادۀ بزرگ جدیده، 00:02:20.551 --> 00:02:22.328 و وقتی بهش فکر می کنید، 00:02:22.328 --> 00:02:24.544 تنها راهِ رویارویی این سیاره 00:02:24.544 --> 00:02:26.333 با چالش های جهانیش، 00:02:26.333 --> 00:02:29.870 تغذیۀ مردم، تامین بهداشت شون، 00:02:29.870 --> 00:02:32.680 تامین انرژی، الکتریسیته، 00:02:32.680 --> 00:02:34.469 اطمینان از جزغاله نشدن شون 00:02:34.469 --> 00:02:35.917 به خاطر گرم شدن کرۀ زمین؛ 00:02:35.917 --> 00:02:39.902 به دلیل استفادۀ موثر از داده هاست. NOTE Paragraph 00:02:39.902 --> 00:02:43.772 خُب نکتۀ جدید در مورد دادۀ بزرگ چیه؟ نکتۀ قابل توجه؟ 00:02:44.402 --> 00:02:46.719 خُب... برای پاسخ به این سوال به این فکر کنید که 00:02:46.719 --> 00:02:48.615 اطلاعات چه شکلی بوده، 00:02:48.615 --> 00:02:51.069 در گذشته و به صورت فیزیکی. 00:02:52.379 --> 00:02:55.070 در سال ۱۹۰۸، بر روی جزیرۀ کِرِت، 00:02:55.070 --> 00:02:59.565 باستان شناسان لوحی رُسی کشف کردند. 00:02:59.825 --> 00:03:04.104 عمر آن را ۲۰۰۰ سال قبل از میلاد تخمین زدند، یعنی ۴۰۰۰ سال. 00:03:04.104 --> 00:03:05.628 نوشته هایی روی این لوح هست، 00:03:05.628 --> 00:03:06.955 اما اِشرافی به معانیش نداریم. 00:03:06.955 --> 00:03:09.053 کاملاً یک رازه. اما نکته اینه که 00:03:09.053 --> 00:03:10.981 اطلاعات به این شکل بودند 00:03:10.981 --> 00:03:13.070 ۴۰۰۰ سال پیش. 00:03:13.070 --> 00:03:15.618 جامعه اطلاعات رو به این شکل 00:03:15.618 --> 00:03:18.442 نگهداری و منتقل می کرد. NOTE Paragraph 00:03:19.292 --> 00:03:23.302 امروز، جامعه آنقدرها پیشرفت نکرده. 00:03:23.672 --> 00:03:26.776 ما هنوز اطلاعات رو در لوح ها ذخیره می کنیم. 00:03:26.776 --> 00:03:29.960 اما امروز ما می تونیم بیشتر اطلاعات ذخیره کنیم، 00:03:29.960 --> 00:03:31.220 بیشتر از گذشته. 00:03:31.220 --> 00:03:34.313 جستجوش راحت تر شده، و کپی کردنش... 00:03:34.313 --> 00:03:37.813 پردازش و به اشتراک گذاشتنش. 00:03:37.813 --> 00:03:40.739 ما می تونیم دوباره از این اطلاعات استفاده کنیم 00:03:40.739 --> 00:03:43.503 برای مصارفی که وقتی مشغول جمع آوری داده ها بودیم 00:03:43.503 --> 00:03:45.608 حتا تصورش رو هم نمی کردیم. 00:03:45.608 --> 00:03:47.860 به همین منوال، داده تغییر کرد 00:03:48.060 --> 00:03:51.312 از سکون به جریان، 00:03:51.392 --> 00:03:55.330 از چیزی راکد و بی حرکت، 00:03:55.540 --> 00:03:58.839 به چیزی سیال و متحرک. 00:03:58.939 --> 00:04:02.962 اگر بخواهید، متوجه سیالیت اطلاعات می شید. 00:04:03.502 --> 00:04:06.436 لوح مکشوفه از کِرِت 00:04:06.436 --> 00:04:10.200 چهار هزار ساله ست، و سنگین، 00:04:10.200 --> 00:04:12.162 ظرفیت زیادی نداره، 00:04:12.162 --> 00:04:15.018 و این اطلاعات متغییر نیست. 00:04:15.278 --> 00:04:19.289 از سوی دیگر، کل فایل هایی که 00:04:19.289 --> 00:04:21.150 اِدوارد اِسنودِن 00:04:21.150 --> 00:04:23.771 از آژانس امنیت ملی آمریکا به سرقت برد 00:04:23.771 --> 00:04:25.970 روی یک حافظۀ فلش 00:04:26.420 --> 00:04:29.200 به اندازۀ ناخن بود. 00:04:29.200 --> 00:04:33.325 و به سرعت نور تکثیر می شه. 00:04:34.605 --> 00:04:38.050 داده های بیشتر... بیشتر. NOTE Paragraph 00:04:39.200 --> 00:04:41.174 یکی از دلایل وجود خیل اطلاعات امروز 00:04:41.174 --> 00:04:42.606 جمع آوری چیزهایی ست 00:04:42.606 --> 00:04:45.886 که ما همیشه اطلاعات را روی آنها جمع می کردیم؛ 00:04:46.096 --> 00:04:48.542 دلیل دیگر این که ما چیزهایی جمع آوری می کنیم 00:04:48.542 --> 00:04:51.354 که همیشه جنبۀ اطلاعاتی داشته اند 00:04:51.354 --> 00:04:53.840 اما هرگز به قالب داده تبدیل نشده اند 00:04:53.840 --> 00:04:56.259 و ما آنها را به داده تبدیل می کنیم. 00:04:56.259 --> 00:04:59.567 برای مثال به موقعیت چغرافیایی فکر کنید. 00:04:59.567 --> 00:05:01.816 مثلاً مارتین لوثِر. 00:05:01.816 --> 00:05:03.413 اگر بخواهیم بدونیم سال ۱۵۰۰ 00:05:03.413 --> 00:05:06.080 مارتین لوثر کجا بوده، 00:05:06.080 --> 00:05:08.172 باید همیشه دنبالش می کردیم، 00:05:08.172 --> 00:05:10.309 شاید با یک قلم پر و یک دوات، 00:05:10.309 --> 00:05:11.985 تا ثبتش کنیم. 00:05:11.985 --> 00:05:14.168 اما فکر کنید امروز چگونه است. 00:05:14.168 --> 00:05:16.010 می دونید در جایی، 00:05:16.010 --> 00:05:18.736 احتمالاً در پایگاه دادۀ یک شرکت مخابراتی، 00:05:18.736 --> 00:05:21.772 صفحه گسترده یا حداقل پایگاه داده ای وجود دارد 00:05:21.772 --> 00:05:23.860 که اطلاعات را ذخیره می کند 00:05:23.860 --> 00:05:25.923 همۀ مکان هایی که آنجا بوده اید. 00:05:25.923 --> 00:05:27.283 اگر تلفن همراه داشته باشید، 00:05:27.283 --> 00:05:30.130 و تلفن شما جی.پی.اس داشته باشد، یا حتا نداشته باشد، 00:05:30.130 --> 00:05:32.515 اطلاعات شما را ذخیره می کند. 00:05:32.515 --> 00:05:36.599 به این ترتیب، موقعیت جغرافیایی به داده بدل می شه. NOTE Paragraph 00:05:36.599 --> 00:05:41.200 حالا برای مثال به موردِ حالت بدن فکر کنید. 00:05:41.200 --> 00:05:42.485 جوری که الان نشسته اید. 00:05:42.485 --> 00:05:44.515 جوری که شما نشستید، 00:05:44.515 --> 00:05:47.286 جوری که شما نشستید، جوری که شما نشستید، 00:05:47.286 --> 00:05:49.363 کاملاً متفاوته، و مربوط به طول پاهاتون 00:05:49.363 --> 00:05:51.456 و پشت، و خطوط پشت، 00:05:51.456 --> 00:05:53.987 و اگه الان حسگر وصل بود، شاید ۱۰۰ تا 00:05:53.987 --> 00:05:55.753 به صندلی هاتون، 00:05:55.753 --> 00:05:59.353 می تونستم نموداری مختص شما ایجاد کنم. 00:05:59.353 --> 00:06:03.762 چیزی شبیه اثر انگشت! ولی اثر انگشت شما نیست. NOTE Paragraph 00:06:03.762 --> 00:06:06.731 خُب این کار چه فایده ای برامون داره؟ 00:06:06.731 --> 00:06:09.128 محققان در توکیو، از اون به عنوان 00:06:09.128 --> 00:06:13.516 یک دستگاه ضد سرقت خودرو استفاده می کنند. 00:06:13.516 --> 00:06:16.440 به این شکل که دزد پشت فرمون می شینه، 00:06:16.440 --> 00:06:18.544 سعی می کنه خودرو رو بدزده، و خودرو 00:06:18.544 --> 00:06:20.906 تشخیص می ده که راننده، ذیصلاح نیست. 00:06:20.906 --> 00:06:23.070 و ممکنه موتور خاموش شه، تا شما 00:06:23.070 --> 00:06:26.247 کلمۀ عبور رو جایی روی داشبورد وارد کنید 00:06:26.247 --> 00:06:30.905 و بگین: "هی! من مجوز رانندگی دارم". عالیه! NOTE Paragraph 00:06:30.905 --> 00:06:33.458 چی می شه اگر تمام خودروهای داخل اروپا 00:06:33.458 --> 00:06:34.915 از این فناوری برخوردار باشند؟ 00:06:34.915 --> 00:06:38.080 چه کاری می تونستیم انجام بدیم؟ 00:06:38.080 --> 00:06:40.320 اگر داده ها رو جمع کنیم، 00:06:40.320 --> 00:06:44.134 شاید بتونیم علامت های ثبت شده رو ببینیم 00:06:44.134 --> 00:06:46.843 بهترین راه تشخیص این که 00:06:46.843 --> 00:06:52.736 در ۵ ثانیۀ آینده، یک تصادف اتفاق می افته. 00:06:53.056 --> 00:06:55.293 و نکتۀ بعدی که ازش بهره می گیریم، 00:06:55.293 --> 00:06:57.076 خستگیِ راننده است، 00:06:57.246 --> 00:06:59.810 خدمات به این شکل ارائه می شه که مثلاً 00:06:59.810 --> 00:07:02.917 وقتی ماشین متوجه این حالت راننده می شه، 00:07:03.397 --> 00:07:06.841 آلارم داخلی رو به صورت خودکار فعال می کنه 00:07:06.841 --> 00:07:09.386 که مثلاً فرمون رو می لرزونه، یا یه بوق می زنه 00:07:09.386 --> 00:07:10.857 که بگه: "هی! بیدار شو، 00:07:10.857 --> 00:07:12.491 بیشتر به جاده توجه کن" 00:07:12.891 --> 00:07:14.914 این ها مصداق هایی از توانایی هامون هستند، 00:07:14.914 --> 00:07:17.165 وقتی جنبه های بیشتری از زندگی رو به داده بدل می کنیم. NOTE Paragraph 00:07:17.915 --> 00:07:20.670 حالا ارزش دادۀ بزرگ چیه؟ 00:07:21.110 --> 00:07:23.030 خب... بهش فکر کنید. 00:07:23.030 --> 00:07:25.442 اطلاعات بیشتری دارید. 00:07:25.442 --> 00:07:28.783 می تونید کارهایی انجام بدبد که قبلاً نمی تونستید. 00:07:28.783 --> 00:07:30.459 یکی از تاثیرگذارترین جاهایی که 00:07:30.459 --> 00:07:32.188 این مفهوم کاربردیه 00:07:32.188 --> 00:07:35.495 زمینۀ یادگیریه ماشینه. 00:07:35.495 --> 00:07:38.572 یادگیریه ماشین، شاخه ای از هوش مصنوعی ست، 00:07:38.572 --> 00:07:41.950 که خود شاخه ای از علوم رایانه ست. 00:07:41.950 --> 00:07:43.493 ایدۀ کلی به این شکله که 00:07:43.493 --> 00:07:45.610 به جای آموزش رایانه برای کاری، 00:07:45.610 --> 00:07:48.230 ما خیلی ساده، داده ها رو کنار مشکل میگذاریم 00:07:48.230 --> 00:07:51.436 و به رایانه می گیم، خودت حلش کن. 00:07:51.436 --> 00:07:53.213 دانستن منشا این مسئله، 00:07:53.213 --> 00:07:55.915 به درکش کمک می کنه. 00:07:56.765 --> 00:07:59.153 در سال ۱۹۵۰، یک دانشمند رایانه در آی.بی.ام 00:07:59.153 --> 00:08:02.745 به نام آرتور ساموئل به چکِرز علاقه داشت 00:08:02.745 --> 00:08:04.147 و برنامه ای برایش نوشت 00:08:04.147 --> 00:08:06.960 تا بتونه مقابل رایانه بازی کنه. 00:08:06.960 --> 00:08:09.671 او بازی کرد. و او برد. 00:08:09.671 --> 00:08:11.774 بازی کرد. برد. 00:08:11.774 --> 00:08:14.789 بازی کرد. برد. 00:08:14.789 --> 00:08:16.567 چون رایانه، تنها حرکت های 00:08:16.567 --> 00:08:18.794 قانونی رو می دونست. 00:08:18.794 --> 00:08:20.881 آرتور ساموئل چیز دیگه می دونست. 00:08:20.881 --> 00:08:25.510 آرتور ساموئل استراتژی می دونست. 00:08:25.510 --> 00:08:27.906 پس یه برنامۀ تکمیلی در کنارش نوشت 00:08:27.906 --> 00:08:29.880 که پشت زمینه کار کنه، 00:08:29.880 --> 00:08:31.697 و این احتمال رو بسنجه 00:08:31.697 --> 00:08:34.260 که بعد از هر حرکت 00:08:34.260 --> 00:08:37.170 ترکیب مهره های صفحه، به سمت برد می ره 00:08:37.170 --> 00:08:39.678 یا باخت. 00:08:39.678 --> 00:08:42.828 او با رایانه بازی می کنه. و می بره. 00:08:42.828 --> 00:08:45.336 بازی می کنه. و می بره. 00:08:45.336 --> 00:08:49.067 بازی می کنه. و می بره. 00:08:49.067 --> 00:08:51.344 و سپس آرتور ساموئل رایانه رو تنها می گذاره 00:08:51.344 --> 00:08:53.571 تا با خودش بازی کنه. 00:08:53.571 --> 00:08:57.080 بازی می کنه. و دادۀ بیشتر جمع می کنه. 00:08:57.080 --> 00:09:01.389 دادۀ بیشتر جمع می کنه. و دقت پیش بینی رو بالا می بره. 00:09:01.389 --> 00:09:03.493 بعد آرتور ساموئل برمی گرده به رایانه 00:09:03.493 --> 00:09:05.811 و بازی می کنه، می بازه. 00:09:05.811 --> 00:09:07.880 و بازی می کنه، و می بازه، 00:09:07.880 --> 00:09:09.927 و بازی می کنه، و می بازه، 00:09:09.927 --> 00:09:12.526 و آرتور ساموئل ماشینی ابداع می کنه 00:09:12.526 --> 00:09:18.814 که از اون در توانایی ای که یادش داده بود، سبقت می گیره. NOTE Paragraph 00:09:18.814 --> 00:09:21.312 و این ایدۀ یادگیری ماشین 00:09:21.312 --> 00:09:25.239 به همه جا می ره. 00:09:25.239 --> 00:09:28.388 فکر می کنید ماشین های بدون راننده از کجا اومدن؟ 00:09:28.388 --> 00:09:30.525 آیا ما جامعه ای هستیم که 00:09:30.525 --> 00:09:33.810 تمام قوانین جاده رو به نرم افزار بدیم؟ 00:09:33.810 --> 00:09:36.408 نه! حافظه ارزون تره، نه! 00:09:36.408 --> 00:09:40.402 الگوریتم ها سریع ترند، نه! پردازنده ها بهترند، نه! 00:09:40.402 --> 00:09:43.174 همۀ اینها مهم اند، اما پاسخ ما نیستند. 00:09:43.174 --> 00:09:46.315 پاسخ اینه که ما ماهیت مسئله رو تغییر دادیم. 00:09:46.315 --> 00:09:47.845 ماهیت مسئله رو از این که سعی کنیم 00:09:47.845 --> 00:09:50.090 آشکارا و به جزء به رایانه بگیم 00:09:50.090 --> 00:09:52.671 که چطور رانندگی کنه، 00:09:52.671 --> 00:09:53.987 به این شکل تغییر دادیم: 00:09:53.987 --> 00:09:55.863 این مقدار اطلاعات در مورد خودرو هست. 00:09:55.863 --> 00:09:57.396 خودت حلش کن. 00:09:57.396 --> 00:09:59.263 خودت بفهم که این چراغ راهنماییه، 00:09:59.263 --> 00:10:01.344 که چراغ راهنما قرمزه و نه سبز، 00:10:01.344 --> 00:10:03.358 که این یعنی باید بایستی 00:10:03.358 --> 00:10:06.441 و جلو نری. NOTE Paragraph 00:10:06.441 --> 00:10:07.959 یادگیری ماشین، پایۀ 00:10:07.959 --> 00:10:09.950 بسیاری از کارهای آنلاین ماست. 00:10:09.950 --> 00:10:11.807 موتورهای جستجو، 00:10:11.807 --> 00:10:15.608 الگوریتم شخصی سازی آمازون، 00:10:15.608 --> 00:10:17.820 مترجم رایانه ای، 00:10:17.820 --> 00:10:22.110 سیستم های تشخیص صدا. 00:10:22.110 --> 00:10:23.785 محققین اخیرن 00:10:23.785 --> 00:10:28.140 به مسئلۀ بافت برداری پرداختند، 00:10:28.140 --> 00:10:30.907 بافت های سرطانی. 00:10:30.907 --> 00:10:33.222 آنها از رایانه خواستند 00:10:33.222 --> 00:10:35.693 که با مشاهدۀ داده ها و میزان نجات 00:10:35.693 --> 00:10:40.360 بررسی کند که آیا در واقع 00:10:40.360 --> 00:10:42.904 سلول ها سرطانی اند یا نه، 00:10:42.904 --> 00:10:44.682 و مطمئناً، با افزودن داده به آن، 00:10:44.682 --> 00:10:46.729 به الگوریتم یادگیریِ ماشین، 00:10:46.729 --> 00:10:48.606 ماشین قادر بود به شناساییِ 00:10:48.606 --> 00:10:50.868 ۱۲ تا از بهترین نشانه های پیش بینی 00:10:50.868 --> 00:10:54.167 که نمونۀ سلول های سرطان پستان 00:10:54.167 --> 00:10:57.385 واقعاً سرطانی اند. 00:10:57.385 --> 00:11:00.703 مسئله: دایرۀ المعارف پزشکی 00:11:00.703 --> 00:11:02.672 تنها ۹ تای آنان را می شناخت. 00:11:02.672 --> 00:11:04.472 سه تا از ویژگی ها، آنهایی بودند که 00:11:04.472 --> 00:11:07.447 مردم نیازی به پیدا کردن آنها نداشتند، 00:11:07.447 --> 00:11:12.978 اما ماشین آنها را پیدا کرد. NOTE Paragraph 00:11:14.208 --> 00:11:18.903 ابعاد تاریکی هم برای دادۀ بزرگ وجود دارد. 00:11:18.903 --> 00:11:21.637 زندگی مان را بهبود می بخشد اما مشکلاتی هم هست، 00:11:21.637 --> 00:11:23.617 که باید به آنها آگاه باشیم. 00:11:23.617 --> 00:11:26.240 اولی، ایده ایست که 00:11:26.240 --> 00:11:28.926 شاید برای این پیش بینی ها مجازات شویم! 00:11:28.926 --> 00:11:32.796 مثلن پلیس برای مقاصدش از آن استفاده کند. 00:11:32.796 --> 00:11:35.147 کمی شبیه فیلم "گزارش اقلیت". 00:11:35.147 --> 00:11:37.588 امروزه واژۀ پیش بینیِ پلیسی هست، 00:11:37.588 --> 00:11:39.951 یا جرم شناسی الگوریتمی 00:11:39.951 --> 00:11:41.987 که اگر داده های زیادی داشته باشیم، 00:11:41.987 --> 00:11:44.146 مثلاً محل وقوع جرم های پیشین، 00:11:44.146 --> 00:11:46.689 می دانیم گشت ها را به کجا اعزام کنیم. 00:11:46.689 --> 00:11:48.804 به نظر منطقی می آد، اما مشکل اینه که 00:11:48.804 --> 00:11:53.348 مسئله به دادۀ موقعیت ختم نمی شه، 00:11:53.348 --> 00:11:56.307 و به مسائل فردی وارد خواهد شد. 00:11:56.307 --> 00:11:58.557 چرا از ریزنمرات فردی در دوران دبیرستان 00:11:58.557 --> 00:12:00.785 استفاده نکنیم؟ 00:12:00.785 --> 00:12:02.346 شاید باید از این حقایق استفاده کنیم که 00:12:02.346 --> 00:12:04.374 آیا بیکارند یا نه، اعتبار بانکی شان، 00:12:04.374 --> 00:12:05.926 رفتاروب گردی آنها 00:12:05.926 --> 00:12:07.804 آیا تا دیروقت بیدارند. 00:12:07.804 --> 00:12:10.965 دست بندشان، اگر قادر به تشخیص بیوشیمی باشد، 00:12:10.965 --> 00:12:15.201 تصورات تهاجمی شان را نشان خواهد داد. 00:12:15.201 --> 00:12:17.422 می شه الگوریتم هایی اشته باشیم که تقریباً 00:12:17.422 --> 00:12:19.055 کارهایمان را پیش بینی می کنند، 00:12:19.055 --> 00:12:20.299 و ممکنه قبل از ارتکاب جرم 00:12:20.299 --> 00:12:22.889 دستگیر شیم. 00:12:22.889 --> 00:12:25.431 حریم خصوصی، چالش اصلی 00:12:25.431 --> 00:12:27.501 در عصر دادۀ کوچک بود. 00:12:27.501 --> 00:12:29.650 در دورۀ دادۀ بزرگ، 00:12:29.650 --> 00:12:34.173 چالش، حفاظت از اختیار است، 00:12:34.173 --> 00:12:37.952 انتخاب اخلاقی، ارادۀ انسان 00:12:37.952 --> 00:12:41.020 وکالت انسان. NOTE Paragraph 00:12:42.540 --> 00:12:44.765 مشکل دیگری هم هست: 00:12:44.765 --> 00:12:48.321 دادۀ بزرگ ما را بیکار می کند. 00:12:48.321 --> 00:12:51.833 دادۀ بزرگ و الگوریتم ها به مصاف 00:12:51.833 --> 00:12:54.894 کارمندان و کار حرفه ای می روند 00:12:54.894 --> 00:12:56.547 در قرن ۲۱. 00:12:56.547 --> 00:12:58.981 به همان ترتیب که اتوماسیون کارخانه ها 00:12:58.981 --> 00:13:01.170 و خطوط تولید 00:13:01.170 --> 00:13:04.196 در قرن بیستم به مصاف کارگران رفتند. 00:13:04.196 --> 00:13:06.288 مثلاً تکنسین آزمایشگاه 00:13:06.288 --> 00:13:07.697 که زیر میکروسکوپ 00:13:07.697 --> 00:13:09.321 نمونۀ سرطانی می بیند 00:13:09.321 --> 00:13:11.958 و نتیجه می گیرد که آیا سرطانی ست یا نه. 00:13:11.958 --> 00:13:13.930 شخص به دانشگاه رفته. 00:13:13.930 --> 00:13:15.360 شخص املاک می خره. 00:13:15.360 --> 00:13:17.101 او رای می دهد. 00:13:17.101 --> 00:13:20.767 او در جامعه ذینفع است. 00:13:20.767 --> 00:13:22.161 و شغل اون شخص، 00:13:22.161 --> 00:13:23.770 مثل همۀ ناوگانِ 00:13:23.770 --> 00:13:25.739 حرفه ای ها مانند اون شخص، 00:13:25.739 --> 00:13:28.889 خواهند فهمید که شغلشان کاملاً تغییر کرده 00:13:28.889 --> 00:13:31.246 یا کاملاً از بین رفته. 00:13:31.246 --> 00:13:32.530 ما دوست داریم اینگونه فکر کنیم 00:13:32.530 --> 00:13:35.717 که فناوری بعد از مدتی ایجاد شغل می کنه 00:13:35.717 --> 00:13:39.182 بعد از مدت کوتاه یا موقت جابجایی، 00:13:39.182 --> 00:13:41.123 و این برای ارجاع به انقلاب صنعتی 00:13:41.123 --> 00:13:43.265 که با اون زندگی می کنیم، درسته 00:13:43.265 --> 00:13:45.593 چون دقیقاً همونیه که اتفاق افتاده. 00:13:45.593 --> 00:13:47.926 اما چیزی رو در اون آنالیز فراموش کردیم: 00:13:47.926 --> 00:13:49.756 دسته ای از مشاغل هستند که 00:13:49.756 --> 00:13:53.176 به راحتی از بین می رن و بر نمی گردند. 00:13:53.176 --> 00:13:55.180 انقلاب صنعتی خیلی خوب نبود، 00:13:55.180 --> 00:13:59.182 اگر شما اسب بودید. 00:13:59.182 --> 00:14:01.237 پس باید دقت کنیم 00:14:01.237 --> 00:14:04.751 و دادۀ بزرگ رو برای خواسته هامون به کار بگیریم، 00:14:04.751 --> 00:14:07.936 خواسته های انسانی مون. 00:14:07.936 --> 00:14:09.890 باید ارباب این فناوری باشیم، 00:14:09.890 --> 00:14:11.546 نه بنده اش. 00:14:11.546 --> 00:14:14.504 ما هنوز در ابتدای عصر دادۀ بزرگ هستیم، 00:14:14.504 --> 00:14:17.654 و صادقانه، خیلی خوب نیستیم 00:14:17.654 --> 00:14:21.861 در ادارۀ داده هایی که امروز می تونیم جمع کنیم. 00:14:21.861 --> 00:14:25.191 این فقط مشکلی برای آزانس امنیت ملی نیست. 00:14:25.191 --> 00:14:28.229 شرکت ها داده های زیادی جمع می کنند از آنها استفادۀ نادرست هم می کنند، 00:14:28.229 --> 00:14:31.896 باید این قسمت رو بهبود بدیم، و این زمان بره. 00:14:31.896 --> 00:14:33.718 کمی مشابه چالشی که انسان اولیه 00:14:33.718 --> 00:14:36.125 با آتش داشت. 00:14:36.125 --> 00:14:38.010 این یک ابزار است. اما ابزاری که 00:14:38.010 --> 00:14:41.569 بر اثر استفادۀ نادرست، ما را به آتش می کشد. NOTE Paragraph 00:14:44.008 --> 00:14:47.128 دادۀ بزرگ، روند زندگی ما را متحول خواهد کرد، 00:14:47.128 --> 00:14:49.929 روند کارمان را و روند تفکرمان را. 00:14:49.929 --> 00:14:51.818 به ما کمک می کند در مدیریت سوابق مان 00:14:51.818 --> 00:14:55.452 در هدایت زندگیِ راضی کننده و امیدبخش 00:14:55.452 --> 00:14:58.444 در خوشحالی و در سلامت 00:14:58.444 --> 00:15:01.750 اما در گذشته، اغلب به فناوری اطلاعات نگاه می کردیم 00:15:01.750 --> 00:15:03.958 و چشم هایمان فقط "ف" را دیده اند 00:15:03.958 --> 00:15:05.644 فناوری... سخت افزار... 00:15:05.644 --> 00:15:07.906 چون آنها فیزیکی بودند. 00:15:07.906 --> 00:15:10.830 اکنون باید به "ا" بنگریم، 00:15:10.830 --> 00:15:12.210 اطلاعات... 00:15:12.210 --> 00:15:13.583 که کمتر اشکار است. 00:15:13.583 --> 00:15:17.692 اما در برخی جهات بسیار مهم تر. 00:15:17.692 --> 00:15:21.157 بشریت سرانجام از اطلاعات خواهد آموخت 00:15:21.157 --> 00:15:23.575 اطلاعاتی که جمع می کند، 00:15:23.575 --> 00:15:25.690 در راستای تلاش بی پایان مان 00:15:25.690 --> 00:15:28.849 برای فهمیدن جهان و جایگاهمان در آن، 00:15:28.849 --> 00:15:34.480 و به این دلیله که دادۀ بزرگ مهمه. NOTE Paragraph 00:15:34.480 --> 00:15:38.048 (تشویق حضار)