Більші дані - кращі дані
-
0:01 - 0:05Улюблений пиріг американців?
-
0:05 - 0:08Аудиторія: Яблучний.
Кеннет Кук'єр: Яблучний. Звісно ж. -
0:08 - 0:09Звідки нам про це відомо?
-
0:09 - 0:12Завдяки даним.
-
0:12 - 0:14Дивимось на розпродаж в супермаркеті.
-
0:14 - 0:17На торгівлю 30-сантиметровими замороженими
-
0:17 - 0:21пирогами, і яблучний, без сумніву, виграє.
-
0:21 - 0:26Більшість продаж - пироги з яблуками.
-
0:26 - 0:29Проте згодом супермаркети почали продавати
-
0:29 - 0:32менші, 11-сантиметрові пироги,
-
0:32 - 0:36і раптово рейтинг яблучних знизився до
четвертого чи п'ятого місця. -
0:36 - 0:39Чому? Що трапилось?
-
0:39 - 0:42Гаразд, поміркуйте про це.
-
0:42 - 0:46Коли ви купуєте 30-сантиметровий пиріг,
-
0:46 - 0:48уся сім'я змушена погодитись,
-
0:48 - 0:52і пиріг з яблуками виявляється улюбленим
кожного другого. -
0:52 - 0:54(Сміх)
-
0:54 - 0:57Проте якщо ви купуєте 11-сантиметровий
пиріг, -
0:57 - 1:01ви можете придбати той, який бажаєте.
-
1:01 - 1:05Ви можете повернутись до першого вибору.
-
1:05 - 1:07У вас більше інформації.
-
1:07 - 1:08Ви можете помітити щось,
-
1:08 - 1:09що не помічали тоді,
-
1:09 - 1:13коли у вас були лише окремі факти.
-
1:13 - 1:16І ось, ключовим моментом є те, що
додаткові дані -
1:16 - 1:18не тільки дають можливість бачити
-
1:18 - 1:20інші аспекти аналізованого об'єкта.
-
1:20 - 1:23Більше даних дозволяють бачити нове.
-
1:23 - 1:27Бачити краще.
-
1:27 - 1:30Бачити інакше.
-
1:30 - 1:33У цьому випадку, дані дозволяють побачити
-
1:33 - 1:36який же з пирогів є улюбленим серед
американців: -
1:36 - 1:39не з яблуками.
-
1:39 - 1:42Так от, ви всі, напевне, чули визначення
"великі дані". -
1:42 - 1:44Власне, ви, мабуть, втомилися чути про
-
1:44 - 1:46великий об'єм даних.
-
1:46 - 1:49Термін є дійсно дуже розрекламованим,
-
1:49 - 1:52і це дуже сумно,
-
1:52 - 1:55тому що велика кількість даних є важливим
інструментом, -
1:55 - 1:59за допомогою якого суспільство
розвиватиметься. -
1:59 - 2:02В минулому ми брали до уваги невеликі
об'єми інформації -
2:02 - 2:04і думали, що б вони могли означати
-
2:04 - 2:05для спроби розуміння світу,
-
2:05 - 2:07а тепер у нас набагато більше даних -
-
2:07 - 2:10більше, ніж могло б коли-небудь бути.
-
2:10 - 2:12Отож, коли ми маємо
-
2:12 - 2:15велику масу даних, ми маємо можливість
робити те, -
2:15 - 2:18чого не могли, коли даних було значно
менше. -
2:18 - 2:21Великі дані важливі, великі дані
інноваційні, -
2:21 - 2:22і якщо задуматись,
-
2:22 - 2:25для нашої планети єдиним шляхом подолати
-
2:25 - 2:26виклики світового значення є
-
2:26 - 2:30нагодувати людей, забезпечити їх медичною
допомогою, -
2:30 - 2:33енергією, електрикою,
-
2:33 - 2:34впевнитись, що вони не згоріли дотла
-
2:34 - 2:36через глобальне
потепління -
2:36 - 2:40за допомогою ефективного використання
інформації. -
2:40 - 2:44Що ж нового у великих даних?
В чому ж суть? -
2:44 - 2:46Щоб дати відповідь на запитання,
подумаймо -
2:46 - 2:48про те, який вигляд мала інформація,
-
2:48 - 2:51як вона фізично виглядала в минулому.
-
2:51 - 2:55У 1908 на острові Крит
-
2:55 - 3:00археологи знайшли глиняний диск.
-
3:00 - 3:04Він датувався 2000 роком до н.е., отже
йому приблизно 4000 років. -
3:04 - 3:06На диску є надписи,
-
3:06 - 3:07але їхнє значення невідоме.
-
3:07 - 3:09Повна таємниця, але суть в тому, що
-
3:09 - 3:11таким чином інформація виглядала
-
3:11 - 3:134000 років тому.
-
3:13 - 3:16Отак суспільство накопичувало
-
3:16 - 3:19і передавало дані.
-
3:19 - 3:23Відтоді суспільство не дуже розвинулось.
-
3:23 - 3:27Ми все ще накопичуємо
інформацію на дисках, -
3:27 - 3:30проте сьогодні можна зберігати набагато
більше даних -
3:30 - 3:31ніж коли-небудь раніше.
-
3:31 - 3:34Пошук даних спростився. Спростилося й
копіювання. -
3:34 - 3:38А також обмін та обробка.
-
3:38 - 3:41І ми можемо повторно використовувати
інформацію -
3:41 - 3:42для цілей, яких не могли навіть уявити
-
3:42 - 3:46під час первинного збору даних.
-
3:46 - 3:48В цьому плані дані пройшли шлях
-
3:48 - 3:51від запасів до потоку,
-
3:51 - 3:55від стаціонарного і статичного
-
3:55 - 3:59до чогось швидкоплинного і
динамічного. -
3:59 - 4:03Плинність інформації, якщо
бажаєте. -
4:03 - 4:06Диск, знайдений на Криті
-
4:06 - 4:10і якому 4000 років, досить важкий,
-
4:10 - 4:12не зберігає багато інформації,
-
4:12 - 4:15і ця інформація незмінна.
-
4:15 - 4:19Для порівняння, усі файли,
-
4:19 - 4:21взяті Едвардом Сноуденом
-
4:21 - 4:24з Агентства національної безпеки США,
-
4:24 - 4:26вміщуються на карті пам'яті,
-
4:26 - 4:29завбільшки з ніготь,
-
4:29 - 4:34і її можна поширити зі швидкістю світла.
-
4:34 - 4:39Більше даних. Більше.
-
4:39 - 4:41Однією з причин, чому нині
ми маємо стільки -
4:41 - 4:43даних є те, що ми збираємо пристрої,
-
4:43 - 4:46на яких досі збирали інформацію,
-
4:46 - 4:49а ще те, що ми
зберігаємо матеріали, -
4:49 - 4:51які завжди були інформаційними,
-
4:51 - 4:54але ніколи не трансформувалися у формат
даних, -
4:54 - 4:56а зараз ми це їх переводимо
в цифровий формат. -
4:56 - 5:00Тепер подумаймо, наприклад, про
місцезнаходження. -
5:00 - 5:02Візьмемо для прикладу Мартіна Лютера.
-
5:02 - 5:03Якщо б у 1500-ті ми захотіли
-
5:03 - 5:06дізнатись, де був Мартін Лютер,
-
5:06 - 5:08ми б мусили слідкувати за ним весь час,
-
5:08 - 5:10можливо, навіть з пером і чорнильницею,
-
5:10 - 5:12і занотовувати,
-
5:12 - 5:14проте подумаймо, як все це виглядає тепер.
-
5:14 - 5:16Вам відомо, що десь,
-
5:16 - 5:19мабуть, в базі даних постачальника
телекомунікацій -
5:19 - 5:22є таблиця чи, принаймні, запис
-
5:22 - 5:24з інформацією про те,
-
5:24 - 5:26де ви весь час бували.
-
5:26 - 5:27Якщо у вас є мобільний
телефон, -
5:27 - 5:30і в ньому є GPS, і навіть якщо GPS немає,
-
5:30 - 5:33він все одно може записувати інформацію
про вас. -
5:33 - 5:37В цьому відношенні місцезнаходження
задокументовано. -
5:37 - 5:41Тепер візьмемо до уваги, наприклад,
позу, -
5:41 - 5:42те, як ми зараз сидимо,
-
5:42 - 5:45те, як ви сидите,
-
5:45 - 5:47те, як сидите ви, чи ви.
-
5:47 - 5:49Всі сидять по-різному залежно від
-
5:49 - 5:51довжини ніг, спини і форми спини,
-
5:51 - 5:54а якщо б я зараз встановив сенсори, десь
100 сенсорів -
5:54 - 5:56у ваші сидіння,
-
5:56 - 5:59я б зміг вивести індивідуальний індекс для
кожного з вас, -
5:59 - 6:04щось на кшталт відбитка пальця, але це не
пальці. -
6:04 - 6:07Що ж можна з усім цим зробити?
-
6:07 - 6:09Дослідники з Токіо використовують це
-
6:09 - 6:14як потенційний протиугінний пристрій
в автомобілях. -
6:14 - 6:16Суть в тому, що водій сідає за кермо,
-
6:16 - 6:19намагається втекти, але машина розпізнає
-
6:19 - 6:21водія без належного доступу за кермом,
-
6:21 - 6:23і мабуть, двигун затихне, аж поки не
-
6:23 - 6:26ввести пароль на приборній панелі,
-
6:26 - 6:31щоб прозвучало, "Агов, у мене є доступ до
водіння". Чудово. -
6:31 - 6:33Що якщо б кожне авто Європи було
-
6:33 - 6:35обладнане цією технологією?
-
6:35 - 6:38Що б ми змогли зробити?
-
6:38 - 6:40Мабуть, якщо б зібрати усі дані,
-
6:40 - 6:44ми б могли розпізнати індикатори
приборної панелі, -
6:44 - 6:47які найкраще сповіщають про можливе
зіткнення -
6:47 - 6:53у наступні п'ять секунд.
-
6:53 - 6:55І тоді б була задокументована
-
6:55 - 6:57втома водія,
-
6:57 - 6:59а машина б розпізнавала,
-
6:59 - 7:03що водій безпосередньо провалюється в ту
позу, -
7:03 - 7:07автоматично визначала й посилала
внутрішній сигнал: -
7:07 - 7:09вібрація керма, салонний гудок,
-
7:09 - 7:11і сповіщала: "Агов, прокидайся,
-
7:11 - 7:12сконцентруйся на дорозі".
-
7:12 - 7:14Ось такого типу речі ми можемо робити,
-
7:14 - 7:17документуючи й інші аспекти
нашого життя. -
7:17 - 7:21В чому цінність великих даних?
-
7:21 - 7:23Що ж, подумайте про це.
-
7:23 - 7:25У вас більше інформації.
-
7:25 - 7:29Ви можете робити речі, які перед тим
робити не доводилось. -
7:29 - 7:30Однією з вражаючих сфер
-
7:30 - 7:31їхнього використання
-
7:31 - 7:32є машинне навчання.
-
7:32 - 7:35Машинне навчання є частиною штучного
інтелекту, -
7:35 - 7:39який, своєю чергою, належить до
інформатики. -
7:39 - 7:42Ідея в тому, що замість
-
7:42 - 7:43того, щоб задати певний алгоритм дій,
-
7:43 - 7:46ми просто спрямуємо дані на проблему
-
7:46 - 7:48і дамо можливість комп'ютеру розібратись
самому. -
7:48 - 7:51Зрозуміти це допоможе
-
7:51 - 7:53розгляд походження.
-
7:53 - 7:57У 1950-х вчений-інформатик
-
7:57 - 7:59компанії IBM Артур Семюел полюбляв грати
в шашки, -
7:59 - 8:03отож він створив програму,
-
8:03 - 8:04щоб грати проти комп'ютера.
-
8:04 - 8:07Він грав. Він перемагав.
-
8:07 - 8:10Грав. Перемагав.
-
8:10 - 8:12Грав. Перемагав,
-
8:12 - 8:15тому що комп'ютеру було відомо тільки
-
8:15 - 8:17правильні ходи.
-
8:17 - 8:19Артур Семюел знав дещо інше.
-
8:19 - 8:21Артур Семюел знав стратегію.
-
8:21 - 8:26Тому він написав невелику під-програму,
-
8:26 - 8:28яка працювала у фоновому режимі
-
8:28 - 8:30і вираховувала ймовірність
-
8:30 - 8:32того, що задана конфігурація призведе
-
8:32 - 8:34до перемоги, а не зазнає поразки
-
8:34 - 8:37після кожного ходу.
-
8:37 - 8:40Він грає проти комп'ютера. Він перемагає.
-
8:40 - 8:43Грає проти комп'ютера. Перемагає.
-
8:43 - 8:45Грає проти комп'ютера. Перемагає.
-
8:45 - 8:49А потім Артур Семюел залишає комп'ютер
-
8:49 - 8:51грати із самим собою.
-
8:51 - 8:54Він грає сам з собою. Збирає більше даних.
-
8:54 - 8:57Зберігає більше даних. Підвищує точність
передбачення. -
8:57 - 9:01І ось Артур Семюел повертається до
комп' ютера, -
9:01 - 9:03і грає, і програє,
-
9:03 - 9:06грає, і програє,
-
9:06 - 9:08грає, і програє,
-
9:08 - 9:10і от Артур Семюел створює пристрій,
-
9:10 - 9:13що випереджує його здатність виконувати
певні завдання. -
9:13 - 9:19Ця ідея машинного навчання
-
9:19 - 9:21поширюється усюди.
-
9:21 - 9:25Як, на вашу думку, з'явились самокеровані
авто? -
9:25 - 9:28Стали б ми розвиненішим суспільством,
довіряючи -
9:28 - 9:31правила дорожнього руху
комп'ютерам? -
9:31 - 9:34Ні. Пам'ять дешевша? Ні.
-
9:34 - 9:36Алгоритми швидші? Ні. Процесори кращі? Ні.
-
9:36 - 9:40Усі ці речі мають значення, але суть не в
тому. -
9:40 - 9:43Все тому, що ми змінили саму проблему.
-
9:43 - 9:46Ми змінили проблему з однієї,
-
9:46 - 9:48у якій намагалися чітко і ясно
-
9:48 - 9:50пояснити комп'ютеру як керувати,
-
9:50 - 9:53до такої, де кажемо:
-
9:53 - 9:54"Ось багато даних про авто.
-
9:54 - 9:56З'ясовуй.
-
9:56 - 9:57Зрозумій, що таке світлофор,
-
9:57 - 9:59що він червоний, а не зелений,
-
9:59 - 10:01що він означає зупинитись,
-
10:01 - 10:03а не рухатись далі".
-
10:03 - 10:06Машинне навчання є основою
-
10:06 - 10:08багатьох речей онлайн:
-
10:08 - 10:10пошукових систем,
-
10:10 - 10:12алгоритму персоналізації Amazon,
-
10:12 - 10:16комп'ютерного перекладу,
-
10:16 - 10:18систем голосового розпізнавання.
-
10:18 - 10:22Дослідники недавно зосередились на
-
10:22 - 10:25проблемі біопсії,
-
10:25 - 10:28біопсії ракових клітин,
-
10:28 - 10:31вони дали завдання комп'ютеру
ідентифікувати -
10:31 - 10:33за допомогою даних і процентів виживання,
-
10:33 - 10:36чи клітини дійсно
-
10:36 - 10:40уражені раком чи ні,
-
10:40 - 10:43і справді, коли ви спрямовуєте на це дані,
-
10:43 - 10:45через алгоритм машинного навчання,
-
10:45 - 10:47пристрій може ідентифікувати
-
10:47 - 10:4912 ознак, які найкраще визначають,
-
10:49 - 10:51що біоптат ракових клітин
-
10:51 - 10:54дійсно раковий.
-
10:54 - 10:57Проблема: медичній літературі
-
10:57 - 11:00відомо тільки 9 з них.
-
11:00 - 11:03Три з ознак раніше
-
11:03 - 11:04не були взагалі відомі,
-
11:04 - 11:07проте машина їх знайшла.
-
11:07 - 11:13Так от, у великих даних є й вади.
-
11:13 - 11:19Вони покращують наше життя, але існують
й проблеми, -
11:19 - 11:21про які ми мусимо знати,
-
11:21 - 11:24і найпершою є ідея того,
-
11:24 - 11:26що нас можуть покарати за передбачення,
-
11:26 - 11:29що поліція використовуватиме дані на
власний розсуд, -
11:29 - 11:33щось на кшталт "Особливої думки."
-
11:33 - 11:35Термін має назву прогностичної
-
11:35 - 11:38політики або алгоритмічної кримінології,
-
11:38 - 11:40і якщо ми візьмемо до уваги багато
відомостей, -
11:40 - 11:42наприклад, колишні місця злочинів,
-
11:42 - 11:44ми б знали, куди посилати патрулі.
-
11:44 - 11:47Логічно, але, звісно ж, проблема
-
11:47 - 11:49в тому, що все не зупиниться на даних
про локацію, -
11:49 - 11:53а пошириться й на приватний рівень.
-
11:53 - 11:56Чому б не використати інформацію
-
11:56 - 11:59про чийсь атестат?
-
11:59 - 12:01Можливо, нам згодяться факти про
-
12:01 - 12:02роботу, кредитний рейтинг,
-
12:02 - 12:04поведінку в глобальній мережі,
-
12:04 - 12:06чи хтось не спить допізна.
-
12:06 - 12:08Прилади, які вимірюють біологічні дані,
-
12:08 - 12:11покажуть наявність агресивних думок.
-
12:11 - 12:15Ми можемо виробити алгоритми, які зможуть
-
12:15 - 12:17передбачити наші дії, але є ймовірність
-
12:17 - 12:19притягнення до відповідальності
-
12:19 - 12:20ще перед самою спробою.
-
12:20 - 12:23Конфіденційність була основним викликом
-
12:23 - 12:25епохи невеликих даних.
-
12:25 - 12:28У періоді великого об'єму даних
-
12:28 - 12:30проблемою є безпека свободи волі,
-
12:30 - 12:34морального вибору, бажань,
-
12:34 - 12:38свободи дій.
-
12:38 - 12:41Існує й інша проблема:
-
12:43 - 12:45великі дані скоротять робочі місця.
-
12:45 - 12:48Вони разом з алгоритмами поставлять
під сумнів роботу -
12:48 - 12:52"білих комірців", професійні знання
-
12:52 - 12:5521-го століття
-
12:55 - 12:57таким же чином, як автоматизація
-
12:57 - 12:59і конвеєризація кинули виклик
-
12:59 - 13:01"синім комірцям" у 20-му столітті.
-
13:01 - 13:04Подумайте про лаборанта,
-
13:04 - 13:06що розглядає у мікроскоп
-
13:06 - 13:08раковий біоптат
-
13:08 - 13:09і визначає, чи він дійсно раковий.
-
13:09 - 13:12Ця людина закінчила університет.
-
13:12 - 13:14Ця людина купує речі.
-
13:14 - 13:15Він або вона голосує.
-
13:15 - 13:17Він або вона змінює суспільство.
-
13:17 - 13:21І робота цієї людини,
-
13:21 - 13:22як і цілої флотилії таких же
-
13:22 - 13:24професіоналів,
-
13:24 - 13:26радикально зміниться
-
13:26 - 13:29або й взагалі зникне.
-
13:29 - 13:31Так от, ми звикли думати, що технології
створюють -
13:31 - 13:33місця на довгий час
-
13:33 - 13:36після короткого, тимчасового періоду
дезорганізації, -
13:36 - 13:39і дійсно, таке відбувається в умовах,
-
13:39 - 13:41в яких ми живемо, Індустріальній
-
13:41 - 13:43Революції, тому що саме так трапилось.
-
13:43 - 13:46Проче чогось бракує в цьому аналізі:
-
13:46 - 13:48є деякі категорії праці, що просто
-
13:48 - 13:50нівелюються і з часом зникають.
-
13:50 - 13:53Індустріальна Революція мала б негативне
значення, -
13:53 - 13:55якщо ви були б конем.
-
13:55 - 13:59Отже, нам варто бути обережними
-
13:59 - 14:01і регулювати дані лише для певних
потреб, -
14:01 - 14:05головних людських потреб.
-
14:05 - 14:08Ми мусимо стати господарями
цієї технології, -
14:08 - 14:10а не її рабами.
-
14:10 - 14:12Ми на початку епохи великих даних,
-
14:12 - 14:15і чесно кажучи, нам не вдається оперувати
-
14:15 - 14:18усіма даними, які можемо зібрати.
-
14:18 - 14:22Це проблема не тільки АНБ.
-
14:22 - 14:25Підприємства володіють багатьма даними,
проте зложивають ними, -
14:25 - 14:28тому ми повинні покращити становище, хоч
це й забере час. -
14:28 - 14:32Трохи схоже на виклик
-
14:32 - 14:34перших людей і вогню.
-
14:34 - 14:36Це не тільки інструмент, але й те, що,
-
14:36 - 14:38доки ми не обережні, знищить нас.
-
14:38 - 14:42Великі дані змінять наше життя,
-
14:44 - 14:47працю і мислення.
-
14:47 - 14:50Вони допоможуть управляти працею
-
14:50 - 14:52і бути задоволеним, повним сподівань,
-
14:52 - 14:55щасливим і здоровим,
-
14:55 - 14:58але в минулому ми дивились на
інформаційні технології -
14:58 - 15:02і бачили лише Т,
-
15:02 - 15:04технології, пристрої,
-
15:04 - 15:06тому що все це було матеріальним.
-
15:06 - 15:08Тепер ж потрібно зосередитись на І,
-
15:08 - 15:11інформації,
-
15:11 - 15:12яка, певно, є менш очевидною,
-
15:12 - 15:14проте набагато важливішою.
-
15:14 - 15:18Людство нарешті мати вигоду
-
15:18 - 15:21із зібраних відомостей,
-
15:21 - 15:24як частини наших вічних пошуків
-
15:24 - 15:26розуміння світу і місця в ньому,
-
15:26 - 15:29і ось тому великі дані мають велике
значення.
- Title:
- Більші дані - кращі дані
- Speaker:
- Кеннет Кук'єр
- Description:
-
Самокеровані автомобілі були лише початком. Яке майбутнє технологій і дизайну за участю великих об'ємів даних? У своїй захопливій науковій промові Кеннет Кук'єр аналізує, що ж чекає на машинне навчання і знання людства загалом.
- Video Language:
- English
- Team:
- closed TED
- Project:
- TEDTalks
- Duration:
- 15:51
Hanna Leliv edited Ukrainian subtitles for Big data is better data | ||
Hanna Leliv edited Ukrainian subtitles for Big data is better data | ||
Hanna Leliv edited Ukrainian subtitles for Big data is better data | ||
Hanna Leliv approved Ukrainian subtitles for Big data is better data | ||
Hanna Leliv accepted Ukrainian subtitles for Big data is better data | ||
Hanna Leliv edited Ukrainian subtitles for Big data is better data | ||
Hanna Leliv edited Ukrainian subtitles for Big data is better data | ||
Hanna Leliv edited Ukrainian subtitles for Big data is better data |