1 00:00:00,787 --> 00:00:04,632 העוגה החביבה על האמריקאים היא...? 2 00:00:04,632 --> 00:00:08,138 קהל: תפוחים. קנת קוקיאר: תפוחים, כמובן. 3 00:00:08,138 --> 00:00:09,369 איך אנו יודעים? 4 00:00:09,369 --> 00:00:12,122 בגלל הנתונים. 5 00:00:12,122 --> 00:00:14,188 רואים את המכירות בסופרמרקטים. 6 00:00:14,188 --> 00:00:17,054 בודקים את המכירות של כל עוגות 7 00:00:17,054 --> 00:00:21,129 30 הס"מ הקפואות, ועוגות התפוחים מנצחות בגדול. 8 00:00:21,129 --> 00:00:24,669 רוב המכירות הן של עוגות תפוחים. 9 00:00:26,699 --> 00:00:29,273 אבל אז הסופרמרקטים החלו למכור 10 00:00:29,273 --> 00:00:31,856 עוגות יותר קטנות, בקוטר 11 ס"מ, 11 00:00:31,856 --> 00:00:36,030 ופתאום עוגות התפוחים ירדו למקום הרביעי או החמישי. 12 00:00:36,030 --> 00:00:38,905 מדוע? מה קרה? 13 00:00:38,905 --> 00:00:41,723 חישבו על זה. 14 00:00:41,723 --> 00:00:45,571 כאשר אנו קונים עוגת 30 ס"מ, 15 00:00:45,571 --> 00:00:47,832 כל המשפחה צריכה להסכים, 16 00:00:47,832 --> 00:00:51,623 ועוגת תפוחים היא בעדיפות שניה אצל כל אחד. 17 00:00:51,623 --> 00:00:53,558 (צחוק) 18 00:00:53,558 --> 00:00:57,173 אבל כשקונים עוגת 11 ס"מ אישית, 19 00:00:57,173 --> 00:01:00,918 אפשר לקנות את זו שכל אחד אוהב אישית. 20 00:01:00,918 --> 00:01:04,933 כל אחד מקבל את מה שבעדיפות ראשונה אצלו. 21 00:01:04,933 --> 00:01:06,574 יש יותר נתונים. 22 00:01:06,574 --> 00:01:08,128 ניתן לראות דברים 23 00:01:08,128 --> 00:01:09,260 שלא ניתן היה לראות 24 00:01:09,260 --> 00:01:13,213 כאשר היו פחות נתונים. 25 00:01:13,213 --> 00:01:15,688 העניין הוא שיותר נתונים 26 00:01:15,688 --> 00:01:17,971 אינם מאפשרים רק לראות יותר -- 27 00:01:17,971 --> 00:01:19,825 יותר מאותם הדברים שראינו קודם. 28 00:01:19,825 --> 00:01:23,438 יותר נתונים מאפשרים לראות דברים חדשים. 29 00:01:23,438 --> 00:01:26,532 הם מאפשרים לנו לראות יותר טוב. 30 00:01:26,532 --> 00:01:30,188 הם מאפשרים להסתכל אחרת. 31 00:01:30,188 --> 00:01:33,361 במקרה זה, הם מאפשרים לראות 32 00:01:33,361 --> 00:01:36,274 מהי העוגה האהובה באמריקה: 33 00:01:36,274 --> 00:01:38,816 לא עוגת תפוחים. 34 00:01:38,816 --> 00:01:42,550 כולכם בוודאי שמעתם את המושג 'ביג דאטה'. 35 00:01:42,550 --> 00:01:44,849 בטח נמאס לכם לשמוע את המושג 36 00:01:44,849 --> 00:01:47,148 'ביג דאטה'. 37 00:01:47,148 --> 00:01:49,447 אכן, יש הרבה הפרזה סביב המושג, 38 00:01:49,447 --> 00:01:51,779 וזה חבל מאוד, 39 00:01:51,779 --> 00:01:54,825 כי ביג דאטה הוא כלי חשוב ביותר 40 00:01:54,825 --> 00:01:58,559 שבאמצעותו החברה עתידה להתקדם. 41 00:01:58,559 --> 00:02:02,120 בעבר, נהגנו להסתכל על נתונים מצומצמים 42 00:02:02,120 --> 00:02:03,824 ולחשוב מה משמעותם 43 00:02:03,824 --> 00:02:05,320 בניסיון להבין את העולם, 44 00:02:05,320 --> 00:02:07,311 וכעת יש לנו הרבה יותר כאלה, 45 00:02:07,311 --> 00:02:10,032 יותר ממה שיכלו להיות אי-פעם בעבר. 46 00:02:10,032 --> 00:02:11,910 מה שאנו מגלים הוא שכאשר יש לנו 47 00:02:11,910 --> 00:02:14,634 מסד נתונים גדול, ניתן לעשות דברים 48 00:02:14,634 --> 00:02:17,910 שלא יכולנו לעשות כאשר היו לנו פחות נתונים. 49 00:02:17,910 --> 00:02:20,551 ביג דאטה הוא חשוב והוא חדש, 50 00:02:20,551 --> 00:02:22,328 וכאשר חושבים על כך, 51 00:02:22,328 --> 00:02:24,544 הדרך היחידה בה עולמנו יוכל 52 00:02:24,544 --> 00:02:26,333 להתמודד עם האתגרים הגלובליים -- 53 00:02:26,333 --> 00:02:29,870 לספק לכולם אוכל, טיפול רפואי, 54 00:02:29,870 --> 00:02:32,680 אנרגיה, חשמל, 55 00:02:32,680 --> 00:02:34,469 וגם לוודא שלא ייצלו בגלל 56 00:02:34,469 --> 00:02:35,707 ההתחממות הגלובלית -- 57 00:02:35,707 --> 00:02:39,902 תהיה באמצעות שימוש יעיל בנתונים. 58 00:02:39,902 --> 00:02:43,772 אז מה כל-כך שונה בביג דאטה? על מה כל הרעש? 59 00:02:43,772 --> 00:02:46,289 כדי לענות על השאלה, הבה נחשוב 60 00:02:46,289 --> 00:02:48,185 כיצד המידע נראה פעם, 61 00:02:48,185 --> 00:02:51,219 כיצד הוא נראה בפועל בעבר. 62 00:02:51,219 --> 00:02:54,830 ב-1908, באי כרתים, 63 00:02:54,830 --> 00:02:59,565 ארכיאולוגים גילו דיסקה מחימר. 64 00:02:59,565 --> 00:03:03,624 הם תיארכו אותה ל-2000 לפנה"ס, כלומר, לפני 4,000 שנה. 65 00:03:03,624 --> 00:03:05,433 יש כיתוב על הדיסקה 66 00:03:05,433 --> 00:03:07,242 שאין אנו יודעים את פירושו. 67 00:03:07,242 --> 00:03:09,053 זוהי תעלומה. אבל מה שחשוב כאן 68 00:03:09,053 --> 00:03:10,981 הוא שכך נראה מידע 69 00:03:10,981 --> 00:03:13,070 לפני 4,000 שנה. 70 00:03:13,070 --> 00:03:14,868 זו הדרך בה החברה 71 00:03:14,868 --> 00:03:19,142 איחסנה והעבירה מידע. 72 00:03:19,142 --> 00:03:23,302 החברה לא התקדמה מאז כל-כך. 73 00:03:23,302 --> 00:03:26,776 אנו עדיין מאחסנים מידע על דיסקות, 74 00:03:26,776 --> 00:03:29,960 אבל היום אנו יכולים לאחסן הרבה יותר מידע, 75 00:03:29,960 --> 00:03:31,220 הרבה יותר מאי-פעם. 76 00:03:31,220 --> 00:03:34,313 יותר קל לחפש אותו. יותר קל להעתיקו. 77 00:03:34,313 --> 00:03:37,813 יותר קל לשתפו. יותר קל לעבדו. 78 00:03:37,813 --> 00:03:40,579 ניתן גם להשתמש בו למטרות 79 00:03:40,579 --> 00:03:42,413 שאף פעם לא חשבנו עליהן 80 00:03:42,413 --> 00:03:45,608 כאשר אספנו את המידע. 81 00:03:45,608 --> 00:03:47,860 בהקשר זה, המידע הפך 82 00:03:47,860 --> 00:03:51,392 ממצבור לזרם, 83 00:03:51,392 --> 00:03:55,330 ממשהו שהוא נייח וסטטי 84 00:03:55,330 --> 00:03:58,939 למשהו שהוא זורם ודינמי. 85 00:03:58,939 --> 00:04:02,962 מתקיימת, אם תרצו, נוזליות של מידע. 86 00:04:02,962 --> 00:04:06,028 הדיסקה מלפני 4,000 שנה 87 00:04:06,028 --> 00:04:09,094 שנתגלתה בכרתים היא כבדה. 88 00:04:09,094 --> 00:04:12,162 היא אינה מחזיקה הרבה מידע, 89 00:04:12,162 --> 00:04:15,278 והמידע הזה אינו ניתן לשינוי. 90 00:04:15,278 --> 00:04:19,289 לעומתו, כל הקבצים 91 00:04:19,289 --> 00:04:21,589 שאדוארד סנודן לקח 92 00:04:21,589 --> 00:04:23,889 מהסוכנות לביטחון לאומי של ארה"ב 93 00:04:23,889 --> 00:04:26,190 נכנסים בזכרון נייד 94 00:04:26,190 --> 00:04:29,200 בגודל של ציפורן, 95 00:04:29,200 --> 00:04:33,945 וניתן לשתפם במהירות האור. 96 00:04:33,945 --> 00:04:37,620 יותר נתונים. יותר. 97 00:04:39,200 --> 00:04:41,414 אחת הסיבות שיש לנו כל-כך הרבה מידע היום 98 00:04:41,414 --> 00:04:43,790 היא שאנו אוספים דברים 99 00:04:43,790 --> 00:04:46,166 שתמיד אספנו עליהם מידע, 100 00:04:46,166 --> 00:04:48,542 אבל סיבה נוספת היא שאנו אוספים דברים 101 00:04:48,542 --> 00:04:51,354 שתמיד היו קשורים במידע 102 00:04:51,354 --> 00:04:53,840 אבל אף פעם לא היו בתבנית של נתונים 103 00:04:53,840 --> 00:04:56,259 וכעת אנו הופכים אותם לנתונים. 104 00:04:56,259 --> 00:04:59,567 חישבו למשל על שאלת המיקום. 105 00:04:59,567 --> 00:05:01,816 לדוגמא, מרטין לותר. 106 00:05:01,816 --> 00:05:03,934 אם היינו רוצים לדעת ב-1500 107 00:05:03,934 --> 00:05:06,052 איפה נמצא מרטין לותר, 108 00:05:06,052 --> 00:05:08,172 היינו צריכים לעקוב אחריו כל הזמן, 109 00:05:08,172 --> 00:05:10,309 אולי עם קולמוס-נוצה וקסת-דיו, 110 00:05:10,309 --> 00:05:11,985 ולרשום את המיקומים. 111 00:05:11,985 --> 00:05:14,168 אבל חישבו כיצד זה היה נראה היום. 112 00:05:14,168 --> 00:05:16,080 אנו יודעים שהיכן שהוא, 113 00:05:16,080 --> 00:05:18,736 ככל הנראה בבסיס נתונים של חברת תקשורת, 114 00:05:18,736 --> 00:05:21,772 ישנו גיליון אלקטרוני או לפחות רשומה 115 00:05:21,772 --> 00:05:23,860 הרושמת את המידע על כל אחד 116 00:05:23,860 --> 00:05:25,923 ואיפה הוא היה בכל עת. 117 00:05:25,923 --> 00:05:27,283 אם יש לך טלפון נייד, 118 00:05:27,283 --> 00:05:30,130 ובו יש איכון לווייני, אבל גם אם אין, 119 00:05:30,130 --> 00:05:32,515 הוא יכול לתעד את המידע עליך. 120 00:05:32,515 --> 00:05:36,599 מבחינה זו, המיקום הפך לנתון. 121 00:05:36,599 --> 00:05:41,200 חישבו למשל על תנוחה, 122 00:05:41,200 --> 00:05:43,145 האופן בו אתם ישובים כרגע, 123 00:05:43,145 --> 00:05:44,515 האופן בו אתה יושב, 124 00:05:44,515 --> 00:05:47,286 האופן בו אתה יושב, האופן בו את יושבת. 125 00:05:47,286 --> 00:05:49,213 אצל כל אחד זה שונה וזו פונקציה 126 00:05:49,213 --> 00:05:51,456 של אורך הרגל, הגב והקימור שלו, 127 00:05:51,456 --> 00:05:53,987 ואם הייתי שם חיישנים, אולי 100 חיישנים 128 00:05:53,987 --> 00:05:55,753 בכל הכיסאות שלכם, 129 00:05:55,753 --> 00:05:59,353 הייתי יכול ליצור תבנית די ייחודית לכל אחד, 130 00:05:59,353 --> 00:06:03,762 מין טביעת אצבע, אבל לא מאצבע. 131 00:06:03,762 --> 00:06:06,731 אז מה היינו עושים עם זה? 132 00:06:06,731 --> 00:06:09,128 חוקרים בטוקיו משתמשים בזה 133 00:06:09,128 --> 00:06:13,516 בתור אמצעי אפשרי נגד גניבת מכוניות. 134 00:06:13,516 --> 00:06:16,440 הרעיון הוא שכאשר הפורץ יישב מאחורי ההגה 135 00:06:16,440 --> 00:06:18,544 וינסה להתניע, המכונית תזהה 136 00:06:18,544 --> 00:06:20,906 שנהג לא מורשה יושב מאחורי ההגה, 137 00:06:20,906 --> 00:06:22,960 ואולי המנוע ייכבה, אלא אם 138 00:06:22,960 --> 00:06:26,247 תוקלד סיסמה בלוח המחוונים 139 00:06:26,247 --> 00:06:30,905 כדי לומר, "יש לי הרשאה לנהוג." מצוין. 140 00:06:30,905 --> 00:06:33,458 מה אם בכל מכונית באירופה 141 00:06:33,458 --> 00:06:34,915 תהיה טכנולוגיה זו? 142 00:06:34,915 --> 00:06:38,080 מה היינו יכולים לעשות אז? 143 00:06:38,080 --> 00:06:40,320 אם היינו צוברים את הנתונים, 144 00:06:40,320 --> 00:06:44,134 אולי היינו יכולים לזהות סימנים מקדימים 145 00:06:44,134 --> 00:06:46,843 לתאונת דרכים 146 00:06:46,843 --> 00:06:52,736 העומדת להתרחש תוך 5 השניות הקרובות. 147 00:06:52,736 --> 00:06:55,293 ומה שנאגור אז כנתונים 148 00:06:55,293 --> 00:06:57,076 זו עייפות הנהג, 149 00:06:57,076 --> 00:06:59,410 והמענה יהיה כאשר המכונית 150 00:06:59,410 --> 00:07:02,847 תחוש שהאדם צונח לאותו מצב, 151 00:07:02,847 --> 00:07:06,841 היא תדע זאת אוטומטית, תפעיל אתראה פנימית 152 00:07:06,841 --> 00:07:08,866 שתרעיד את ההגה, תצפור, 153 00:07:08,866 --> 00:07:10,587 כדי לומר, "אדוני, תתעורר, 154 00:07:10,587 --> 00:07:12,491 שים לב לכביש." 155 00:07:12,491 --> 00:07:14,344 דברים כאלה נוכל לבצע כאשר 156 00:07:14,344 --> 00:07:17,165 נהפוך לנתונים יותר ויותר היבטים מחיינו. 157 00:07:17,165 --> 00:07:20,840 מה הערך של ביג דאטה? 158 00:07:20,840 --> 00:07:23,030 חישבו על זה. 159 00:07:23,030 --> 00:07:25,442 יש לנו יותר מידע. 160 00:07:25,442 --> 00:07:28,783 ניתן לעשות דברים שלא ניתן היה קודם. 161 00:07:28,783 --> 00:07:30,459 אחד התחומים הכי מרשימים 162 00:07:30,459 --> 00:07:32,188 שבו זה קורה 163 00:07:32,188 --> 00:07:35,495 הוא התחום של מכונות לומדות. 164 00:07:35,495 --> 00:07:38,572 מכונות לומדות הוא ענף של אינטליגנציה מלאכותית, 165 00:07:38,572 --> 00:07:41,950 שהיא בעצמה ענף של מדעי המחשב. 166 00:07:41,950 --> 00:07:43,493 הרעיון באופן כללי הוא 167 00:07:43,493 --> 00:07:45,610 שבמקום להורות למחשב מה לעשות, 168 00:07:45,610 --> 00:07:48,230 פשוט נזרוק נתונים בנוגע לבעיה 169 00:07:48,230 --> 00:07:51,436 ונאמר למחשב שימצא פיתרון לבד. 170 00:07:51,436 --> 00:07:53,213 כדי להבין את הרעיון 171 00:07:53,213 --> 00:07:56,765 נסתכל על המקור שלו. 172 00:07:56,765 --> 00:07:59,153 בשנות ה-50, איש מדעי המחשב 173 00:07:59,153 --> 00:08:02,745 באיי-בי-אם, בשם ארתור סמואל, אהב לשחק דמקה, 174 00:08:02,745 --> 00:08:04,147 אז הוא כתב תוכנת מחשב 175 00:08:04,147 --> 00:08:06,960 כדי שיוכל לשחק נגד המחשב. 176 00:08:06,960 --> 00:08:09,461 הוא שיחק וניצח. 177 00:08:09,671 --> 00:08:11,774 הוא שיחק וניצח. 178 00:08:11,904 --> 00:08:14,789 הוא שיחק וניצח, 179 00:08:14,789 --> 00:08:16,567 כי המחשב ידע 180 00:08:16,567 --> 00:08:18,794 רק מהלכים חוקיים. 181 00:08:18,794 --> 00:08:20,881 ארתור סמואל ידע משהו אחר. 182 00:08:20,881 --> 00:08:25,510 ארתור סמואל ידע אסטרטגיה. 183 00:08:25,510 --> 00:08:27,906 לכן הוא כתב תוכנת-משנה 184 00:08:27,906 --> 00:08:29,880 שפעלה ברקע, וכל מה שהיא עשתה 185 00:08:29,880 --> 00:08:31,697 היה לאמוד את הסבירות 186 00:08:31,697 --> 00:08:34,260 שסידור נתון על הלוח יוביל 187 00:08:34,260 --> 00:08:37,169 לעמדת ניצחון לעומת עמדת הפסד 188 00:08:37,169 --> 00:08:39,678 לאחר כל מהלך. 189 00:08:39,678 --> 00:08:42,528 הוא שיחק נגד המחשב וניצח. 190 00:08:42,828 --> 00:08:45,016 הוא שיחק נגד המחשב וניצח 191 00:08:45,336 --> 00:08:49,067 הוא שיחק נגד המחשב וניצח. 192 00:08:49,067 --> 00:08:51,344 ואז ארתור סמואל עזב את המחשב 193 00:08:51,344 --> 00:08:53,571 כדי שישחק עם עצמו. 194 00:08:53,571 --> 00:08:57,080 הוא שיחק עם עצמו ואסף יותר מידע. 195 00:08:57,080 --> 00:09:01,389 הוא אסף יותר מידע וזה הגדיל את הדיוק של החיזוי שלו. 196 00:09:01,389 --> 00:09:03,493 ואז ארתור סמואל חזר למחשב, 197 00:09:03,493 --> 00:09:05,611 שיחק נגדו והפסיד, 198 00:09:05,811 --> 00:09:07,650 ושיחק נגדו והפסיד, 199 00:09:07,880 --> 00:09:09,927 ושיחק נגדו והפסיד, 200 00:09:09,927 --> 00:09:12,526 וכך ארתור סמואל יצר מכונה 201 00:09:12,526 --> 00:09:18,814 שהתעלתה על יכולתו, במשימה שהוא עצמו לימד אותה. 202 00:09:18,814 --> 00:09:21,062 והרעיון הזה של למידת מכונה 203 00:09:21,062 --> 00:09:24,139 מגיע לכל מקום. 204 00:09:25,239 --> 00:09:28,388 איך לדעתכם יש לנו מכוניות ללא נהג? 205 00:09:28,388 --> 00:09:30,525 האם נהיה במצב יותר טוב כחברה 206 00:09:30,525 --> 00:09:33,810 אם נכניס את כל חוקי התנועה לתוך תוכנה? 207 00:09:33,810 --> 00:09:36,408 לא. האם הזיכרון זול יותר? לא. 208 00:09:36,408 --> 00:09:40,402 האלגוריתמים מהירים יותר? לא. המעבדים טובים יותר? לא. 209 00:09:40,402 --> 00:09:43,174 כל הדברים הללו חשובים, אבל הם לא הסיבה. 210 00:09:43,174 --> 00:09:46,315 הסיבה היא ששינינו את אופי הבעיה. 211 00:09:46,315 --> 00:09:47,655 שינינו את אופי הבעיה 212 00:09:47,655 --> 00:09:50,090 ממצב שבו ניסינו באופן מוגזם ובגלוי 213 00:09:50,090 --> 00:09:52,671 להסביר למחשב כיצד לנהוג 214 00:09:52,671 --> 00:09:53,987 למצב בו אנו אומרים, 215 00:09:53,987 --> 00:09:55,863 "הנה, קח לך המון נתונים על הרכב. 216 00:09:55,863 --> 00:09:57,396 ואתה תמצא את הפיתרון. 217 00:09:57,396 --> 00:09:59,263 אתה תמצא שזה רמזור, 218 00:09:59,263 --> 00:10:01,344 שהרמזור אדום ולא ירוק, 219 00:10:01,344 --> 00:10:03,358 פירושו שצריך לעצור 220 00:10:03,358 --> 00:10:06,441 ולא להתקדם." 221 00:10:06,441 --> 00:10:07,809 למידת מכונות נמצאת 222 00:10:07,809 --> 00:10:09,950 ביסוד הרבה דברים שאנו מבצעים ברשת: 223 00:10:09,950 --> 00:10:11,807 מנועי חיפוש, 224 00:10:11,807 --> 00:10:15,608 אלגוריתמים של אמזון להתאמה אישית, 225 00:10:15,608 --> 00:10:17,820 תרגום ממוחשב, 226 00:10:17,820 --> 00:10:22,110 מערכות לזיהוי קול. 227 00:10:22,110 --> 00:10:24,945 לאחרונה, חוקרים התעמקו 228 00:10:24,945 --> 00:10:28,140 בסוגיית הביופסיה, 229 00:10:28,140 --> 00:10:30,907 של דגימת רקמות סרטניות, 230 00:10:30,907 --> 00:10:33,222 והם ביקשו ממחשב לקבוע, 231 00:10:33,222 --> 00:10:35,953 באמצעות בחינת הנתונים 232 00:10:35,953 --> 00:10:39,220 ושיעורי התמותה, אם התאים 233 00:10:39,220 --> 00:10:42,454 הם באמת סרטניים, 234 00:10:42,454 --> 00:10:44,682 וכשהנתונים הוזנו למחשב, 235 00:10:44,682 --> 00:10:46,729 באמצעות אלגוריתם למידת מכונה, 236 00:10:46,729 --> 00:10:48,606 המכונה היתה מסוגלת לזהות 237 00:10:48,606 --> 00:10:50,868 את 12 הסימנים המחשידים שמנבאים הכי טוב 238 00:10:50,868 --> 00:10:54,167 שריקמה זו מתאי סרטן-שד 239 00:10:54,167 --> 00:10:57,385 היא אכן ממאירה. 240 00:10:57,385 --> 00:10:59,883 הבעיה: הספרות הרפואית 241 00:10:59,883 --> 00:11:02,672 הכירה רק 9 מהם. 242 00:11:02,672 --> 00:11:04,472 שלושה מהסימנים היו כאלה 243 00:11:04,472 --> 00:11:07,447 שלא היה צורך שאנשים יחפשו, 244 00:11:07,447 --> 00:11:10,898 אבל המכונה איתרה אותם. 245 00:11:14,038 --> 00:11:18,903 אבל, ישנם גם צדדים אפלים לביג דאטה. 246 00:11:18,903 --> 00:11:20,547 ביג דאטה ישפר את חיינו, 247 00:11:20,547 --> 00:11:23,617 אבל יש גם בעיות שצריך להיות מודעים אליהן. 248 00:11:23,617 --> 00:11:26,240 הראשונה היא האפשרות 249 00:11:26,240 --> 00:11:28,926 שאנו עשויים לסבול מביצוע ניבויים, 250 00:11:28,926 --> 00:11:32,796 כי המשטרה עלולה להשתמש בביג דאטה למטרותיה, 251 00:11:32,796 --> 00:11:35,147 משהו כמו בסרט "דו"ח מיוחד". 252 00:11:35,147 --> 00:11:37,588 זה נקרא "שיטור מנבא", 253 00:11:37,588 --> 00:11:39,951 או "חקר פשיעה אלגוריתמי". 254 00:11:39,951 --> 00:11:41,987 הרעיון הוא שאם לוקחים המון נתונים, 255 00:11:41,987 --> 00:11:44,146 לדוגמא, היכן התרחשו פשעים בעבר, 256 00:11:44,146 --> 00:11:46,689 נדע לאן לשגר את סיורי המשטרה. 257 00:11:46,689 --> 00:11:48,804 זה נראה הגיוני, אבל הבעיה 258 00:11:48,804 --> 00:11:53,348 היא שזה לא ייעצר רק בנתוני המיקום, 259 00:11:53,348 --> 00:11:56,307 אלא זה יירד לרמת הפרט. 260 00:11:56,307 --> 00:11:57,967 למה שלא נשתמש בנתונים 261 00:11:57,967 --> 00:12:00,785 מתעודת התיכון של האדם? 262 00:12:00,785 --> 00:12:02,346 אולי עלינו להשתמש בנתונים כמו, 263 00:12:02,346 --> 00:12:04,374 אם האדם עובד או מובטל, רמת האשראי שלו, 264 00:12:04,374 --> 00:12:05,926 הרגלי גלישתו באינטרנט, 265 00:12:05,926 --> 00:12:07,804 אם הוא ער עד מאוחר בלילה. 266 00:12:07,804 --> 00:12:10,045 מכשיר הניטור הגופני, אם הוא מסוגל לזהות 267 00:12:10,045 --> 00:12:15,201 תגובות כימיות, יראה שיש לו מחשבות תוקפניות. 268 00:12:15,201 --> 00:12:17,422 עשויים להיות אלגוריתמים שיכולים לנבא 269 00:12:17,422 --> 00:12:19,055 מה אנו עומדים לעשות, 270 00:12:19,055 --> 00:12:20,299 ואנו עלולים להיחשב 271 00:12:20,299 --> 00:12:22,889 לאחראים לדברים שטרם ביצענו בפועל. 272 00:12:22,889 --> 00:12:24,621 פרטיות היוותה אתגר מרכזי 273 00:12:24,621 --> 00:12:27,501 בעידן של נתונים מועטים. 274 00:12:27,501 --> 00:12:29,650 בעידן ביג דאטה, 275 00:12:29,650 --> 00:12:34,173 האתגר יהיה לשמור מכל משמר על הרצון החופשי, 276 00:12:34,173 --> 00:12:37,952 על הבחירה המוסרית, על רצון האדם, 277 00:12:37,952 --> 00:12:41,020 על העצמאות האנושית. 278 00:12:42,540 --> 00:12:44,765 ישנה בעיה נוספת: 279 00:12:44,765 --> 00:12:48,321 ביג דאטה יגזול מאיתנו את עבודותינו. 280 00:12:48,321 --> 00:12:51,833 ביג דאטה והאלגוריתמים עומדים לקרוא תיגר 281 00:12:51,833 --> 00:12:54,894 על עבודות הצווארון הלבן המקצועיות 282 00:12:54,894 --> 00:12:56,547 של המאה ה-21 283 00:12:56,547 --> 00:12:58,981 באותו אופן שהמיכון התעשייתי 284 00:12:58,981 --> 00:13:01,790 וקו הייצור קראו תיגר 285 00:13:01,790 --> 00:13:04,196 על עבודות הצווארון הכחול במאה ה-20. 286 00:13:04,196 --> 00:13:06,288 תחשבו על טכנאי מעבדה 287 00:13:06,288 --> 00:13:07,697 שמסתכל דרך מיקרוסקופ 288 00:13:07,697 --> 00:13:09,321 על ריקמה סרטנית 289 00:13:09,321 --> 00:13:11,958 ומחליט אם היא ממאירה או לא. 290 00:13:11,958 --> 00:13:13,930 האדם למד באוניברסיטה. 291 00:13:13,930 --> 00:13:15,360 הוא קנה רכוש. 292 00:13:15,360 --> 00:13:17,101 הוא או היא מצביעים בבחירות. 293 00:13:17,101 --> 00:13:20,767 הוא או היא בעלי עניין בחברה. 294 00:13:20,767 --> 00:13:22,161 והעבודה של אותו אדם, 295 00:13:22,161 --> 00:13:23,770 כמו גם צי שלם 296 00:13:23,770 --> 00:13:25,739 של אנשי מקצוע כמו אותו אדם, 297 00:13:25,739 --> 00:13:28,889 ימצאו שהעבודות שלהם השתנו באופן ניכר 298 00:13:28,889 --> 00:13:31,246 או למעשה התחסלו כליל. 299 00:13:31,246 --> 00:13:32,530 אנו אוהבים לחשוב 300 00:13:32,530 --> 00:13:35,717 שהטכנולוגיה יוצרת עם הזמן עבודות, 301 00:13:35,717 --> 00:13:39,182 לאחר תקופת-מעבר קצרה וזמנית, 302 00:13:39,182 --> 00:13:41,123 וזה נכון ביחס למציאות שאנו 303 00:13:41,123 --> 00:13:43,265 חיים בה, שהיא המהפכה התעשייתית, 304 00:13:43,265 --> 00:13:45,593 כי זה בדיוק מה שקרה. 305 00:13:45,593 --> 00:13:47,926 אבל אנו שוכחים משהו בניתוח זה: 306 00:13:47,926 --> 00:13:49,756 ישנם כמה תחומי עבודה 307 00:13:49,756 --> 00:13:53,176 שפשוט נמחקים ולעולם לא שבים. 308 00:13:53,176 --> 00:13:54,380 המהפכה התעשייתית 309 00:13:54,380 --> 00:13:59,182 לא היתה טובה במיוחד עבור סוסים. 310 00:13:59,182 --> 00:14:01,237 לכן יהיה עלינו להיזהר 311 00:14:01,237 --> 00:14:04,751 ולהתאים את ביג דאטה לצרכינו, 312 00:14:04,751 --> 00:14:07,936 צרכינו האנושיים ביותר. 313 00:14:07,936 --> 00:14:10,110 יהיה עלינו להיות אדוניה של טכנולוגיה זו, 314 00:14:10,110 --> 00:14:11,546 לא משרתיה. 315 00:14:11,546 --> 00:14:14,504 אנו נמצאים רק בתחילתו של עידן ביג דאטה, 316 00:14:14,504 --> 00:14:17,654 והאמת היא שאנו לא מצטיינים 317 00:14:17,654 --> 00:14:21,861 בטיפול בכל הנתונים שאנו מסוגלים לאסוף כיום. 318 00:14:21,861 --> 00:14:25,191 זו לא רק בעיה הנוגעת לסוכנות לביטחון לאומי. 319 00:14:25,191 --> 00:14:28,229 חברות אוספות המון נתונים והן גם משתמשות בו לרעה, 320 00:14:28,229 --> 00:14:31,896 ועלינו להשתפר בתחום זה, וזה יקח זמן. 321 00:14:31,896 --> 00:14:33,718 זה קצת כמו האתגר שניצב 322 00:14:33,718 --> 00:14:36,125 בפני האדם הקדמון עם האש. 323 00:14:36,125 --> 00:14:38,010 זהו כלי, אבל כלי שאם 324 00:14:38,010 --> 00:14:41,569 לא נהיה זהירים איתו, הוא ישרוף אותנו. 325 00:14:44,008 --> 00:14:47,024 ביג דאטה עומד לשנות את דרך חיינו, 326 00:14:47,024 --> 00:14:49,929 את דרך עבודתנו וחשיבתנו. 327 00:14:49,929 --> 00:14:51,818 הוא יסייע לנו לנהל את הקריירות שלנו 328 00:14:51,818 --> 00:14:55,452 ולנהל חיים של סיפוק, תקווה 329 00:14:55,452 --> 00:14:58,444 אושר ובריאות. 330 00:14:58,444 --> 00:15:01,750 אבל בעבר, הסתכלנו על "טכנולוגיית מידע" 331 00:15:01,750 --> 00:15:03,958 וראינו רק את ה-"ט", 332 00:15:03,958 --> 00:15:05,644 את הטכנולוגיה, החומרה, 333 00:15:05,644 --> 00:15:07,906 כי הם היו הדברים הפיזיקליים. 334 00:15:07,906 --> 00:15:10,830 כעת אנו צריכים להסתכל על ה-"מ", 335 00:15:10,830 --> 00:15:12,210 המידע, 336 00:15:12,210 --> 00:15:13,583 הבולט פחות לעין, 337 00:15:13,583 --> 00:15:17,692 אבל במובנים מסויימים הוא הרבה יותר חשוב. 338 00:15:17,692 --> 00:15:21,157 האנושות יכולה סוף-סוף ללמוד מהמידע 339 00:15:21,157 --> 00:15:23,575 שהיא מסוגלת לאסוף, 340 00:15:23,575 --> 00:15:25,690 כחלק ממסעינו הנצחי 341 00:15:25,690 --> 00:15:28,849 להבנת העולם ומקומנו בתוכו, 342 00:15:28,849 --> 00:15:33,710 וזו הסיבה מדוע ביג דאטה הוא עניין כה חשוב. 343 00:15:34,480 --> 00:15:38,048 (מחיאות כפיים)