Return to Video

איך אנחנו מלמדים מחשבים להבין תמונות

  • 0:02 - 0:06
    בואו אני אראה לכם משהו.
  • 0:06 - 0:10
    (וידאו) ילדה: "אוקיי, זה חתול
    שיושב על מיטה.
  • 0:10 - 0:14
    הילד מלטף את הפיל.
  • 0:14 - 0:19
    אלה אנשים שעולים על מטוס.
  • 0:19 - 0:21
    זה מטוס גדול."
  • 0:21 - 0:24
    זו ילדה בת שלוש שנים
  • 0:24 - 0:27
    מתארת מה היא רואה בסדרת תמונות.
  • 0:27 - 0:30
    אולי יש לה עוד הרבה ללמוד על העולם,
  • 0:30 - 0:35
    אבל היא כבר מומחית
    במשימה אחת מאוד חשובה:
  • 0:35 - 0:38
    להבין מה היא רואה.
  • 0:38 - 0:42
    החברה שלנו היא יותר
    מתקדמת טכנולוגית מאי פעם.
  • 0:42 - 0:46
    אנחנו שולחים אנשים לירח,
    אנחנו מייצרים טלפונים שמדברים אלינו
  • 0:46 - 0:51
    או מתאימים אישית תחנות רדיו
    שינגנו רק מוסיקה שאנחנו אוהבים.
  • 0:51 - 0:55
    ועדיין, המכונות והמחשבים
    המתקדמים ביותר שלנו
  • 0:55 - 0:58
    עדיין מתקשים במשימה הזו.
  • 0:58 - 1:01
    אז אני פה היום כדי לתת לכם דו"ח התקדמות
  • 1:01 - 1:05
    על ההתפתחויות האחרונות במחקר שלנו
    על ראיית מחשב,
  • 1:05 - 1:10
    אחד מהטכנולוגיות החלוציות והמהפכניות ביותר
  • 1:10 - 1:13
    במדעי המחשב.
  • 1:13 - 1:17
    נכון, יש לנו אבטיפוס של מכוניות
    שיכולות לנסוע בעצמן,
  • 1:17 - 1:21
    אבל בלי ראייה חכמה,
    הן לא יכולות באמת להבדיל
  • 1:21 - 1:25
    בין שקית נייר מקופלת על הכביש,
    שאפשר לנסוע עליה,
  • 1:25 - 1:29
    ואבן בגודל הזה,
    שצריך להימנע ממנה.
  • 1:29 - 1:33
    ייצרנו מצלמות מגהפיקסל מדהימות,
  • 1:33 - 1:36
    אבל לא הצלחנו להביא ראייה לעיוורים.
  • 1:36 - 1:40
    מזל"טים יכולים לטוס מעל שטח עצום,
  • 1:40 - 1:42
    אבל חסרי טכנולוגיית ראייה מספקת
  • 1:42 - 1:45
    בשביל לעזור לנו לעקוב
    אחרי השינויים ביערות הגשם.
  • 1:45 - 1:48
    מצלמות אבטחה נמצאות בכל מקום,
  • 1:48 - 1:53
    אבל הן לא מתריעות כשילד טובע בבריכה.
  • 1:54 - 2:00
    תמונות וסרטונים הופכים לחלק בלתי נפרד
    מהחיים הגלובליים.
  • 2:00 - 2:04
    הם נוצרים בקצב שהוא מעל לכל מה שכל אדם,
  • 2:04 - 2:07
    או קבוצות של אנשים,
    יכולים לקוות לצפות בהם,
  • 2:07 - 2:11
    ואתם ואני תורמים לזה בשיחת TED הזו.
  • 2:11 - 2:16
    אבל התוכנה המתקדמת ביותר שלנו עדיין
    מתמודדת בלהבין
  • 2:16 - 2:20
    ולנהל את התוכן העצום הזה.
  • 2:20 - 2:25
    אז במילים אחרות, במשותף כחברה,
  • 2:25 - 2:27
    אנחנו מאוד עיוורים,
  • 2:27 - 2:30
    כי המכונות החכמות ביותר שלנו
    עדיין עיוורות.
  • 2:32 - 2:34
    אתם יכולים לשאול -
    "למה זה כל כך קשה?"
  • 2:34 - 2:37
    מצלמות יכולות לקחת תמונות כמו זו,
  • 2:37 - 2:41
    על ידי המרת אורות לשטח דו מימדי של מספרים,
  • 2:41 - 2:43
    הידועים כפיקסלים,
  • 2:43 - 2:45
    אבל אלו רק מספרים חסרי חיים.
  • 2:45 - 2:48
    הם לא נושאים איזושהי משמעות בעצמם.
  • 2:48 - 2:52
    כמו שלשמוע זה לא אותו דבר כמו להקשיב,
  • 2:52 - 2:57
    לקחת תמונות זה לא אותו דבר כמו לראות,
  • 2:57 - 3:00
    ובלראות, אנחנו למעשה מתכוונים ללהבין.
  • 3:01 - 3:07
    למעשה, זה לקח לאימא טבע
    540 מיליון שנים של עבודה קשה
  • 3:07 - 3:09
    לעשות את המשימה הזו,
  • 3:09 - 3:11
    והרבה מהמאמץ הזה
  • 3:11 - 3:17
    הלך על פיתוח מנגנון
    העיבוד החזותי של המוח שלנו,
  • 3:17 - 3:19
    לא העיניים עצמן.
  • 3:19 - 3:22
    אז ראייה מתחילה בעיניים,
  • 3:22 - 3:26
    אבל באמת מתרחשת במוח.
  • 3:26 - 3:31
    אז במשך 15 שנים האחרונות,
    מהדוקטורט שלי במכון הטכנולוגי של קליפורניה
  • 3:31 - 3:34
    ואז הובלת מעבדת הראייה בסטנפורד,
  • 3:34 - 3:39
    אני עובדת עם המורים הרוחניים שלי,
    משתפי פעולה וסטודנטים,
  • 3:39 - 3:42
    ללמד מחשבים לראות.
  • 3:43 - 3:46
    תחום המחקר שלנו נקרא -
    ראייה ממוחשבת ולמידת מכונה.
  • 3:46 - 3:50
    זה חלק מתחום כללי יותר
    של אינטלגנציה מלאכותית.
  • 3:51 - 3:56
    אז בסופו של דבר, אנחנו רוצים
    ללמד את המכונות לראות כמו שאנחנו רואים:
  • 3:56 - 4:02
    לנקוב בשמות של אובייקטים, לזהות אנשים,
    להסיק גיאומטרית תלת מימדית של דברים,
  • 4:02 - 4:08
    להבין קשרים, רגשות, פעולות וכוונות.
  • 4:08 - 4:14
    אתם ואני רוקמים ביחד
    סיפורים שלמים של אנשים, מקומות ודברים
  • 4:14 - 4:16
    ברגע שאנחנו מניחים עליהם את המבט שלנו.
  • 4:17 - 4:23
    הצעד הראשון לכיוון המטרה הזו
    הוא ללמד מחשב לראות חפצים,
  • 4:23 - 4:26
    אבן הבניין של העולם החזותי.
  • 4:26 - 4:30
    במונחים הכי פשוטים,
    דמיינו את תהליך הלמידה הזה
  • 4:30 - 4:33
    כלהראות למחשבים
    כמה תמונות אימון של אובייקט מסוים,
  • 4:33 - 4:37
    בואו נאמר חתולים,
  • 4:37 - 4:41
    ועיצוב מודל שילמד מתמונות האימון האלו.
  • 4:41 - 4:43
    כמה קשה זה כבר יכול להיות?
  • 4:43 - 4:47
    אחרי הכל, חתול הוא פשוט
    אוסף של צורות וצבעים,
  • 4:47 - 4:52
    וזה מה שאנחנו עשינו בימים הראשונים
    של שימוש כמודל תיאורטי באובייקטים.
  • 4:52 - 4:55
    היינו אומרים לאלגוריתם של המחשב
    בשפה מתמטית
  • 4:55 - 4:59
    שהפנים של חתול הן עגולות,
    גוף שמנמן,
  • 4:59 - 5:01
    שני אוזניים מחודדות, זנב ארוך,
  • 5:01 - 5:02
    וזה היה נראה בסדר גמור.
  • 5:03 - 5:05
    אבל מה עם החתול הזה?
  • 5:05 - 5:06
    (צחוק)
  • 5:06 - 5:08
    הוא כולו מכורבל.
  • 5:08 - 5:12
    עכשיו צריך להוסיף עוד צורה ונקודת מבט
    למודל האובייקט.
  • 5:12 - 5:14
    אבל מה אם חתולים מתחבאים?
  • 5:15 - 5:17
    מה עם החתולים המטופשים האלו?
  • 5:19 - 5:22
    עכשיו אתם מתחילים להבין את הנקודה שלי.
  • 5:22 - 5:25
    אפילו משהו פשוט כמו חיית מחמד ביתית
  • 5:25 - 5:29
    יכול להציג אינסוף צורות למודל של אובייקט,
  • 5:29 - 5:32
    וזה רק אובייקט אחד.
  • 5:33 - 5:35
    אז לפני 8 שנים בערך,
  • 5:35 - 5:40
    הסתכלות מאוד פשוטה ומעמיקה
    שינתה את המחשבה שלי.
  • 5:41 - 5:44
    אף אחד לא אומר לילד איך לראות,
  • 5:44 - 5:46
    במיוחד לא בשנים המוקדמות.
  • 5:46 - 5:51
    הם לומדים דרך הנסיון
    בעולם האמיתי ודוגמאות.
  • 5:51 - 5:54
    אם תתייחסו לעיניים של ילד
  • 5:54 - 5:57
    כזוג מצלמות ביולוגיות
  • 5:57 - 6:01
    הן לוקחות תמונה אחת
    בערך כל 200 אלפיות השנייה,
  • 6:01 - 6:04
    הזמן הממוצע של תנועת עין.
  • 6:04 - 6:10
    אז עד גיל שלוש, ילד יראה
    מאות מיליוני תמונות
  • 6:10 - 6:11
    של העולם האמיתי.
  • 6:11 - 6:14
    זה הרבה דוגמאות אימון.
  • 6:14 - 6:20
    אז במקום להתרכז אך ורק על אלגוריתמים
    טובים יותר ויותר,
  • 6:20 - 6:26
    התובנה שלי היתה לתת לאלגוריתמים
    את סוג מידע האימון
  • 6:26 - 6:29
    שילד מקבל דרך ניסיון
  • 6:29 - 6:33
    גם בכמות וגם באיכות.
  • 6:33 - 6:35
    ברגע שאנחנו יודעים את זה,
  • 6:35 - 6:38
    ידענו שאנחנו צריכים לאסוף מערכת מידע
  • 6:38 - 6:42
    שיש בה הרבה יותר תמונות
    ממה שהיו לנו אי פעם,
  • 6:42 - 6:45
    אולי פי כמה אלפים יותר,
  • 6:45 - 6:49
    ויחד עם פרופסור קאי לי
    מאוניברסיטת פרינסטון,
  • 6:49 - 6:54
    התחלנו את פרוייקט אימג'נט ב-2007.
  • 6:54 - 6:57
    למזלנו, לא היינו צריכים לשים
    מצלמה על ראשינו
  • 6:57 - 6:59
    ולחכות הרבה שנים.
  • 6:59 - 7:01
    ניגשנו לאינטרנט,
  • 7:01 - 7:05
    האוצר הגדול ביותר של תמונות
    שהאדם יצר אי פעם.
  • 7:05 - 7:08
    הורדנו כמעט מיליארד תמונות
  • 7:08 - 7:14
    והשתמשנו בפעילות של הציבור הרחב
    כמו הפלטפורמת המכניקל טורק של אמזון
  • 7:14 - 7:16

    כדי לעזור לנו לתייג את התמונות האלו.
  • 7:16 - 7:21
    בשיאו, אימג'נט היה אחד המעסיקים הגדולים
  • 7:21 - 7:24
    של פלטפורמת טורק של אמזון:
  • 7:24 - 7:28
    ביחד, כמעט 50,000 עובדים
  • 7:28 - 7:32
    מ-167 מדינות מסביב לעולם
  • 7:32 - 7:36
    עזרו לנו לנקות, לסדר ולתייג
  • 7:36 - 7:40
    כמעט מיליארד תמונות מועמדות.
  • 7:41 - 7:43
    זה כמה מאמץ נדרש
  • 7:43 - 7:47
    כדי ללכוד שבריר מיכולת הדימוי
  • 7:47 - 7:51
    שמוח של ילד מסוגל לעשות
    בשנות ההתפתחות המוקדמות.
  • 7:52 - 7:56
    בדיעבד, הרעיון להשתמש בביג דאטה
  • 7:56 - 8:01
    בשביל לאמן אלגוריתם של מחשב
    נראה אולי ברור עכשיו,
  • 8:01 - 8:05
    אבל ב-2007, זה לא היה כזה ברור.
  • 8:05 - 8:09
    היינו יחסית לבד במסע הזה למשך זמן לא קצר.
  • 8:09 - 8:14
    כמה עמיתים ידידותיים הציעו לי לעשות משהו
    שימושי יותר בשביל הקביעות שלי,
  • 8:14 - 8:18
    והיינו נאבקים כל הזמן על תקציבי מחקר.
  • 8:18 - 8:20
    פעם אחת, התבדחתי
    עם הסטודנטים שלי לתואר שני
  • 8:20 - 8:24
    שאני פשוט אפתח מחדש את החנות
    לניקוי יבש שלי כדי לממן את אימג'נט.
  • 8:24 - 8:29
    אחרי הכל, ככה מימנתי את שנות הלימודים שלי.
  • 8:29 - 8:31
    אז המשכנו.
  • 8:31 - 8:35
    ב-2009, פרוייקט אימג'נט סיפק
  • 8:35 - 8:39
    בסיס נתונים של 15 מיליון תמונות
  • 8:39 - 8:44
    לרוחב 22,000 סוגי אובייקטים ודברים
  • 8:44 - 8:47
    מאורגנים לפי שפה אנגלית יומיומית.
  • 8:47 - 8:50
    גם בכמות וגם באיכות,
  • 8:50 - 8:53
    זה היה קנה מידה חסר תקדים.
  • 8:53 - 8:56
    כדוגמא, במקרה של חתולים,
  • 8:56 - 8:59
    יש לנו יותר מ-62,000 חתולים
  • 8:59 - 9:03
    בכל מיני מראות ותנוחות
  • 9:03 - 9:08
    ועל פני כל המינים של
    חתולים ביתיים ופראיים.
  • 9:08 - 9:12
    היינו נרגשים להרכיב את אימג'נט,
  • 9:12 - 9:16
    ורצינו שכל עולם המחקר ירוויח ממנו,
  • 9:16 - 9:20
    אז ברוח TED, פתחנו את כל
    מערכת הנתונים שלנו
  • 9:20 - 9:23
    לקהילת המחקר ברחבי העולם בחינם.
  • 9:25 - 9:29
    (מחיאות כפיים)
  • 9:29 - 9:34
    עכשיו כשיש לנו את הנתונים להזין
    במוח הממוחשב שלנו,
  • 9:34 - 9:38
    אנחנו מוכנים לחזור לאלגוריתמים עצמם.
  • 9:38 - 9:43
    כפי שהתברר, עושר המידע
    שסופק על ידי אימג'נט
  • 9:43 - 9:48
    היה התאמה מושלמת לסוג מסויים
    של אלגוריתמים ללמידת מכונה
  • 9:48 - 9:50
    הנקראים רשת עצבים מורכבת,
  • 9:50 - 9:55
    שפרצו דרך על ידי
    קוניהיקו פוקושימה, ג'ף הינטון ויאן לה-קון
  • 9:55 - 9:59
    בשנות ה-70 וה-80.
  • 9:59 - 10:05
    בדיוק כמו שהמוח מכיל מיליארדי נוירונים
    המחוברים היטב,
  • 10:05 - 10:08
    יחידת הפעלה בסיסית ברשת הנויראלית
  • 10:08 - 10:11
    היא הצומת מנתב המידע דמוי נוירון.
  • 10:11 - 10:13
    הוא מקבל מידע מצמתים אחרים
  • 10:13 - 10:16
    ושולח אותם לאחרים.
  • 10:16 - 10:21
    יתרה מזו, מאות אלפי
    או אולי אפילו מיליוני הצמתים
  • 10:21 - 10:24
    מאורגנים בשכבות היררכיות,
  • 10:24 - 10:27
    גם כן בדומה למוח.
  • 10:27 - 10:31
    ברשת נויראלית טיפוסית אנו משתמשים
    כדי לאמן את המודל זיהוי האובייקטים שלנו,
  • 10:31 - 10:35
    יש בו 24 מיליון צמתים,
  • 10:35 - 10:38
    140 מיליון משתנים,
  • 10:38 - 10:41
    ו-15 מיליארד קשרים.
  • 10:41 - 10:43
    זה מודל ענק.
  • 10:43 - 10:47
    המונע על ידי מידע נתונים עצום מאימג'נט
  • 10:47 - 10:52
    ויחידות העיבוד המרכזיות והמעבדים הגרפיים
    לאימון מודל כזה כביר,
  • 10:52 - 10:55
    הרשת הנויראלית המורכבת
  • 10:55 - 10:58
    פרחה בצורה שאף אחד לא ציפה לה.
  • 10:58 - 11:01
    זה הפך להיות הארכיטקטורה המנצחת
  • 11:01 - 11:06
    ביצירת תוצאות חדשות ומרגשות
    בזיהוי אובייקטים.
  • 11:06 - 11:09
    זה מחשב שאומר לנו
  • 11:09 - 11:11
    שהתמונה הזו מכילה חתול
  • 11:11 - 11:13
    ואיפה נמצא החתול.
  • 11:13 - 11:15
    כמובן שיש יותר דברים מחתולים,
  • 11:15 - 11:18
    אז הנה אלגוריתם של מחשב אומר לנו
  • 11:18 - 11:21
    שהתמונה מכילה ילד ובובת דובי;
  • 11:21 - 11:25
    כלב, אדם, ועפיפון קטן ברקע;
  • 11:25 - 11:28
    או תמונה של דברים מאוד עסוקים
  • 11:28 - 11:33
    כמו איש, סקייטבורד, מעקות,
    עמוד תאורה וכן הלאה.
  • 11:33 - 11:38
    לפעמים, כשהמחשב לא בטוח לגמרי
    במה שהוא רואה,
  • 11:39 - 11:42
    לימדנו אותו להיות חכם מספיק
  • 11:42 - 11:46
    כדי לתת לנו תשובה בטוחה
    במקום להתחייב יותר מדי,
  • 11:46 - 11:48
    בדיוק כמו שאנחנו היינו עושים,
  • 11:48 - 11:53
    אבל בפעמים אחרות האלגוריתם הממוחשב שלנו
    מצויין בלהגיד לנו
  • 11:53 - 11:55
    מה בדיוק הם האובייקטים,
  • 11:55 - 11:59
    כמו היצרן, המודל והשנה של מכוניות.
  • 11:59 - 12:04
    יישמנו את האלגוריתם הזה למיליוני תמונות
    של מפת הרחובות של גוגל
  • 12:04 - 12:07
    במאות ערים אמריקניות,
  • 12:07 - 12:10
    ולמדנו משהו מאוד מעניין:
  • 12:10 - 12:14
    דבר ראשון, זה אימת את הידע הנפוץ
  • 12:14 - 12:17
    שמחירי מכוניות נמצאים בקשר ישיר
  • 12:17 - 12:19
    להכנסות משק הבית.
  • 12:19 - 12:24
    אבל באופן מפתיע, מחירי המכוניות
    נמצאים בקשר ישיר
  • 12:24 - 12:26
    עם רמת הפשע בערים,
  • 12:27 - 12:31
    או תבנית הצבעות על פי מיקודים.
  • 12:32 - 12:34
    אז רגע. זה הכל?
  • 12:34 - 12:39
    האם המחשב השווה או אפילו עקף
    את היכולות האנושיות?
  • 12:39 - 12:42
    לא כל כך מהר.
  • 12:42 - 12:46
    עד עכשיו, אנחנו רק לימדנו את המחשב
    לראות אובייקטים.
  • 12:46 - 12:51
    זה כמו שילד קטן לומד לבטא מספר
    שמות עצם.
  • 12:51 - 12:54
    זה הישג מדהים,
  • 12:54 - 12:56
    אבל זה רק הצעד הראשון.
  • 12:56 - 13:00
    בקרוב, עוד אבן דרך התפתחותית תושג,
  • 13:00 - 13:03
    וילדים מתחילים לתקשר במשפטים.
  • 13:03 - 13:08
    אז במקום להגיד - זה חתול בתמונה,
  • 13:08 - 13:13
    כבר שמעתם את הילדה הקטנה אומרת לנו
    שזה חתול ששוכב על מיטה.
  • 13:13 - 13:18
    אז ללמד מחשב לראות תמונה
    ולייצר משפטים,
  • 13:18 - 13:22
    הנישואים בין ביג דאטה
    לאלגוריתם לימוד מכונה
  • 13:22 - 13:25
    צריכים לקחת עוד צעד.
  • 13:25 - 13:29
    עכשיו, המחשב צריך ללמוד משתי התמונות
  • 13:29 - 13:32
    כמו גם ממשפטים טבעיים בשפה
  • 13:32 - 13:35
    שנוצרים על ידי בני אדם.
  • 13:35 - 13:39
    בדיוק כמו שהמוח מייצר ראייה ושפה,
  • 13:39 - 13:44
    אנחנו פיתחנו מודל שמקשר חלקים
    של דברים ויזואלים
  • 13:44 - 13:46
    כמו מקטעים קצרים
  • 13:46 - 13:50
    עם מילים וביטויים במשפטים.
  • 13:50 - 13:53
    לפני ארבעה חודשים בערך,
  • 13:53 - 13:56
    סוף סוף קשרנו את כל זה ביחד
  • 13:56 - 13:59
    ויצרנו את אחד ממודלי
    הראייה הממוחשבת הראשונים
  • 13:59 - 14:03
    שמסוגלים לייצר משפט בדומה לאדם
  • 14:03 - 14:07
    כאשר הוא רואה תמונה בפעם הראשונה.
  • 14:07 - 14:12
    עכשיו, אני מוכנה להראות לכם
    מה המחשב אומר
  • 14:12 - 14:14
    כשהוא רואה את התמונה
  • 14:14 - 14:17
    שהילדה הקטנה ראתה בתחילת השיחה הזו.
  • 14:20 - 14:23
    (וידאו) מחשב: איש עומד ליד פיל.
  • 14:24 - 14:28
    מטוס גדול עומד על מסלול טיסה.
  • 14:29 - 14:33
    פיי פיי: כמובן, אנחנו עדיין עובדים קשה
    כדי לשפר את האלגוריתמים שלנו,
  • 14:33 - 14:36
    ועדיין יש לו הרבה ללמוד.
  • 14:36 - 14:38
    (מחיאות כפיים)
  • 14:40 - 14:43
    והמחשב עדיין עושה טעויות.
  • 14:43 - 14:46
    (וידאו) מחשב: חתול שוכב על מיטה בשמיכה.
  • 14:46 - 14:49
    פיי פיי: אז כמובן, כשהוא רואה
    יותר מדי חתולים,
  • 14:49 - 14:52
    הוא חושב שהכל יכול להיראות כמו חתול.
  • 14:53 - 14:56
    (וידאו) מחשב: ילד צעיר מחזיק אלת בייסבול.
  • 14:56 - 14:58
    (צחוק)
  • 14:58 - 15:03
    פיי פיי: או אם הוא לא ראה מברשת שיניים,
    הוא מבלבל את זה עם אלת בייסבול.
  • 15:03 - 15:07
    (וידאו) מחשב: איש רוכב על סוס
    במורד הרחוב ליד בניין.
  • 15:07 - 15:09
    (צחוק)
  • 15:09 - 15:12
    פיי פיי: לא לימדנו את המחשבים
    מבוא לאומנות.
  • 15:14 - 15:17
    (וידאו) מחשב: זברה עומדת בשדה עשב.
  • 15:17 - 15:20
    פיי פיי: והוא לא למד להעריך
    את היופי המדהים של הטבע
  • 15:20 - 15:22
    כמוני וכמוכם.
  • 15:22 - 15:25
    אז עדיין יש לו דרך ארוכה.
  • 15:25 - 15:30
    להגיע מגיל אפס לשלוש היה קשה.
  • 15:30 - 15:35
    האתגר האמיתי הוא להגיע
    משלוש לשלוש עשרה ומעבר לזה.
  • 15:35 - 15:39
    תרשו לי להזכיר לכם עם התמונה
    של הילד והעוגה שוב.
  • 15:39 - 15:44
    עד עכשיו, לימדנו את המחשב לראות אובייקטים
  • 15:44 - 15:48
    או אפילו לספר לנו סיפור פשוט
    כשהוא רואה תמונה.
  • 15:48 - 15:52
    (וידאו) מחשב: אדם יושב ליד שולחן עם עוגה.
  • 15:52 - 15:54
    פיי פיי: אבל יש עוד כל כך הרבה בתמונה הזו
  • 15:54 - 15:56
    מאשר רק אדם ועוגה.
  • 15:56 - 16:01
    מה שהמחשב לא רואה זה שזו
    עוגה איטלקית מיוחדת
  • 16:01 - 16:04
    שמוגשת רק בחג הפסחא.
  • 16:04 - 16:07
    הילד לובש את החולצה האהובה עליו
  • 16:07 - 16:11
    שניתנה לו על ידי אביו אחרי טיול בסידני,
  • 16:11 - 16:15
    ואתם ואני יכוים להגיד כמה מאושר הוא
  • 16:15 - 16:18
    ומה בדיוק הוא חושב ברגע הזה.
  • 16:19 - 16:22
    זה בני ליאו.
  • 16:22 - 16:25
    במסע שלי לאינטלגנציה חזותית,
  • 16:25 - 16:27
    אני כל הזמן חושבת על ליאו
  • 16:27 - 16:30
    ועל העולם העתידי בו הוא יחיה.
  • 16:30 - 16:32
    כשמכונות יכולות לראות,
  • 16:32 - 16:37
    לרופאים ואחיות יהיה עוד זוג עיניים
    שלא מתעייפות
  • 16:37 - 16:41
    כדי לעזור להם לאבחן ולדאוג למטופלים.
  • 16:41 - 16:45
    מכוניות ינועו
    בצורה חכמה יותר ובטוחה יותר בדרכים.
  • 16:45 - 16:48
    רובוטים, לא רק בני אדם,
  • 16:48 - 16:53
    יעזרו לנו לעמוד בגבורה באזורי אסון
    ולהציל את הלכודים והפצועים.
  • 16:54 - 16:58
    אנחנו נגלה מינים חדשים,
    חומרים טובים יותר,
  • 16:58 - 17:02
    ונחקור גבולות חדשים
    עם עזרה של המכונות.
  • 17:03 - 17:07
    לאט לאט, אנחנו נותנים יכולת ראייה למכונות.
  • 17:07 - 17:10
    קודם כל, אנחנו מלמדים אותם לראות.
  • 17:10 - 17:13
    לאחר מכן, הם יעזרו לנו לראות טוב יותר.
  • 17:13 - 17:17
    בפעם הראשונה, העיניים האנושיות
    לא יהיו העיניים היחידות
  • 17:17 - 17:20
    שמהרהרות וחוקרות את העולם.
  • 17:20 - 17:23
    אנחנו לא רק נשתמש במכונות
    בשביל האינטליגנציה שלהם,
  • 17:23 - 17:30
    אנחנו גם נשתף איתן פעולה בדרכים
    שאנחנו אפילו לא יכולים לדמיין.
  • 17:30 - 17:32
    זה המסע שלי:
  • 17:32 - 17:34
    לתת למחשבים תבונה חזותית
  • 17:34 - 17:40
    וליצור עתיד טוב יותר
    בשביל ליאו ובשביל העולם.
  • 17:40 - 17:41
    תודה רבה.
  • 17:41 - 17:45
    (מחיאות כפיים)
Title:
איך אנחנו מלמדים מחשבים להבין תמונות
Speaker:
פיי-פיי לי
Description:

כשילדה קטנה מסתכלת על תמונה, היא יכולה לזהות אלמנטים פשוטים: "חתול", "ספר", "כיסא".
עכשיו, מחשבים נהיים חכמים מספיק לעשות את זה גם. מה השלב הבא? בשיחה מרתקת, המומחית לראיית מחשב פיי-פיי לי מתארת את החדשות האחרונות ביותר - כולל מאגר נתונים של 15 מיליון תמונות שהצוות שלה בנה כדי "ללמד" מחשב להבין תמונות - והתובנות המרכזיות שעוד יגיעו בעתיד.

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
17:58

Hebrew subtitles

Revisions