Return to Video

כיצד בניתי מכונת זמן של מידע

  • 0:00 - 0:03
    זוהי תמונת כדור-הארץ.
  • 0:03 - 0:06
    היא מאוד דומה לתמונות מהחללית אפולו
  • 0:06 - 0:08
    המוכרות לכולם.
  • 0:08 - 0:10
    אבל יש הבדל;
  • 0:10 - 0:11
    ניתן להקליק עליה,
  • 0:11 - 0:13
    ואם עושים זאת,
  • 0:13 - 0:16
    מקבלים זום על כמעט כל אזור בעולם.
  • 0:16 - 0:18
    לדוגמא, זהו מבט ממעוף ציפור
  • 0:18 - 0:20
    על קמפוס ה- EPFL.
  • 0:20 - 0:22
    במקרים רבים, ניתן גם לראות
  • 0:22 - 0:26
    כיצד בניין מסויים נראה מהרחוב ליד.
  • 0:26 - 0:28
    זה די מדהים.
  • 0:28 - 0:31
    אבל משהו חסר בסיור מופלא זה:
  • 0:31 - 0:33
    הזמן חסר.
  • 0:33 - 0:36
    איני בטוח מתי תמונה זו צולמה.
  • 0:36 - 0:38
    איני אפילו בטוח
  • 0:38 - 0:44
    שהיא צולמה באותו זמן
    של המבט ממעוף הציפור.
  • 0:44 - 0:46
    במעבדה שלנו, אנו מפתחים כלים
  • 0:46 - 0:48
    למסע לא רק במרחב
  • 0:48 - 0:50
    אלא גם בזמן.
  • 0:50 - 0:52
    השאלה שאנו שואלים היא:
  • 0:52 - 0:54
    האם ניתן לבנות משהו
  • 0:54 - 0:56
    כמו מפות גוגל של העבר?
  • 0:56 - 0:59
    האם ניתן להוסיף כפתור בראש מפות גוגל
  • 0:59 - 1:01
    ולשנות באמצעותו את השנה,
  • 1:01 - 1:03
    כדי לראות כיצד זה היה לפני 100 שנה,
  • 1:03 - 1:04
    לפני 1,000 שנה?
  • 1:04 - 1:06
    האם זה אפשרי?
  • 1:06 - 1:09
    האם ניתן לשחזר רשתות חברתיות מן העבר?
  • 1:09 - 1:12
    האם ניתן ליצור פייסבוק של ימי-הביניים?
  • 1:12 - 1:16
    האם ניתן לבנות מכונות זמן?
  • 1:16 - 1:18
    אולי אפשר פשוט לומר,
    "לא, זה בלתי אפשרי."
  • 1:18 - 1:22
    או שאולי ניתן לחשוב
    על כך מנקודת מבט של מידע.
  • 1:22 - 1:25
    לזה אני קורא פטריית המידע.
  • 1:25 - 1:27
    אנכית, זה הזמן.
  • 1:27 - 1:29
    אופקית, כמות המידע הדיגיטלי הזמין.
  • 1:29 - 1:33
    ברור שב-10 השנים האחרונות,
    יש לנו המון מידע.
  • 1:33 - 1:36
    וברור שככל שאנו נעים אל העבר,
    יש פחות מידע.
  • 1:36 - 1:39
    אם ברצוננו לבנות משהו
    כמו מפות גוגל של העבר,
  • 1:39 - 1:40
    או פייסבוק של העבר,
  • 1:40 - 1:42
    עלינו להגדיל מרחב זה,
  • 1:42 - 1:44
    עלינו להפכו לצורת מלבן.
  • 1:44 - 1:45
    כיצד עושים זאת?
  • 1:45 - 1:47
    דרך אחת היא דיגיטליזציה.
  • 1:47 - 1:49
    יש המון חומר זמין --
  • 1:49 - 1:55
    עיתונים, ספרים,
    אלפי ספרים.
  • 1:55 - 1:57
    ניתן להפכם לדיגיטליים.
  • 1:57 - 2:00
    ניתן לשלוף מהם מידע.
  • 2:00 - 2:04
    ברור שככל שנעים אל העבר,
    נקבל פחות נתונים.
  • 2:04 - 2:06
    לכן זה עלול שלא להספיק.
  • 2:06 - 2:09
    אז אפשר לעשות מה שהיסטוריונים עושים.
  • 2:09 - 2:10
    לעשות אקסטרפולציה.
  • 2:10 - 2:15
    לזה אנו קוראים, במדעי המחשב, הדמיה.
  • 2:15 - 2:16
    אם אני לוקח יומן,
  • 2:16 - 2:19
    אני יכול להחשיבו לא רק בתור יומן
  • 2:19 - 2:22
    של רב-חובל ונציאני המפליג למסע מסויים.
  • 2:22 - 2:23
    אני יכול להחשיבו בתור יומן
  • 2:23 - 2:26
    המייצג הרבה הפלגות של אותה תקופה.
  • 2:26 - 2:28
    אני עושה אקסטרפולציה.
  • 2:28 - 2:30
    אם יש ציור של חזית מבנה,
  • 2:30 - 2:33
    אני יכול להחשיבו לא רק ככזה השייך
  • 2:33 - 2:37
    למבנה מסויים, אלא ככזה המייצג שיטת בניה
  • 2:37 - 2:41
    של מבנים אחרים שאין לנו מידע עליהם.
  • 2:41 - 2:44
    לכן אם ברצוננו לבנות מכונת זמן,
  • 2:44 - 2:45
    דרושים לנו שני דברים.
  • 2:45 - 2:47
    אנו זקוקים למאגרי נתונים מאוד גדולים,
  • 2:47 - 2:50
    ואנו זקוקים למומחים מצטיינים.
  • 2:50 - 2:52
    מכונת הזמן הונציאנית,
  • 2:52 - 2:54
    המיזם שאני עומד לדבר עליו,
  • 2:54 - 2:57
    הוא מיזם משותף בין ה-EPFL
  • 2:57 - 3:00
    ואוניברסיטת Venice Ca'Foscari.
  • 3:00 - 3:02
    יש דבר אחד מאוד מיוחד בונציה,
  • 3:02 - 3:05
    והוא שהממסד שם היה תמיד
  • 3:05 - 3:07
    מאוד ייקה.
  • 3:07 - 3:09
    הם שמרו שם הכל,
  • 3:09 - 3:12
    כמעט כמו גוגל היום.
  • 3:12 - 3:13
    ב- Archivio di Stato,
  • 3:13 - 3:15
    יש 80 ק"מ של ארכיונים
  • 3:15 - 3:17
    המתעדים כל אספקט של החיים
  • 3:17 - 3:19
    בונציה במשך יותר מ-1,000 שנה.
  • 3:19 - 3:21
    יש רישום של כל ספינה שהפליגה,
  • 3:21 - 3:22
    כל ספינה שנכנסת.
  • 3:22 - 3:25
    של כל שינוי שבוצע בעיר.
  • 3:25 - 3:29
    הכל מתועד שם.
  • 3:29 - 3:32
    אנו מתחילים מיזם דיגיטליזציה בן 10 שנים
  • 3:32 - 3:34
    שמטרתו להפוך את
  • 3:34 - 3:35
    הארכיון הכביר הזה
  • 3:35 - 3:38
    למאגר מידע ענקי.
  • 3:38 - 3:40
    היעד שאנו רוצים
  • 3:40 - 3:45
    להגיע אליו זה 450 ספרים
    ביום שיעברו דיגיטליזציה.
  • 3:45 - 3:47
    אבל ברור שזה לא מספיק
    לעשות דיגיטליזציה,
  • 3:47 - 3:48
    כי מסמכים הללו,
  • 3:48 - 3:51
    ברובם הם בלטינית, טוסקנית,
  • 3:51 - 3:52
    בניב ונציאני,
  • 3:52 - 3:54
    לכן צריך לתעתק אותם,
  • 3:54 - 3:56
    לתרגמם במקרים מסויימים,
  • 3:56 - 3:57
    למספר אותם,
  • 3:57 - 3:59
    וברור שכל זה לא קל.
  • 3:59 - 4:03
    במיוחד, השיטה המסורתית לזיהוי
    אופטי של אותיות, המשמשת
  • 4:03 - 4:04
    לכתבי-יד מודפסים,
  • 4:04 - 4:08
    אינה יעילה למסמכים הכתובים ביד.
  • 4:08 - 4:10
    הפיתרון לכך מגיע
  • 4:10 - 4:13
    מתחום אחר: זיהוי דיבור.
  • 4:13 - 4:15
    זה משהו שנראה בלתי אפשרי,
  • 4:15 - 4:18
    אבל בעצם ניתן להוציאו לפועל,
  • 4:18 - 4:20
    פשוט על-ידי הוספת אילוצים.
  • 4:20 - 4:22
    אם יש לנו דוגמה טובה
  • 4:22 - 4:23
    של השפה שבשימוש,
  • 4:23 - 4:25
    אם יש לנו דוגמה טובה של מסמך,
  • 4:25 - 4:27
    כלומר, אם הוא בנוי כהלכה.
  • 4:27 - 4:28
    ואלה הם מסמכים מנהלתיים.
  • 4:28 - 4:30
    ברוב המקרים הם בנויים כהלכה.
  • 4:30 - 4:33
    אם מחלקים את הארכיון
    הענקי הזה למרכיבי-משנה
  • 4:33 - 4:36
    בהם כל מרכיב כזה,
    יש לו תכונות הדומות לאחרים,
  • 4:36 - 4:39
    אז יש סיכוי להצליח.
  • 4:43 - 4:45
    אם מגיעים לשלב הזה, נתקלים בעוד משהו:
  • 4:45 - 4:49
    ניתן לשלוף ממסמך כזה אירועים.
  • 4:49 - 4:51
    קרוב לודאי ניתן לשלוף 10 מיליארד
  • 4:51 - 4:53
    אירועים מארכיון זה.
  • 4:53 - 4:55
    ניתן לחפש בתוך מערכת מידע
  • 4:55 - 4:56
    ענקית כזו בהמון דרכים.
  • 4:56 - 4:58
    ניתן לשאול שאלות כגון,
  • 4:58 - 5:01
    "מי חי במבנה מפואר זה ב-1,323?"
  • 5:01 - 5:03
    "כמה עלה דג דניס בשוק של
  • 5:03 - 5:05
    מחוז ריאלטו בשנת 1,434?"
  • 5:05 - 5:06
    "מה היתה משכורתו
  • 5:06 - 5:08
    של נפח זכוכית ב-Murano
  • 5:08 - 5:09
    במשך עשור?"
  • 5:09 - 5:11
    אפשר אף לשאול שאלות
  • 5:11 - 5:14
    יותר מורכבות כי המאגר יכיל הגדרות סמנטיות.
  • 5:14 - 5:16
    ואז מה שניתן יהיה
    לעשות זה לשים מידע במרחב,
  • 5:16 - 5:18
    כי הרבה מהמידע הוא מרחבי.
  • 5:18 - 5:20
    ומזה, ניתן לעשות דברים כמו
  • 5:20 - 5:22
    לשחזר את המסע יוצא-הדופן
  • 5:22 - 5:25
    של עיר מסויימת שהיה בה פיתוח מתמשך
  • 5:25 - 5:27
    במשך 1,000 שנה,
  • 5:27 - 5:29
    ושהצליחה במשך כל
  • 5:29 - 5:32
    אותה תקופה לשמור על איזון עם סביבתה.
  • 5:32 - 5:33
    ניתן לשחזר אותו מסע
  • 5:33 - 5:36
    ולצפות בו באופנים שונים.
  • 5:36 - 5:39
    אבל ברור שלא ניתן להבין
    את ונציה רק מתוך צפייה בעיר.
  • 5:39 - 5:41
    יש למקם אותה בהקשר אירופאי רחב.
  • 5:41 - 5:44
    לכן הרעיון הוא לתעד את כל הדברים
  • 5:44 - 5:46
    שהצליחו ברמה האירופאית.
  • 5:46 - 5:48
    אנו יכולים לשחזר גם את תולדות
  • 5:48 - 5:50
    האימפריה הימית של ונציה,
  • 5:50 - 5:54
    כיצד היא הלכה והשתלטה
    על אזור הים-האדריאטי,
  • 5:54 - 5:57
    כיצד היא הפכה לאימפריה
    הכי חזקה של ימי-הביניים
  • 5:57 - 5:59
    בתקופתה,
  • 5:59 - 6:01
    שולטת על מרבית הנתיבים הימיים
  • 6:01 - 6:04
    מהמזרח דרומה.
  • 6:05 - 6:08
    אבל ניתן לבצע עוד דברים אחרים,
  • 6:08 - 6:10
    כי בנתיבים הימיים הללו,
  • 6:10 - 6:12
    יש תבניות קבועות.
  • 6:12 - 6:14
    ניתן לעשות צעד נוסף
  • 6:14 - 6:17
    וממש ליצור מערכת הדמיה,
  • 6:17 - 6:19
    ליצור סימולטור של הים-התיכון
  • 6:19 - 6:22
    שיהיה מסוגל ממש לשחזר
  • 6:22 - 6:24
    אפילו את המידע שחסר,
  • 6:24 - 6:27
    דבר שיאפשר לנו לשאול שאלות
  • 6:27 - 6:30
    כאילו אנו משתמשים במתכנן מסלולי שיט.
  • 6:30 - 6:33
    "אם אני נמצא בקורפו ביוני 1,323
  • 6:33 - 6:36
    ורוצה להגיע לקונסטנטינופוליס (היום איסטנבול),
  • 6:36 - 6:38
    היכן אוכל לעלות לספינה?"
  • 6:38 - 6:39
    כנראה שנוכל לענות
  • 6:39 - 6:44
    על השאלה בדיוק של
    יום או יומיים או שלושה.
  • 6:44 - 6:45
    "כמה זה יעלה?"
  • 6:45 - 6:49
    "מה הסיכויים להיתקלות בשודדי-ים?"
  • 6:49 - 6:51
    אתם בטח מבינים
  • 6:51 - 6:53
    שהאתגר המדעי המרכזי במיזם כמו זה
  • 6:53 - 6:58
    הוא איפיון, כימות והצגה של אי-הודאות
  • 6:58 - 7:00
    וחוסר העקביות בכל שלב של התהליך.
  • 7:00 - 7:03
    ישנן שגיאות בכל מקום,
  • 7:03 - 7:06
    שגיאות במסמך,
    שם לא נכון של רב-החובל,
  • 7:06 - 7:09
    חלק מהספינות כלל לא הפליגו בים.
  • 7:09 - 7:14
    יש שגיאות בתרגום,
    הטיות בפרשנות,
  • 7:14 - 7:17
    ומעל הכל,
    אם מוסיפים עיבוד נתונים אלגוריתמי ממוחשב,
  • 7:17 - 7:20
    יהיו שגיאות בזיהוי,
  • 7:20 - 7:22
    שגיאות בשליפת מידע,
  • 7:22 - 7:26
    כך שהנתונים מאוד לא ודאיים.
  • 7:26 - 7:30
    אם כך, כיצד נוכל לאתר ולתקן אי-התאמות אלו?
  • 7:30 - 7:34
    כיצד ניתן לבטא חוסר ודאות כזו?
  • 7:34 - 7:36
    זה קשה. דבר אחד שאפשר לעשות
  • 7:36 - 7:38
    זה לתעד כל צעד בתהליך,
  • 7:38 - 7:41
    לא רק לתעד את המידע ההיסטורי,
  • 7:41 - 7:43
    אלא את מה שאנו מכנים
    נתוני המידע ההיסטורי,
  • 7:43 - 7:46
    כלומר כיצד המידע ההיסטורי בנוי,
  • 7:46 - 7:48
    תוך תיעוד כל שלב.
  • 7:48 - 7:50
    זה לא יבטיח שאנו
  • 7:50 - 7:52
    מתכנסים לעבר סיפור אחד ויחיד של ונציה.
  • 7:52 - 7:54
    אבל קרוב לודאי שנוכל לשחזר
  • 7:54 - 7:57
    סיפור מלא ומתועד אפשרי של ונציה.
  • 7:57 - 7:59
    אולי אין מפה אחת ויחידה.
  • 7:59 - 8:01
    אולי ישנן כמה מפות.
  • 8:01 - 8:03
    המערכת אמורה להרשות זאת,
  • 8:03 - 8:06
    מכיוון שעלינו להתמודד
    עם צורה חדשה של אי-ודאות,
  • 8:06 - 8:11
    שהיא באמת חדשה בסוג
    כזה של בסיס נתונים ענקי.
  • 8:11 - 8:13
    וכיצד עלינו להציג
  • 8:13 - 8:17
    מחקר זה לקהל הרחב?
  • 8:17 - 8:19
    שוב, ונציה היא חריגה.
  • 8:19 - 8:22
    עם מיליוני מבקרים הבאים אליה כל שנה,
  • 8:22 - 8:23
    זהו בעצם אחד המקומות
  • 8:23 - 8:26
    הטובים ביותר כדי לנסות
    להמציא את מוזיאון העתיד.
  • 8:26 - 8:30
    דמיינו שרואים אופקית את המפה המשוחזרת
  • 8:30 - 8:31
    של שנה מסויימת,
  • 8:31 - 8:34
    ואנכית רואים את המסמך ששימש
  • 8:34 - 8:35
    לשיחזור,
  • 8:35 - 8:39
    את האיורים, לדוגמא.
  • 8:39 - 8:41
    דמיינו מערכת היקפית תלת-מימדית
  • 8:41 - 8:45
    המאפשרת לצלול פנימה ולשחזר
    את ונציה של שנה מסויימת,
  • 8:45 - 8:48
    חוויה כלשהי שניתן לשתף בקבוצה.
  • 8:48 - 8:50
    ולהיפך, דמיינו שמתחילים
  • 8:50 - 8:52
    ממסמך, כתב-יד ונציאני,
  • 8:52 - 8:55
    ואתם מראים מה אפשר לבנות ממנו,
  • 8:55 - 8:57
    כיצד הוא מפוענח,
  • 8:57 - 8:59
    כיצד ניתן לשחזר את ההקשרים שבמסמך.
  • 8:59 - 9:01
    זוהי תמונה מתערוכה
  • 9:01 - 9:03
    המתקיימת כעת בג'נבה
  • 9:03 - 9:06
    בעזרת מערכת מהסוג הנ"ל.
  • 9:06 - 9:08
    לסיום, אפשר לומר
  • 9:08 - 9:11
    שהמחקר במדעי-הרוח עומד לעבור אבולוציה
  • 9:11 - 9:13
    שעשויה להידמות
  • 9:13 - 9:17
    למה שקרה במדעי-החיים לפני 30 שנה.
  • 9:17 - 9:22
    זו רק שאלה של מידה.
  • 9:22 - 9:25
    אנו רואים מיזמים שהם
  • 9:25 - 9:29
    מעבר ליכולת הביצוע של קבוצת מחקר בודדת,
  • 9:29 - 9:32
    וזה דבר באמת חדש בתחום של מדעי-הרוח,
  • 9:32 - 9:35
    שלעיתים קרובות
    רגילים לעבוד בהם
  • 9:35 - 9:39
    בקבוצות קטנות או רק עם
    מס' חוקרים בודדים ביחד.
  • 9:39 - 9:42
    כאשר מבקרים ב-Archivio di Stato,
  • 9:42 - 9:44
    חשים שזה משהו מעבר ליכולתה של קבוצה בודדת,
  • 9:44 - 9:48
    ושצריך להתקיים מאמץ משותף.
  • 9:48 - 9:51
    לכן מה שעלינו לעשות
    בשביל שינוי תפיסתי זה
  • 9:51 - 9:53
    הוא לטפח דור חדש של
  • 9:53 - 9:55
    "אנשי-רוח דיגיטליים"
  • 9:55 - 9:57
    שיהיו מוכנים לשינוי זה.
  • 9:57 - 9:59
    אני מאוד מודה לכם.
  • 9:59 - 10:03
    (מחיאות כפיים)
Title:
כיצד בניתי מכונת זמן של מידע
Speaker:
פרדריק קפלן
Description:

דמיינו שהייתם גולשים בפייסבוק.... מימי-הביניים. זה לא הזוי כפי שזה נשמע. בהרצאה מעניינת ומשעשעת, החוקר והמהנדס פרדריק קפלן מציג לראווה מכונת זמן ונציאנית -- מיזם לדיגיטליזציה של ספרים שאורכם הכולל 80 ק"מ כדי ליצור הדמיה היסטורית וגאוגרפית של ונציה לאורך תקופה של 1,000 שנה. (צולם ב-TEDxCaFoscariU.)

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
10:20

Hebrew subtitles

Revisions Compare revisions