1 00:00:00,285 --> 00:00:03,178 זוהי תמונת כדור-הארץ. 2 00:00:03,178 --> 00:00:06,271 היא מאוד דומה לתמונות מהחללית אפולו 3 00:00:06,271 --> 00:00:07,882 המוכרות לכולם. 4 00:00:07,882 --> 00:00:09,952 אבל יש הבדל; 5 00:00:09,952 --> 00:00:11,399 ניתן להקליק עליה, 6 00:00:11,399 --> 00:00:12,597 ואם עושים זאת, 7 00:00:12,597 --> 00:00:15,669 מקבלים זום על כמעט כל אזור בעולם. 8 00:00:15,669 --> 00:00:17,668 לדוגמא, זהו מבט ממעוף ציפור 9 00:00:17,668 --> 00:00:20,334 על קמפוס ה- EPFL. 10 00:00:20,334 --> 00:00:22,442 במקרים רבים, ניתן גם לראות 11 00:00:22,442 --> 00:00:26,182 כיצד בניין מסויים נראה מהרחוב ליד. 12 00:00:26,182 --> 00:00:27,604 זה די מדהים. 13 00:00:27,604 --> 00:00:31,031 אבל משהו חסר בסיור מופלא זה: 14 00:00:31,031 --> 00:00:33,219 הזמן חסר. 15 00:00:33,219 --> 00:00:36,289 איני בטוח מתי תמונה זו צולמה. 16 00:00:36,289 --> 00:00:37,701 איני אפילו בטוח 17 00:00:37,701 --> 00:00:43,784 שהיא צולמה באותו זמן של המבט ממעוף הציפור. 18 00:00:43,784 --> 00:00:45,993 במעבדה שלנו, אנו מפתחים כלים 19 00:00:45,993 --> 00:00:47,757 למסע לא רק במרחב 20 00:00:47,757 --> 00:00:50,315 אלא גם בזמן. 21 00:00:50,315 --> 00:00:52,185 השאלה שאנו שואלים היא: 22 00:00:52,185 --> 00:00:53,578 האם ניתן לבנות משהו 23 00:00:53,578 --> 00:00:55,756 כמו מפות גוגל של העבר? 24 00:00:55,756 --> 00:00:59,066 האם ניתן להוסיף כפתור בראש מפות גוגל 25 00:00:59,066 --> 00:01:00,869 ולשנות באמצעותו את השנה, 26 00:01:00,869 --> 00:01:02,660 כדי לראות כיצד זה היה לפני 100 שנה, 27 00:01:02,660 --> 00:01:04,329 לפני 1,000 שנה? 28 00:01:04,329 --> 00:01:06,452 האם זה אפשרי? 29 00:01:06,452 --> 00:01:08,704 האם ניתן לשחזר רשתות חברתיות מן העבר? 30 00:01:08,704 --> 00:01:11,753 האם ניתן ליצור פייסבוק של ימי-הביניים? 31 00:01:11,753 --> 00:01:15,529 האם ניתן לבנות מכונות זמן? 32 00:01:15,529 --> 00:01:18,094 אולי אפשר פשוט לומר, "לא, זה בלתי אפשרי." 33 00:01:18,094 --> 00:01:21,904 או שאולי ניתן לחשוב על כך מנקודת מבט של מידע. 34 00:01:21,904 --> 00:01:25,094 לזה אני קורא פטריית המידע. 35 00:01:25,094 --> 00:01:26,677 אנכית, זה הזמן. 36 00:01:26,677 --> 00:01:29,417 אופקית, כמות המידע הדיגיטלי הזמין. 37 00:01:29,417 --> 00:01:32,899 ברור שב-10 השנים האחרונות, יש לנו המון מידע. 38 00:01:32,899 --> 00:01:36,447 וברור שככל שאנו נעים אל העבר, יש פחות מידע. 39 00:01:36,447 --> 00:01:38,765 אם ברצוננו לבנות משהו כמו מפות גוגל של העבר, 40 00:01:38,765 --> 00:01:40,259 או פייסבוק של העבר, 41 00:01:40,259 --> 00:01:41,833 עלינו להגדיל מרחב זה, 42 00:01:41,833 --> 00:01:43,771 עלינו להפכו לצורת מלבן. 43 00:01:43,771 --> 00:01:45,281 כיצד עושים זאת? 44 00:01:45,281 --> 00:01:47,379 דרך אחת היא דיגיטליזציה. 45 00:01:47,395 --> 00:01:49,174 יש המון חומר זמין -- 46 00:01:49,190 --> 00:01:55,460 עיתונים, ספרים, אלפי ספרים. 47 00:01:55,460 --> 00:01:57,228 ניתן להפכם לדיגיטליים. 48 00:01:57,228 --> 00:01:59,965 ניתן לשלוף מהם מידע. 49 00:01:59,965 --> 00:02:03,508 ברור שככל שנעים אל העבר, נקבל פחות נתונים. 50 00:02:03,508 --> 00:02:06,154 לכן זה עלול שלא להספיק. 51 00:02:06,154 --> 00:02:08,562 אז אפשר לעשות מה שהיסטוריונים עושים. 52 00:02:08,562 --> 00:02:10,086 לעשות אקסטרפולציה. 53 00:02:10,086 --> 00:02:14,556 לזה אנו קוראים, במדעי המחשב, הדמיה. 54 00:02:14,556 --> 00:02:16,307 אם אני לוקח יומן, 55 00:02:16,307 --> 00:02:18,711 אני יכול להחשיבו לא רק בתור יומן 56 00:02:18,711 --> 00:02:21,683 של רב-חובל ונציאני המפליג למסע מסויים. 57 00:02:21,683 --> 00:02:23,326 אני יכול להחשיבו בתור יומן 58 00:02:23,326 --> 00:02:25,908 המייצג הרבה הפלגות של אותה תקופה. 59 00:02:25,908 --> 00:02:28,153 אני עושה אקסטרפולציה. 60 00:02:28,153 --> 00:02:30,191 אם יש ציור של חזית מבנה, 61 00:02:30,191 --> 00:02:32,942 אני יכול להחשיבו לא רק ככזה השייך 62 00:02:32,942 --> 00:02:36,874 למבנה מסויים, אלא ככזה המייצג שיטת בניה 63 00:02:36,874 --> 00:02:40,915 של מבנים אחרים שאין לנו מידע עליהם. 64 00:02:40,915 --> 00:02:43,773 לכן אם ברצוננו לבנות מכונת זמן, 65 00:02:43,773 --> 00:02:45,112 דרושים לנו שני דברים. 66 00:02:45,112 --> 00:02:47,346 אנו זקוקים למאגרי נתונים מאוד גדולים, 67 00:02:47,346 --> 00:02:50,088 ואנו זקוקים למומחים מצטיינים. 68 00:02:50,088 --> 00:02:51,962 מכונת הזמן הונציאנית, 69 00:02:51,962 --> 00:02:53,767 המיזם שאני עומד לדבר עליו, 70 00:02:53,767 --> 00:02:56,787 הוא מיזם משותף בין ה-EPFL 71 00:02:56,787 --> 00:02:59,765 ואוניברסיטת Venice Ca'Foscari. 72 00:02:59,765 --> 00:03:01,930 יש דבר אחד מאוד מיוחד בונציה, 73 00:03:01,930 --> 00:03:04,604 והוא שהממסד שם היה תמיד 74 00:03:04,604 --> 00:03:06,798 מאוד ייקה. 75 00:03:06,798 --> 00:03:08,991 הם שמרו שם הכל, 76 00:03:08,991 --> 00:03:11,906 כמעט כמו גוגל היום. 77 00:03:11,906 --> 00:03:13,420 ב- Archivio di Stato, 78 00:03:13,420 --> 00:03:15,184 יש 80 ק"מ של ארכיונים 79 00:03:15,184 --> 00:03:17,193 המתעדים כל אספקט של החיים 80 00:03:17,193 --> 00:03:19,439 בונציה במשך יותר מ-1,000 שנה. 81 00:03:19,439 --> 00:03:21,359 יש רישום של כל ספינה שהפליגה, 82 00:03:21,359 --> 00:03:22,435 כל ספינה שנכנסת. 83 00:03:22,435 --> 00:03:25,232 של כל שינוי שבוצע בעיר. 84 00:03:25,232 --> 00:03:28,523 הכל מתועד שם. 85 00:03:28,523 --> 00:03:32,431 אנו מתחילים מיזם דיגיטליזציה בן 10 שנים 86 00:03:32,431 --> 00:03:34,108 שמטרתו להפוך את 87 00:03:34,108 --> 00:03:35,492 הארכיון הכביר הזה 88 00:03:35,492 --> 00:03:37,918 למאגר מידע ענקי. 89 00:03:37,918 --> 00:03:39,775 היעד שאנו רוצים 90 00:03:39,775 --> 00:03:44,501 להגיע אליו זה 450 ספרים ביום שיעברו דיגיטליזציה. 91 00:03:44,501 --> 00:03:46,748 אבל ברור שזה לא מספיק לעשות דיגיטליזציה, 92 00:03:46,748 --> 00:03:48,035 כי מסמכים הללו, 93 00:03:48,035 --> 00:03:50,674 ברובם הם בלטינית, טוסקנית, 94 00:03:50,689 --> 00:03:52,204 בניב ונציאני, 95 00:03:52,204 --> 00:03:53,879 לכן צריך לתעתק אותם, 96 00:03:53,879 --> 00:03:55,560 לתרגמם במקרים מסויימים, 97 00:03:55,560 --> 00:03:56,680 למספר אותם, 98 00:03:56,680 --> 00:03:58,844 וברור שכל זה לא קל. 99 00:03:58,844 --> 00:04:02,688 במיוחד, השיטה המסורתית לזיהוי אופטי של אותיות, המשמשת 100 00:04:02,688 --> 00:04:04,112 לכתבי-יד מודפסים, 101 00:04:04,112 --> 00:04:08,116 אינה יעילה למסמכים הכתובים ביד. 102 00:04:08,116 --> 00:04:10,246 הפיתרון לכך מגיע 103 00:04:10,246 --> 00:04:13,147 מתחום אחר: זיהוי דיבור. 104 00:04:13,147 --> 00:04:15,202 זה משהו שנראה בלתי אפשרי, 105 00:04:15,202 --> 00:04:17,739 אבל בעצם ניתן להוציאו לפועל, 106 00:04:17,739 --> 00:04:19,933 פשוט על-ידי הוספת אילוצים. 107 00:04:19,933 --> 00:04:21,519 אם יש לנו דוגמה טובה 108 00:04:21,519 --> 00:04:23,045 של השפה שבשימוש, 109 00:04:23,045 --> 00:04:25,131 אם יש לנו דוגמה טובה של מסמך, 110 00:04:25,131 --> 00:04:26,563 כלומר, אם הוא בנוי כהלכה. 111 00:04:26,563 --> 00:04:27,916 ואלה הם מסמכים מנהלתיים. 112 00:04:27,931 --> 00:04:30,063 ברוב המקרים הם בנויים כהלכה. 113 00:04:30,063 --> 00:04:33,371 אם מחלקים את הארכיון הענקי הזה למרכיבי-משנה 114 00:04:33,371 --> 00:04:36,248 בהם כל מרכיב כזה, יש לו תכונות הדומות לאחרים, 115 00:04:36,248 --> 00:04:39,119 אז יש סיכוי להצליח. 116 00:04:42,761 --> 00:04:45,196 אם מגיעים לשלב הזה, נתקלים בעוד משהו: 117 00:04:45,196 --> 00:04:48,718 ניתן לשלוף ממסמך כזה אירועים. 118 00:04:48,718 --> 00:04:51,016 קרוב לודאי ניתן לשלוף 10 מיליארד 119 00:04:51,016 --> 00:04:52,947 אירועים מארכיון זה. 120 00:04:52,947 --> 00:04:54,671 ניתן לחפש בתוך מערכת מידע 121 00:04:54,671 --> 00:04:56,487 ענקית כזו בהמון דרכים. 122 00:04:56,487 --> 00:04:57,855 ניתן לשאול שאלות כגון, 123 00:04:57,855 --> 00:05:00,615 "מי חי במבנה מפואר זה ב-1,323?" 124 00:05:00,615 --> 00:05:02,837 "כמה עלה דג דניס בשוק של 125 00:05:02,837 --> 00:05:04,561 מחוז ריאלטו בשנת 1,434?" 126 00:05:04,561 --> 00:05:06,021 "מה היתה משכורתו 127 00:05:06,021 --> 00:05:08,066 של נפח זכוכית ב-Murano 128 00:05:08,066 --> 00:05:09,472 במשך עשור?" 129 00:05:09,472 --> 00:05:10,894 אפשר אף לשאול שאלות 130 00:05:10,894 --> 00:05:13,632 יותר מורכבות כי המאגר יכיל הגדרות סמנטיות. 131 00:05:13,632 --> 00:05:15,772 ואז מה שניתן יהיה לעשות זה לשים מידע במרחב, 132 00:05:15,772 --> 00:05:17,945 כי הרבה מהמידע הוא מרחבי. 133 00:05:17,945 --> 00:05:19,880 ומזה, ניתן לעשות דברים כמו 134 00:05:19,880 --> 00:05:21,993 לשחזר את המסע יוצא-הדופן 135 00:05:21,993 --> 00:05:25,349 של עיר מסויימת שהיה בה פיתוח מתמשך 136 00:05:25,349 --> 00:05:27,475 במשך 1,000 שנה, 137 00:05:27,475 --> 00:05:29,095 ושהצליחה במשך כל 138 00:05:29,095 --> 00:05:31,956 אותה תקופה לשמור על איזון עם סביבתה. 139 00:05:31,956 --> 00:05:33,204 ניתן לשחזר אותו מסע 140 00:05:33,204 --> 00:05:36,100 ולצפות בו באופנים שונים. 141 00:05:36,100 --> 00:05:38,799 אבל ברור שלא ניתן להבין את ונציה רק מתוך צפייה בעיר. 142 00:05:38,799 --> 00:05:41,195 יש למקם אותה בהקשר אירופאי רחב. 143 00:05:41,195 --> 00:05:44,016 לכן הרעיון הוא לתעד את כל הדברים 144 00:05:44,016 --> 00:05:46,439 שהצליחו ברמה האירופאית. 145 00:05:46,439 --> 00:05:48,403 אנו יכולים לשחזר גם את תולדות 146 00:05:48,403 --> 00:05:50,393 האימפריה הימית של ונציה, 147 00:05:50,393 --> 00:05:53,559 כיצד היא הלכה והשתלטה על אזור הים-האדריאטי, 148 00:05:53,559 --> 00:05:57,305 כיצד היא הפכה לאימפריה הכי חזקה של ימי-הביניים 149 00:05:57,305 --> 00:05:58,866 בתקופתה, 150 00:05:58,866 --> 00:06:01,038 שולטת על מרבית הנתיבים הימיים 151 00:06:01,038 --> 00:06:03,971 מהמזרח דרומה. 152 00:06:05,305 --> 00:06:07,621 אבל ניתן לבצע עוד דברים אחרים, 153 00:06:07,621 --> 00:06:09,898 כי בנתיבים הימיים הללו, 154 00:06:09,898 --> 00:06:11,873 יש תבניות קבועות. 155 00:06:11,889 --> 00:06:14,382 ניתן לעשות צעד נוסף 156 00:06:14,382 --> 00:06:16,502 וממש ליצור מערכת הדמיה, 157 00:06:16,502 --> 00:06:19,317 ליצור סימולטור של הים-התיכון 158 00:06:19,317 --> 00:06:21,910 שיהיה מסוגל ממש לשחזר 159 00:06:21,910 --> 00:06:24,112 אפילו את המידע שחסר, 160 00:06:24,112 --> 00:06:27,100 דבר שיאפשר לנו לשאול שאלות 161 00:06:27,100 --> 00:06:30,088 כאילו אנו משתמשים במתכנן מסלולי שיט. 162 00:06:30,088 --> 00:06:33,159 "אם אני נמצא בקורפו ביוני 1,323 163 00:06:33,159 --> 00:06:35,685 ורוצה להגיע לקונסטנטינופוליס (היום איסטנבול), 164 00:06:35,685 --> 00:06:37,828 היכן אוכל לעלות לספינה?" 165 00:06:37,828 --> 00:06:39,195 כנראה שנוכל לענות 166 00:06:39,195 --> 00:06:43,668 על השאלה בדיוק של יום או יומיים או שלושה. 167 00:06:43,668 --> 00:06:45,275 "כמה זה יעלה?" 168 00:06:45,275 --> 00:06:48,867 "מה הסיכויים להיתקלות בשודדי-ים?" 169 00:06:48,867 --> 00:06:50,678 אתם בטח מבינים 170 00:06:50,678 --> 00:06:53,287 שהאתגר המדעי המרכזי במיזם כמו זה 171 00:06:53,287 --> 00:06:57,856 הוא איפיון, כימות והצגה של אי-הודאות 172 00:06:57,876 --> 00:07:00,346 וחוסר העקביות בכל שלב של התהליך. 173 00:07:00,346 --> 00:07:03,058 ישנן שגיאות בכל מקום, 174 00:07:03,058 --> 00:07:05,547 שגיאות במסמך, שם לא נכון של רב-החובל, 175 00:07:05,547 --> 00:07:08,760 חלק מהספינות כלל לא הפליגו בים. 176 00:07:08,760 --> 00:07:13,617 יש שגיאות בתרגום, הטיות בפרשנות, 177 00:07:13,624 --> 00:07:17,090 ומעל הכל, אם מוסיפים עיבוד נתונים אלגוריתמי ממוחשב, 178 00:07:17,090 --> 00:07:20,039 יהיו שגיאות בזיהוי, 179 00:07:20,039 --> 00:07:22,000 שגיאות בשליפת מידע, 180 00:07:22,000 --> 00:07:26,481 כך שהנתונים מאוד לא ודאיים. 181 00:07:26,481 --> 00:07:30,238 אם כך, כיצד נוכל לאתר ולתקן אי-התאמות אלו? 182 00:07:30,238 --> 00:07:33,898 כיצד ניתן לבטא חוסר ודאות כזו? 183 00:07:33,898 --> 00:07:35,995 זה קשה. דבר אחד שאפשר לעשות 184 00:07:35,995 --> 00:07:38,221 זה לתעד כל צעד בתהליך, 185 00:07:38,221 --> 00:07:40,669 לא רק לתעד את המידע ההיסטורי, 186 00:07:40,669 --> 00:07:43,348 אלא את מה שאנו מכנים נתוני המידע ההיסטורי, 187 00:07:43,348 --> 00:07:46,011 כלומר כיצד המידע ההיסטורי בנוי, 188 00:07:46,011 --> 00:07:48,009 תוך תיעוד כל שלב. 189 00:07:48,009 --> 00:07:49,654 זה לא יבטיח שאנו 190 00:07:49,654 --> 00:07:52,104 מתכנסים לעבר סיפור אחד ויחיד של ונציה. 191 00:07:52,104 --> 00:07:54,242 אבל קרוב לודאי שנוכל לשחזר 192 00:07:54,242 --> 00:07:57,290 סיפור מלא ומתועד אפשרי של ונציה. 193 00:07:57,290 --> 00:07:58,749 אולי אין מפה אחת ויחידה. 194 00:07:58,749 --> 00:08:00,869 אולי ישנן כמה מפות. 195 00:08:00,869 --> 00:08:03,085 המערכת אמורה להרשות זאת, 196 00:08:03,085 --> 00:08:05,944 מכיוון שעלינו להתמודד עם צורה חדשה של אי-ודאות, 197 00:08:05,944 --> 00:08:10,585 שהיא באמת חדשה בסוג כזה של בסיס נתונים ענקי. 198 00:08:10,585 --> 00:08:12,775 וכיצד עלינו להציג 199 00:08:12,790 --> 00:08:16,769 מחקר זה לקהל הרחב? 200 00:08:16,769 --> 00:08:19,432 שוב, ונציה היא חריגה. 201 00:08:19,432 --> 00:08:21,603 עם מיליוני מבקרים הבאים אליה כל שנה, 202 00:08:21,603 --> 00:08:23,366 זהו בעצם אחד המקומות 203 00:08:23,366 --> 00:08:26,354 הטובים ביותר כדי לנסות להמציא את מוזיאון העתיד. 204 00:08:26,354 --> 00:08:29,658 דמיינו שרואים אופקית את המפה המשוחזרת 205 00:08:29,658 --> 00:08:30,944 של שנה מסויימת, 206 00:08:30,944 --> 00:08:33,902 ואנכית רואים את המסמך ששימש 207 00:08:33,902 --> 00:08:35,413 לשיחזור, 208 00:08:35,413 --> 00:08:38,813 את האיורים, לדוגמא. 209 00:08:38,813 --> 00:08:41,393 דמיינו מערכת היקפית תלת-מימדית 210 00:08:41,393 --> 00:08:44,895 המאפשרת לצלול פנימה ולשחזר את ונציה של שנה מסויימת, 211 00:08:44,895 --> 00:08:47,610 חוויה כלשהי שניתן לשתף בקבוצה. 212 00:08:47,610 --> 00:08:49,856 ולהיפך, דמיינו שמתחילים 213 00:08:49,856 --> 00:08:52,063 ממסמך, כתב-יד ונציאני, 214 00:08:52,063 --> 00:08:55,112 ואתם מראים מה אפשר לבנות ממנו, 215 00:08:55,112 --> 00:08:56,884 כיצד הוא מפוענח, 216 00:08:56,884 --> 00:08:59,299 כיצד ניתן לשחזר את ההקשרים שבמסמך. 217 00:08:59,299 --> 00:09:01,184 זוהי תמונה מתערוכה 218 00:09:01,184 --> 00:09:03,460 המתקיימת כעת בג'נבה 219 00:09:03,460 --> 00:09:05,814 בעזרת מערכת מהסוג הנ"ל. 220 00:09:05,814 --> 00:09:07,989 לסיום, אפשר לומר 221 00:09:07,989 --> 00:09:11,068 שהמחקר במדעי-הרוח עומד לעבור אבולוציה 222 00:09:11,068 --> 00:09:12,870 שעשויה להידמות 223 00:09:12,870 --> 00:09:17,452 למה שקרה במדעי-החיים לפני 30 שנה. 224 00:09:17,452 --> 00:09:22,128 זו רק שאלה של מידה. 225 00:09:22,130 --> 00:09:25,433 אנו רואים מיזמים שהם 226 00:09:25,433 --> 00:09:29,276 מעבר ליכולת הביצוע של קבוצת מחקר בודדת, 227 00:09:29,276 --> 00:09:31,519 וזה דבר באמת חדש בתחום של מדעי-הרוח, 228 00:09:31,519 --> 00:09:35,388 שלעיתים קרובות רגילים לעבוד בהם 229 00:09:35,388 --> 00:09:39,396 בקבוצות קטנות או רק עם מס' חוקרים בודדים ביחד. 230 00:09:39,396 --> 00:09:41,514 כאשר מבקרים ב-Archivio di Stato, 231 00:09:41,514 --> 00:09:44,336 חשים שזה משהו מעבר ליכולתה של קבוצה בודדת, 232 00:09:44,336 --> 00:09:48,170 ושצריך להתקיים מאמץ משותף. 233 00:09:48,170 --> 00:09:51,276 לכן מה שעלינו לעשות בשביל שינוי תפיסתי זה 234 00:09:51,276 --> 00:09:53,178 הוא לטפח דור חדש של 235 00:09:53,178 --> 00:09:54,715 "אנשי-רוח דיגיטליים" 236 00:09:54,715 --> 00:09:56,805 שיהיו מוכנים לשינוי זה. 237 00:09:56,805 --> 00:09:58,764 אני מאוד מודה לכם. 238 00:09:58,764 --> 00:10:02,764 (מחיאות כפיים)