WEBVTT 00:00:00.500 --> 00:00:06.702 (Muziek) 00:00:06.702 --> 00:00:08.725 "Sommigen zijn groots geboren, 00:00:08.725 --> 00:00:10.620 sommigen bereiken grootsheid, 00:00:10.620 --> 00:00:15.711 en anderen krijgen grootsheid in de schoot geworpen" - zei William Shakespeare. 00:00:15.711 --> 00:00:17.301 Is het echt zo? 00:00:17.301 --> 00:00:21.969 Sommigen twijfelen eraan of Shakespeare zelf zijn werken heeft geschreven, 00:00:21.969 --> 00:00:24.889 ze twijfelen er zelfs aan of hij echt bestaan heeft. 00:00:24.889 --> 00:00:28.809 Ze denken dat 'Shakespeare' misschien een pseudoniem was voor een andere schrijver, 00:00:28.809 --> 00:00:30.236 of een groep schrijvers. 00:00:30.236 --> 00:00:32.348 Kandidaten voor de rol van Shakespeare 00:00:32.348 --> 00:00:37.945 kunnen andere bekende schrijvers, politici of vooraanstaande vrouwen zijn. 00:00:37.945 --> 00:00:41.436 Is het waar dat de belangrijkste Engelse schrijver 00:00:41.436 --> 00:00:44.941 even nep was als zijn verhalen? 00:00:44.941 --> 00:00:47.867 De meeste kenners geloven deze theorieën niet, 00:00:47.867 --> 00:00:51.439 omdat er genoeg historisch en biografisch bewijs bestaat. 00:00:51.439 --> 00:00:55.514 Maar er bestaat een andere manier om uit te maken of Shakespeares bekendste quotes 00:00:55.514 --> 00:00:58.500 geschreven zijn door iemand anders. 00:00:58.500 --> 00:01:00.689 Taalkunde, de studie van talen, 00:01:00.689 --> 00:01:04.090 kan ons veel vertellen over de manier waarop we spreken en schrijven 00:01:04.090 --> 00:01:09.385 door zinsbouw, grammatica, semantiek en woordenschat te bestuderen. 00:01:09.385 --> 00:01:11.416 Op het einde van de 19e eeuw 00:01:11.416 --> 00:01:15.447 ontwikkelde de Poolse filosoof Wincenty Lutoslawki, 00:01:15.447 --> 00:01:18.226 een methode genaamd stylometrie. 00:01:18.226 --> 00:01:23.428 Hij onderzocht via de stylometrie auteurschap. 00:01:23.428 --> 00:01:25.395 Hoe werkt stylometrie precies? 00:01:25.395 --> 00:01:29.279 De theorie erachter is dat ieders schrijfstijl kenmerken heeft 00:01:29.279 --> 00:01:33.613 die hetzelfde blijven in alle werken. 00:01:33.613 --> 00:01:37.094 Voorbeelden zijn gemiddelde zinslengte, 00:01:37.094 --> 00:01:38.953 woordvolgorde, 00:01:38.953 --> 00:01:42.487 en zelfs het aantal keer dat een bepaald woord voorkomt. 00:01:42.487 --> 00:01:44.556 Laten we kijken naar het woord 'thee'. 00:01:44.556 --> 00:01:47.505 We visualiseren het als een dimensie, of as. 00:01:47.505 --> 00:01:50.554 Elk woord van Shakespeare kan op deze as geplaats worden, 00:01:50.554 --> 00:01:54.668 als een datapunt, op basis van het aantal keer dat een woord voorkomt. 00:01:54.668 --> 00:01:57.235 In de statistiek bepaalt de dichtheid van deze punten 00:01:57.235 --> 00:02:02.498 de variantie, het verwachte bereik van de data. 00:02:02.498 --> 00:02:07.995 Toch is variantie maar één eigenschap in een multidimensionale omgeving. 00:02:07.995 --> 00:02:11.340 Via Principal Component Analysis 00:02:11.340 --> 00:02:16.131 kunnen we de multidimensionale ruimte opdelen in enkelvoudige hoofdcomponenten 00:02:16.131 --> 00:02:19.905 die samen de variantie van Shakespeares werk bepalen. 00:02:19.905 --> 00:02:22.396 Daarna toetsen we het werk van de andere kandidaten af 00:02:22.396 --> 00:02:24.867 aan die hoofdcomponenten. 00:02:24.867 --> 00:02:26.055 Bijvoorbeeld, 00:02:26.055 --> 00:02:30.394 als er genoeg woorden van Francis Bacon in de variantie van Shakespeare liggen, 00:02:30.394 --> 00:02:32.263 zou het een sterk bewijs zijn 00:02:32.263 --> 00:02:37.045 dat Francis Bacon en Shakespeare dezelfde persoon zijn. 00:02:37.045 --> 00:02:39.161 Wat blijkt uit de resultaten? 00:02:39.161 --> 00:02:42.477 De onderzoekers hebben geconcludeerd 00:02:42.477 --> 00:02:46.557 dat Shakespeare niemand anders is dan Shakespeare zelf. 00:02:46.557 --> 00:02:49.191 De bard is de bard. 00:02:49.191 --> 00:02:54.370 Het werk van Bacon komt niet overeen met de specifieke stijl van Shakespeare. 00:02:54.370 --> 00:02:57.642 Toch vonden onze dappere statistici 00:02:57.642 --> 00:03:00.884 interessante bewijzen van samenwerkingen. 00:03:00.884 --> 00:03:03.138 Uit een recente studie blijkt bijvoorbeeld 00:03:03.138 --> 00:03:08.216 dat Shakespeare heeft samengewerkt met Christopher Marlowe voor 'Henry VI', 00:03:08.216 --> 00:03:10.624 het eerste en het tweede deel. 00:03:10.624 --> 00:03:15.642 Stylometrie kan veel meer oplossen dan de identiteit van Shakespeare. 00:03:15.642 --> 00:03:18.308 Het helpt ons uit te maken wanneer een werk werd geschreven, 00:03:18.308 --> 00:03:21.040 of het werk een vervalsing is, 00:03:21.040 --> 00:03:23.685 of een student plagiaat heeft gepleegd, 00:03:23.685 --> 00:03:29.020 of een e-mail belangrijk is of niet. 00:03:29.020 --> 00:03:31.551 Kunnen we de tijdloze poëzie van Shakespeare 00:03:31.551 --> 00:03:34.475 reduceren tot cijfers en statistiek? 00:03:34.475 --> 00:03:35.885 Niet echt. 00:03:35.885 --> 00:03:40.900 Stylometrische analyse onthult welke elementen de werken van Shakespeare onderscheiden, 00:03:40.900 --> 00:03:45.525 maar het geeft de schoonheid van de gevoelens niet weer. 00:03:45.525 --> 00:03:48.509 Of waarom ze ons op een bepaalde manier raken. 00:03:48.509 --> 00:03:50.826 Althans, nog niet. 00:03:50.826 --> 00:03:59.316 (Muziek)