Le Big Data pour mieux nous comprendre
-
0:01 - 0:04Quelle est la tarte préférée
des Américains ? -
0:04 - 0:08Public : La tarte à la pomme !
K. Cukier : En effet ! -
0:08 - 0:10Comment le sait-on ?
-
0:10 - 0:12Grâce aux données.
-
0:13 - 0:14Les ventes de supermarchés.
-
0:14 - 0:18Parmi les ventes en supermarché
de tartes surgelées de 30 cm, -
0:18 - 0:21la tarte à la pomme était n°1,
haut la main. -
0:21 - 0:24La majorité des ventes se fait
sur les tartes à la pomme. -
0:27 - 0:29Puis les supermarchés se sont mis à vendre
-
0:29 - 0:32des tartes plus petites, de 11 cm.
-
0:32 - 0:36Et d'un coup, la pomme a chuté
à la 4ème ou 5ème place -
0:36 - 0:38Pourquoi ? Que s'est-il passé ?
-
0:39 - 0:41Réfléchissez !
-
0:42 - 0:46Quand vous achetez une grande tarte,
-
0:46 - 0:48il faut que toute la famille
soit d'accord, -
0:48 - 0:52Or la pomme est le deuxième choix de tous.
-
0:52 - 0:53(Rires)
-
0:53 - 0:58Mais si vous achetez
une petite tartelette, -
0:58 - 1:01vous pouvez acheter
celle que vous préférez. -
1:01 - 1:04Vous pouvez avoir votre premier choix.
-
1:05 - 1:07Vous avez plus de données.
-
1:07 - 1:09On découvre quelque chose
qui nous aurait échappé -
1:09 - 1:12avec moins de données.
-
1:13 - 1:18Mais plus de données ne nous donnent
pas seulement plus d'informations, -
1:18 - 1:20plus d'informations sur la même chose.
-
1:20 - 1:24Plus de données nous permettent
de voir de nouvelles choses, -
1:24 - 1:27d'y voir plus clair,
-
1:27 - 1:30de voir sous un nouvel angle.
-
1:30 - 1:33Dans ce cas, ça nous a permis de savoir
-
1:33 - 1:36quelle tarte les Américains préfèrent :
-
1:36 - 1:38ce n'est pas la pomme.
-
1:39 - 1:42Vous avez déjà probablement entendu
le terme « Big Data ». -
1:42 - 1:46En fait, vous en avez probablement
plein les oreilles des Big Data. -
1:46 - 1:50C'est vrai
qu'il y a beaucoup de bruit autour de ça -
1:50 - 1:52et c'est bien regrettable,
-
1:52 - 1:55parce c'est un outil extrêmement important
-
1:55 - 1:58qui va faire progresser notre société.
-
1:59 - 2:02Jusqu'ici, on n'utilisait que
de petites quantités de données, -
2:02 - 2:04on cherchait à les interpréter
-
2:04 - 2:05afin de comprendre le monde.
-
2:05 - 2:07On a à présent infiniment plus de données,
-
2:07 - 2:11plus de données que jamais auparavant.
-
2:11 - 2:13Et quand on a une telle
quantité de données, -
2:13 - 2:15on peut accomplir des choses
-
2:15 - 2:18inimaginables avec de petites quantités.
-
2:18 - 2:21Les Big Data sont à la fois
nouvelles et importantes. -
2:21 - 2:22Si on y réfléchit,
-
2:22 - 2:26le seul moyen qu'on aura
pour faire face aux enjeux mondiaux : -
2:26 - 2:28nourrir l'humanité,
-
2:28 - 2:30l'approvisionner en médicaments,
-
2:30 - 2:33en énergie, en électricité,
-
2:33 - 2:36et éviter d'être rôti
par le réchauffement climatique, -
2:36 - 2:40ce sera grâce
à une utilisation efficace des données. -
2:40 - 2:44Qu'y a-t-il de nouveau dans les Big Data ?
Pourquoi tout le monde en parle ? -
2:44 - 2:47Pour y répondre, il faut se rappeler
-
2:47 - 2:51à quoi ressemblait physiquement
une information dans le passé. -
2:52 - 2:55En 1908, sur l'île de Crète,
-
2:55 - 3:00des archéologues ont découvert
un disque en argile. -
3:00 - 3:04Ils l'ont daté de 2 000 ans av. J-C.,
soit vieux de 4 000 ans. -
3:04 - 3:07Il y a des inscriptions
mais personne n'arrive à les déchiffrer. -
3:07 - 3:09Le mystère reste entier.
Mais c'est à cela -
3:09 - 3:13que ressemblait l'information
il y a 4 000 ans. -
3:13 - 3:16C'est ainsi que la société stockait
-
3:16 - 3:19et transmettait l'information.
-
3:19 - 3:24La société n'a pas tant évolué que ça.
-
3:24 - 3:27On stocke toujours
l'information sur des disques, -
3:27 - 3:31mais en quantité plus grande,
infiniment plus grande. -
3:31 - 3:34Les informations sont
plus faciles à chercher, -
3:34 - 3:36plus faciles à copier, à partager,
-
3:36 - 3:38plus faciles à traiter.
-
3:38 - 3:40On peut aussi réutiliser ces informations
-
3:40 - 3:43à des fins auxquelles
on n'avait pas du tout pensé -
3:43 - 3:45au moment où on les a collectées.
-
3:45 - 3:48On peut dire que les données sont passées
-
3:48 - 3:52d'un stock à un flux,
-
3:52 - 3:56de statique et immobile,
-
3:56 - 3:59à fluide et dynamique.
-
3:59 - 4:03On peut dire que l'information
est devenue liquide. -
4:04 - 4:07Ce disque découvert en Crète
-
4:07 - 4:10et vieux de 4 000 ans, il est lourd,
-
4:10 - 4:12il ne contient pas beaucoup d'information,
-
4:12 - 4:15et cette information
n'est pas modifiable. -
4:15 - 4:18En revanche,
-
4:18 - 4:19tous les fichiers
-
4:19 - 4:24qu'Edward Snowden a pris
à la NSA aux États-Unis -
4:24 - 4:26tiennent sur une clé USB
-
4:26 - 4:29pas plus grande qu'une
pièce de 50 centimes, -
4:29 - 4:33et ils peuvent être partagés
à la vitesse de la lumière. -
4:34 - 4:38Plus de données. Plus.
-
4:39 - 4:42Une raison pour laquelle nous avons
tant de données aujourd'hui, -
4:42 - 4:44c'est qu'on étudie des choses
-
4:44 - 4:46sur lesquelles
on a toujours collecté de l'information. -
4:46 - 4:49Une autre raison, c'est qu'on utilise
-
4:49 - 4:51des choses qui ont toujours
été informationnelles -
4:51 - 4:54et qui n'ont jamais été transformées
en données -
4:54 - 4:56et nous les mettons maintenant
en données. -
4:56 - 5:00Prenez l'exemple
des données de localisation. -
5:00 - 5:02Pensez par exemple à Martin Luther.
-
5:02 - 5:06Si on avait voulu savoir au 16ème siècle
où Martin Luther se trouvait, -
5:06 - 5:08on aurait dû le suivre tout le temps,
-
5:08 - 5:12sans doute avec une plume et un encrier
pour noter ses différentes positions. -
5:12 - 5:14Regardez à quoi ça ressemble aujourd'hui !
-
5:14 - 5:16Vous savez que quelque part,
-
5:16 - 5:19probablement dans la base de données
de votre opérateur, -
5:19 - 5:22il y a un tableau
ou une entrée dans une base de données -
5:22 - 5:26qui enregistre les informations
sur votre localisation, à chaque instant. -
5:26 - 5:28Si vous avez un téléphone portable,
-
5:28 - 5:30que ce dernier soit muni d'un GPS ou non,
-
5:30 - 5:33il stocke vos informations.
-
5:33 - 5:36C'est ainsi que la localisation
a été mise en données. -
5:37 - 5:41Prenons maintenant l'exemple
de votre posture, -
5:41 - 5:43la manière dont vous êtes tous
assis en ce moment -
5:43 - 5:45votre manière de vous asseoir à vous,
-
5:45 - 5:47votre posture à vous,
la vôtre. -
5:47 - 5:49Elles sont toutes différentes
-
5:49 - 5:52en fonction de la longueur de vos jambes
et des contours de votre dos -
5:52 - 5:54Et si je posais, disons, 100 capteurs
-
5:54 - 5:56sur chacun de vos sièges,
-
5:56 - 5:59je pourrais créer
un index unique qui vous serait propre, -
5:59 - 6:03comme une empreinte unique,
autre qu'une empreinte digitale. -
6:04 - 6:07Mais à quoi ça pourrait bien servir ?
-
6:07 - 6:09Des chercheurs à Tokyo utilisent ça
-
6:09 - 6:13comme un possible système antivol
dans les voitures. -
6:14 - 6:17Si un voleur s'assied derrière le volant
et tente de démarrer, -
6:17 - 6:20la voiture reconnaît
qu'un conducteur non-approuvé -
6:20 - 6:23est derrière le volant
et stoppe simplement le moteur, -
6:23 - 6:25sauf si vous entrez un mot de passe
-
6:25 - 6:29qui dit que vous avez l'autorisation
de conduire la voiture. -
6:31 - 6:33Imaginons que chaque voiture en Europe
-
6:33 - 6:35soit munie de cette technologie.
-
6:35 - 6:38Quelles perspectives
cela nous ouvre-t-il ? -
6:38 - 6:40En rassemblant ces données,
-
6:40 - 6:43on pourrait peut-être identifier
-
6:43 - 6:46des signes révélateurs
qui prédisent au mieux -
6:46 - 6:49qu'un accident va se produire
-
6:49 - 6:53dans les 5 prochaines secondes.
-
6:53 - 6:55C'est ainsi qu'on sera parvenu
à mettre en données -
6:55 - 6:57la fatigue du conducteur.
-
6:57 - 6:59Un nouveau service serait que,
-
6:59 - 7:03quand la voiture sent qu'une personne
s'affale dans cette position, -
7:03 - 7:05elle comprend automatiquement
-
7:05 - 7:08et réagit en faisant vibrer le volant,
en klaxonnant à l'intérieur -
7:08 - 7:13comme pour dire :
« Debout, concentre-toi sur la route ! » -
7:13 - 7:15C'est le genre de choses
qui deviennent possibles -
7:15 - 7:18quand on met en données
certains aspects du quotidien. -
7:18 - 7:21Que valent alors donc les Big Data ?
-
7:21 - 7:23Pensez-y !
-
7:23 - 7:25On a plus d'information.
-
7:25 - 7:29On peut faire des nouvelles choses
qui étaient impossibles auparavant. -
7:29 - 7:33Une des applications
les plus impressionnantes des Big Data -
7:33 - 7:36concerne le domaine
de l'apprentissage automatique. -
7:36 - 7:39Il s'agit d'une branche
de l'intelligence artificielle, -
7:39 - 7:42elle-même branche de l'informatique.
-
7:42 - 7:43L'idée générale c'est que,
-
7:43 - 7:46plutôt que de dire à l'ordinateur
ce qu'il a à faire, -
7:46 - 7:49on va juste donner plein d'informations
à l'ordinateur -
7:49 - 7:51et lui dire de se débrouiller avec.
-
7:51 - 7:53Pour vous aider à comprendre,
-
7:53 - 7:57retournons aux origines de
l'apprentissage automatique. -
7:57 - 8:01En 1950, un informaticien de chez IBM,
Arthur Samuel, -
8:01 - 8:03était amateur du jeu de Dames.
-
8:03 - 8:07Il a donc créé un programme informatique
afin de jouer contre l'ordinateur. -
8:07 - 8:10Il a joué. Il a gagné.
-
8:10 - 8:12Il a joué. Il a gagné.
-
8:12 - 8:15Il a joué. Il a gagné,
-
8:15 - 8:19parce que l'ordinateur ne connaissait
rien d'autre que les coups légaux. -
8:19 - 8:21Arthur Samuel en savait plus.
-
8:21 - 8:26Arthur Samuel avait
des notions de stratégie. -
8:26 - 8:29Il a alors écrit un sous-programme à côté.
Il opérait en arrière-plan -
8:29 - 8:32et tout ce qu'il faisait,
c'est qu'après chacun des coups, -
8:32 - 8:35il comptait les probabilités
de chacune des configurations du damier -
8:35 - 8:40de mener à la victoire ou à la défaite.
-
8:40 - 8:43Il joue contre l'ordinateur. Il gagne.
-
8:43 - 8:46Il joue contre l'ordinateur. Il gagne.
-
8:46 - 8:49Il joue contre l'ordinateur. Il gagne.
-
8:49 - 8:54Puis Arthur Samuel a laissé l'ordinateur
jouer contre lui-même. -
8:54 - 8:57Plus il joue contre lui-même,
plus il collecte de données. -
8:57 - 8:58Plus il collecte de données,
-
8:58 - 9:01plus il augmente
la précision de ses prédictions. -
9:01 - 9:04Et quand Samuel
a rejoué contre l'ordinateur, -
9:04 - 9:06il joue et il perd.
-
9:06 - 9:08Il joue et il perd.
-
9:08 - 9:10Il joue et il perd.
-
9:10 - 9:13C'est ainsi qu'Arthur Samuel
a créé une machine -
9:13 - 9:19capable de le surpasser
dans une discipline qu'il lui a enseignée. -
9:19 - 9:23Et cette idée d'apprentissage automatique
est partout autour de nous. -
9:25 - 9:29Comment croyez-vous que des voitures
roulent toutes seules ? -
9:29 - 9:31Notre société est-elle meilleure
-
9:31 - 9:35depuis que le code de la route
a été traduit dans un logiciel ? Non. -
9:35 - 9:37Le stockage est-il moins cher ? Non.
-
9:37 - 9:40Les algorithmes plus rapides ? Non.
Les processeurs plus puissants ? Non. -
9:40 - 9:43Toutes ces choses sont importantes,
mais pas décisives. -
9:43 - 9:46C'est parce que nous avons
changé la nature du problème. -
9:46 - 9:51Avant, on essayait d'expliquer
clairement et ouvertement à l'ordinateur -
9:51 - 9:53comment il devait conduire.
-
9:53 - 9:54Aujourd'hui, on lui dit :
-
9:54 - 9:56« Voici tout plein de
données sur le véhicule, -
9:56 - 9:57débrouille-toi !
-
9:57 - 10:00Débrouille-toi à comprendre
que ceci est un feu de signalisation -
10:00 - 10:02que le feu est rouge et non vert,
-
10:02 - 10:06que cela veut dire que tu dois t'arrêter,
et non pas continuer. » -
10:06 - 10:10L'apprentissage automatique est à la base
de nombreux outils en ligne : -
10:10 - 10:12les moteurs de recherche,
-
10:12 - 10:16l'algorithme de personnalisation d'Amazon,
-
10:16 - 10:18la traduction par ordinateur,
-
10:18 - 10:21ou encore la reconnaissance vocale.
-
10:22 - 10:25Les chercheurs se sont récemment penchés
-
10:25 - 10:28sur la question des biopsies,
-
10:28 - 10:31des biopsies de cellules cancéreuses.
-
10:31 - 10:33Ils ont demandé à des ordinateurs
-
10:33 - 10:36d'analyser les données
et le taux de survie -
10:36 - 10:43pour déterminer quelles cellules
sont réellement cancéreuses. -
10:43 - 10:45Sans surprise,
en fournissant assez de données -
10:45 - 10:47à l'algorithme
d'apprentissage automatique, -
10:47 - 10:49l'ordinateur était capable d'identifier
-
10:49 - 10:51les 12 signes caractéristiques
qui prédisent au mieux -
10:51 - 10:55que cette biopsie
de cellules tumorales mammaires -
10:55 - 10:57sont en effet cancéreuses.
-
10:57 - 10:59Le truc,
-
10:59 - 11:03c'est que les médecins
n'en connaissaient que 9. -
11:03 - 11:06Trois des signes ont été
identifiés par l'ordinateur -
11:06 - 11:11sans que quelqu'un n'ait besoin
de faire de recherche dessus. -
11:14 - 11:19Mais il y a aussi
une face sombre des Big Data. -
11:19 - 11:20Cela va améliorer nos vies,
-
11:20 - 11:24mais il y a aussi des problèmes
dont il faut être conscient. -
11:24 - 11:29Le premier, c'est l'idée que l'on puisse
être puni à cause de prédictions, -
11:29 - 11:35que la police utilise les Big Data
un peu comme dans « Minority Report ». -
11:35 - 11:40On appelle ça la prévision policière
ou la criminologie algorithmique. -
11:40 - 11:42L'idée est que, si on prend
beaucoup de données -
11:42 - 11:44par exemple où des crimes ont été commis,
-
11:44 - 11:47on sait où envoyer les patrouilles.
-
11:47 - 11:49C'est logique.
Mais le problème, -
11:49 - 11:54c'est qu'on ne s'arrêtera pas
aux données de localisation, -
11:54 - 11:56on va aller jusqu'au niveau de l'individu.
-
11:56 - 12:01Pourquoi ne pas utiliser les données
fournies par vos bulletins scolaires ? -
12:01 - 12:03Peut-être devrions-nous
utiliser le fait -
12:03 - 12:05que les gens ont un emploi ou non,
leur solvabilité, -
12:05 - 12:08leur comportement sur Internet,
s'ils sont debout tard dans la nuit. -
12:08 - 12:10Leur FitBit, quand c'est possible,
-
12:10 - 12:14pour identifier les réactions biochimiques
qui produisent des pensées agressives. -
12:15 - 12:17On peut avoir des algorithmes
-
12:17 - 12:20qui pourraient prédire
ce que nous sommes sur le point de faire, -
12:20 - 12:23nous pourrions être tenus responsables
de ce que l'on n'a pas encore fait. -
12:23 - 12:28La vie privée était le défi principal
lorsqu'on avait peu de données. -
12:28 - 12:29Avec les Big Data,
-
12:29 - 12:35le défi sera
de préserver le libre-arbitre, -
12:35 - 12:38les choix moraux, le consentement
-
12:38 - 12:41et la capacité d'agir de l'homme.
-
12:43 - 12:45Et il y a un autre problème :
-
12:45 - 12:48les Big Data vont
nous voler notre travail. -
12:48 - 12:52A l'aide des algorithmes,
elles vont entrer en concurrence -
12:52 - 12:55avec les cols blancs,
avec les travailleurs intellectuels -
12:55 - 12:57du 21ème siècle,
-
12:57 - 13:01de la même manière que
l'automatisation des lignes de montage -
13:01 - 13:04a concurrencé le travail des cols bleus,
au 20ème siècle. -
13:04 - 13:08Imaginez un technicien de laboratoire
qui examine à l'aide d'un microscope -
13:08 - 13:12la biopsie d'une tumeur
pour déterminer si elle est cancéreuse. -
13:12 - 13:14Cette personne a fait des études.
-
13:14 - 13:16Cette personne est propriétaire.
-
13:16 - 13:17Il ou elle vote.
-
13:17 - 13:21Il ou elle est acteur à part entière
de notre société. -
13:21 - 13:22Et pourtant cette personne,
-
13:22 - 13:26ainsi qu'un pan entier
de professionnels similaires, -
13:26 - 13:29va voir son travail
radicalement transformé, -
13:29 - 13:32voire carrément éliminé.
-
13:32 - 13:33On aime pourtant se dire
-
13:33 - 13:36que sur le long terme,
la technologie crée des emplois, -
13:36 - 13:39après une courte période temporaire
de destruction d'emplois. -
13:39 - 13:42C'est vrai pour la période de référence
dans laquelle nous vivons, -
13:42 - 13:46la Révolution Industrielle,
car c'est précisément ce qui s'est passé. -
13:46 - 13:48Mais on oublie un élément
dans cette analyse. -
13:48 - 13:50Il y a des catégories d'emplois
-
13:50 - 13:53qui sont simplement éliminées
et ne sont pas remplacées. -
13:53 - 13:59La Révolution Industrielle
n'a pas été bonne pour les chevaux. -
13:59 - 14:02Il va donc falloir être prudent,
-
14:02 - 14:05prendre les Big Data
et les ajuster à nos besoins, -
14:05 - 14:08nos besoins humains fondamentaux.
-
14:08 - 14:10Nous devons maîtriser cette technologie
-
14:10 - 14:12et non devenir ses esclaves.
-
14:12 - 14:15L'ère des Big Data vient tout juste de commencer
-
14:15 - 14:18et honnêtement,
nous ne sommes pas très bons -
14:18 - 14:22pour manipuler toutes ces données
que nous collectons. -
14:22 - 14:25Ce n'est pas juste un problème pour la NSA.
-
14:25 - 14:29Les entreprises collectent aussi beaucoup
de données, et elles en abusent aussi. -
14:29 - 14:32Il va falloir faire mieux,
et cela va prendre du temps. -
14:32 - 14:34C'est un peu comme le défi
-
14:34 - 14:36de l'homme préhistorique
quand il a inventé le feu. -
14:36 - 14:38C'est un outil,
mais c'est un outil qui, -
14:38 - 14:42si nous ne sommes pas prudents,
va nous brûler. -
14:44 - 14:47Les Big Data vont transformer
nos modes de vie, -
14:47 - 14:50de travail et de pensée.
-
14:50 - 14:52Elles nous aideront à gérer nos carrières,
-
14:52 - 14:55à mener une vie faite de satisfaction,
d'espoir, -
14:55 - 14:58de bonheur et de santé.
-
14:58 - 15:02Mais, par le passé, on a souvent
regardé les technologies de l'information -
15:02 - 15:04et nos yeux n'ont vu que le T,
-
15:04 - 15:06la Technologie, l'ordinateur,
-
15:06 - 15:08parce que c'est
matériel et palpable. -
15:08 - 15:11Il faut à présent
tourner notre regard vers le I, -
15:11 - 15:14l'Information,
qui est moins visible, -
15:14 - 15:18mais d'une certaine manière
bien plus importante. -
15:18 - 15:24L'humanité peut enfin apprendre
des informations qu'elle collecte -
15:24 - 15:26dans le cadre de sa quête
-
15:26 - 15:29pour comprendre le monde
et la place de l'homme en son sein. -
15:29 - 15:34Voilà pourquoi
les Big Data sont si importantes. -
15:34 - 15:39(Applaudissements)
- Title:
- Le Big Data pour mieux nous comprendre
- Speaker:
- Kenneth Cukier
- Description:
-
Les voitures sans chauffeurs ne sont qu'un début. Quel impact le Big Data aura-t-il sur les innovations technologiques à venir ? Dans cet exposé passionnant, Kenneth Cukier dresse le portrait de l'apprentissage automatique de demain et... de l'intelligence humaine.
- Video Language:
- English
- Team:
- closed TED
- Project:
- TEDTalks
- Duration:
- 15:51
eric vautier edited French subtitles for Big data is better data | ||
eric vautier edited French subtitles for Big data is better data | ||
eric vautier edited French subtitles for Big data is better data | ||
eric vautier approved French subtitles for Big data is better data | ||
Beatriz V L accepted French subtitles for Big data is better data | ||
Beatriz V L edited French subtitles for Big data is better data | ||
Beatriz V L edited French subtitles for Big data is better data | ||
Meryl Ducray edited French subtitles for Big data is better data |