♪ (Musica in aumento) ♪
(Cinguettio)
(Voci, lingue diverse)
(Voci si sovrappongono in sottofondo)
(Risate)
(Beep di computer)
[Parlare con i computer]
(Uomo) Nasciamo in questo mondo
con l'innata capacità di imparare a interagire
con altri esseri senzienti.
(Bambino che vocalizza)
(Uomo) Immaginate di dover interagire
con altri scrivendo brevi messaggi.
(Bambino che vocalizza)
(Uomo) Sarebbe penosissimo.
(Uomo) È in questo modo
che interagiamo con i computer.
È molto più facile parlare...
molto più facile...
(Bambino che vocalizza)
se i computer potessero capire
quello che diciamo.
Per questo, ci vuole
un ottimo riconoscimento vocale.
(Narratore) Il primo sistema di riconoscimento vocale
fu sviluppato dai Laboratori Bell
nel 1952. Riusciva a riconoscere solo
i numeri detti da una persona.
Nel 1970, la Carnegie-Mellon
lanciò l'Harpy System.
Era in grado di riconoscere
più di 1000 parole e diverse pronunce
della stessa parola.
(Uomo) Pomodoro - (Donna) Pomodoro
(Narratore) Il riconoscimento vocale continuò
negli anni '80 con l'introduzione
del Hidden Markov Model,
che usava un approccio più matematico
per analizzare le onde sonore che hanno portato
alle grandi innovazioni che abbiamo oggi.
Si prendono onde sonore molto grezze
come quelle di un microfono
o del telefono
o altro...
(Donna) La spezzettiamo e cerchiamo
di identificare quale fonema
viene pronunciato in quel discorso.
Il fonema è un un'unità primitiva
di espressione delle parole.
(Fonemi)
Poi li rimette insieme
in possibili parole come Palo Alto.
Il riconoscimento vocale oggi è valido
per trascrivere quello che dite...
(Uomo, al telefono) Che tempo fa
oggi a Topeka?
(Uomo) Si può parlare di viaggi, contatti,
come, "Dove trovo una pizza?"
(Telefono) Ecco la lista delle pizzerie.
(Uomo) "Quanto è alta la Torre Eiffel?"
(Telefono) La Torre Eiffel è...
(Donna) Abbiamo fatto progressi incredibili
molto rapidamente.
(Uomo, al telefono) Chi è il 21° presidente
degli Stati Uniti?
(Beep del telefono)
(Telefono) Chester A. Arthur è stato il 21°
(Uomo, al telefono) Ok, Google, di dov'è?
(Uomo) Anni fa, per interagire
con i computer bisognava essere ingegneri.
Oggi, tutti possono interagire.
Quel che è ancora agli inizi
è la comprensione.
Ci serve un un modello di comprensione
molto più sofisticato
che capisca il significato delle frasi.
Siamo ancora molto lontani.
[Comprensione del linguaggio]
♪ (Musica in sottofondo) ♪
(Donna) La nostra capacità di usare
la lingua ci aiuta ad avere una cultura.
È una delle cose che aiuta a trasmettere
le tradizioni alle generazioni successive.
Capire come il sistema del linguaggio
funziona, anche se sembra facile,
si rivela molto difficile, ma lo capisce
anche un bambino di due anni.
(Ragazza) Ce ne sono due.
(Donna) Ci sono due L, sì.
La lingua è estremamente
complessa e sofisticata...
Dalla semantica,
all'ironia, agli accenti,
alle espressioni del viso,
alle emozioni umane, perché fa parte
del nostro modo di comunicare.
L'umorismo.
Devo stare attento
a non offendere il dinosauro?
Il linguaggio ha così tante sfumature
ed è il motivo per cui
è così complicato.
(Uomo) Il cervello umano
e gli algoritmi di apprendimento
sono molto più bravi
nella comprensione della lingua
e molto più bravi
nell'afferrare i giochi di parole.
Che replichiamo esattamente o meno
quello che fa il cervello, capire
la lingua e il discorso
è ancora un problema.
[Reti neurali]