-
♪ (Musica in aumento) ♪
-
(Cinguettio)
-
(Voci, lingue diverse)
-
(Voci si sovrappongono in sottofondo)
-
(Risate)
-
(Beep di computer)
-
[Parlare con i computer]
-
(Uomo) Nasciamo in questo mondo
con l'innata capacità di imparare a interagire
-
con altri esseri senzienti.
-
(Bambino che vocalizza)
-
(Uomo) Immaginate di dover interagire
con altri scrivendo brevi messaggi.
-
(Bambino che vocalizza)
-
(Uomo) Sarebbe penosissimo.
-
(Uomo) È in questo modo
che interagiamo con i computer.
-
È molto più facile parlare...
molto più facile...
-
(Bambino che vocalizza)
-
se i computer potessero capire
quello che diciamo.
-
Per questo, ci vuole
un ottimo riconoscimento vocale.
-
(Narratore) Il primo sistema di riconoscimento vocale
fu sviluppato dai Laboratori Bell
-
nel 1952. Riusciva a riconoscere solo
i numeri detti da una persona.
-
Nel 1970, la Carnegie-Mellon
lanciò l'Harpy System.
-
Era in grado di riconoscere
più di 1000 parole e diverse pronunce
-
della stessa parola.
(Uomo) Pomodoro - (Donna) Pomodoro
-
(Narratore) Il riconoscimento vocale continuò
negli anni '80 con l'introduzione
-
del Hidden Markov Model,
che usava un approccio più matematico
-
per analizzare le onde sonore che hanno portato
alle grandi innovazioni che abbiamo oggi.
-
Si prendono onde sonore molto grezze
-
come quelle di un microfono
-
o del telefono
-
o altro...
-
(Donna) La spezzettiamo e cerchiamo
di identificare quale fonema
-
viene pronunciato in quel discorso.
-
Il fonema è un un'unità primitiva
di espressione delle parole.
-
(Fonemi)
-
Poi li rimette insieme
in possibili parole come Palo Alto.
-
Il riconoscimento vocale oggi è valido
per trascrivere quello che dite...
-
(Uomo, al telefono) Che tempo fa
oggi a Topeka?
-
(Uomo) Si può parlare di viaggi, contatti,
come, "Dove trovo una pizza?"
-
(Telefono) Ecco la lista delle pizzerie.
-
(Uomo) "Quanto è alta la Torre Eiffel?"
(Telefono) La Torre Eiffel è...
-
(Donna) Abbiamo fatto progressi incredibili
molto rapidamente.
-
(Uomo, al telefono) Chi è il 21° presidente
degli Stati Uniti?
-
(Beep del telefono)
(Telefono) Chester A. Arthur è stato il 21°
-
(Uomo, al telefono) Ok, Google, di dov'è?
-
(Uomo) Anni fa, per interagire
con i computer bisognava essere ingegneri.
-
Oggi, tutti possono interagire.
-
Quel che è ancora agli inizi
è la comprensione.
-
Ci serve un un modello di comprensione
molto più sofisticato
-
che capisca il significato delle frasi.
-
Siamo ancora molto lontani.
-
[Comprensione del linguaggio]
-
♪ (Musica in sottofondo) ♪
-
(Donna) La nostra capacità di usare
la lingua ci aiuta ad avere una cultura.
-
È una delle cose che aiuta a trasmettere
le tradizioni alle generazioni successive.
-
Capire come il sistema del linguaggio
funziona, anche se sembra facile,
-
si rivela molto difficile, ma lo capisce
anche un bambino di due anni.
-
(Ragazza) Ce ne sono due.
(Donna) Ci sono due L, sì.
-
La lingua è estremamente
complessa e sofisticata...
-
Dalla semantica,
-
all'ironia, agli accenti,
-
alle espressioni del viso,
-
alle emozioni umane, perché fa parte
del nostro modo di comunicare.
-
L'umorismo.
-
Devo stare attento
a non offendere il dinosauro?
-
Il linguaggio ha così tante sfumature
ed è il motivo per cui
-
è così complicato.
-
(Uomo) Il cervello umano
e gli algoritmi di apprendimento
-
sono molto più bravi
nella comprensione della lingua
-
e molto più bravi
nell'afferrare i giochi di parole.
-
Che replichiamo esattamente o meno
quello che fa il cervello, capire
-
la lingua e il discorso
è ancora un problema.
-
[Reti neurali]
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-