Kako računalo uči trenutačno prepoznavati objekte

0:01 - 0:02

Prije deset godina,
0:02 - 0:05

istraživači računalnog vida mislili su
da je naučiti računalo
0:05 - 0:07

kako razlikovati između mačke i psa
0:08 - 0:09

gotovo nemoguće,
0:10 - 0:13

čak i uz značajan napredak
u razvoju umjetne inteligencije.
0:13 - 0:17

Sad to možemo učiniti
s više od 99 posto točnosti.
0:18 - 0:20

To se zove klasifikacija slike -
0:20 - 0:23

dati sliku, staviti oznaku na sliku -
0:23 - 0:26

a računala znaju
i tisuće drugih kategorija.
0:27 - 0:30

Ja sam postdiplomac
na Sveučilištu u Washingtonu
0:30 - 0:32

i radim na projektu pod nazivom Darknet,
0:32 - 0:33

što je neuronska mrežna struktura
0:33 - 0:36

za obuku i testiranje
modela računalnog vida.
0:36 - 0:39

Pa pogledajmo što Darknet misli
0:39 - 0:41

o ovoj slici koju imamo.
0:43 - 0:45

Kad smo pokrenuti naš klasifikator
0:45 - 0:46

na ovoj slici,
0:46 - 0:49

ne dobivamo samo predviđanja
je li to pas ili mačka,
0:49 - 0:51

nego čak i određena predviđanja pasmine.
0:51 - 0:53

To je razina zrnatosti koju imamo sada.
0:53 - 0:55

I to je točno.
0:55 - 0:57

Moj pas je doista malamut.
0:57 - 1:01

Napravili smo nevjerojatne pomake
u klasifikaciji slike,
1:01 - 1:03

ali što se događa kad
pokrenemo klasifikator
1:03 - 1:05

na sliku koja izgleda ovako?
1:07 - 1:08

Dobro ...
1:13 - 1:17

Vidimo da je klasifikator vraća
uz prilično slična predviđanja.
1:17 - 1:20

I to je točno, na slici je malamut,
1:20 - 1:23

ali samo s tom oznakom
ne znamo mnogo
1:23 - 1:25

o tome što se događa na slici.
1:25 - 1:27

Trebamo nešto snažnije.
1:27 - 1:30

Radim na problemu koji se zove
otkrivanje objekta,
1:30 - 1:33

gdje gledamo sliku i
pokušavamo pronaći sve objekte,
1:33 - 1:34

staviti okvire oko njih
1:34 - 1:36

i reći ono što ti predmeti su.
1:36 - 1:40

Evo što se događa kad pokrenemo
detektor na ovoj slici.
1:41 - 1:43

Ovakvom vrstom rezultata
1:43 - 1:46

možemo napraviti puno više
s algoritmima računalnog vida.
1:46 - 1:49

Vidimo da zna da su tu mačka i pas.
1:49 - 1:51

Zna njihove relativne položaje,
1:52 - 1:53

njihovu veličinu.
1:53 - 1:54

Čak može znati neke dodatne informacije.
1:54 - 1:57

U pozadini je knjiga.
1:57 - 2:01

Ako želite izgraditi sustav
na osnovi računalnog vida,
2:01 - 2:04

recimo autonomno vozilo
ili robotski sustav,
2:04 - 2:06

ovo je vrsta informacija koje želite.
2:07 - 2:10

Želite nešto da možete
komunicirati s fizičkim svijetom.
2:11 - 2:13

Kad sam počeo raditi na
prepoznavanju objekata,
2:13 - 2:16

trebalo je 20 sekundi
za obradu jedne slike.
2:16 - 2:20

A kako biste dobili osjećaj zašto je
brzina ovdje tako važna,
2:21 - 2:24

evo primjera detektora objekta
2:24 - 2:26

koji treba dvije sekunde za obradu slike.
2:26 - 2:29

Dakle ovo je 10 puta brže
2:29 - 2:32

od detektora kojem treba
20 sekundi po slici,
2:32 - 2:35

i možete vidjeti da se za vrijeme
dok on učini predviđanja,
2:35 - 2:37

promijenilo čitavo stanje u svijetu,
2:38 - 2:40

i to ne bi bilo vrlo korisno
2:40 - 2:42

za neku primjenu.
2:42 - 2:44

Ako ovo gore ubrzamo
još jednom za faktor 10,
2:44 - 2:47

to je detektor koji radi
na pet sličica u sekundi.
2:47 - 2:49

To je puno bolje,
2:49 - 2:51

ali, na primjer,
2:51 - 2:53

ako postoji bilo kakav značajan pokret,
2:53 - 2:56

ne bih želio da sustav poput ovog
vozi moj auto.
2:57 - 3:00

Ovo je naš sustav otkrivanja
u realnom vremenu na mom laptopu.
3:01 - 3:04

Glatko me prati kako se krećem kroz kadar,
3:04 - 3:08

i otporan je na razne promjene veličine,
3:09 - 3:11

položaja,
3:11 - 3:13

naprijed, natrag.
3:13 - 3:14

Ovo je super.
3:14 - 3:16

To je ono što stvarno trebamo
3:16 - 3:19

ako ćemo graditi sustave
na osnovi računalnog vida,
3:19 - 3:23

(Pljesak)
3:24 - 3:26

U samo nekoliko godina
3:26 - 3:29

došli smo od 20 sekundi po slici
3:29 - 3:33

do 20 milisekundi po slici,
tisuću puta brže.
3:33 - 3:34

Kako smo došli dovde?
3:34 - 3:37

Nekada su sustavi za otkrivanje predmeta
3:37 - 3:39

uzimali sliku poput ove
3:39 - 3:42

i podijelili je na hrpu područja
3:42 - 3:45

i zatim pokrenuli klasifikator
na svakom od tih područja.
3:45 - 3:47

Visoki rezultati za taj klasifikator
3:47 - 3:51

smatrali su se detekcijom u slici.
3:51 - 3:55

No, to je značilo rad klasifikatora
tisuće puta na slici,
3:55 - 3:58

tisuće procjena neuronskih mreža
kako bi dobili detekciju.
3:59 - 4:04

Umjesto toga smo naučili jednu mrežu
da učini sve detekcije za nas.
4:04 - 4:08

Ona istodobno proizvodi sve okvire
i klase vjerojatnosti.
4:09 - 4:12

S našim sustavom, umjesto da
gledate sliku tisuće puta
4:12 - 4:14

kako bi postigao detekciju,
4:14 - 4:15

gledate samo jednom,
4:15 - 4:18

zato ga zovemo YOLO metoda
za detekciju objekta.
4:19 - 4:23

Dakle, ovom brzinom
nismo ograničeni samo na slike;
4:23 - 4:26

možemo obraditi video u realnom vremenu.
4:26 - 4:29

Sad, umjesto da samo vidimo mačku i psa,
4:29 - 4:32

vidimo kako se kreću
i međusobno komuniciraju.
4:35 - 4:37

To je detektor koji smo obučili
4:37 - 4:41

na 80 različitih klasa
4:41 - 4:44

u Microsoftovoj zbirci podataka COCO.
4:44 - 4:48

Ona ima svašta, poput žlice
i vilice, zdjele,
4:48 - 4:49

obične predmete poput tih.
4:50 - 4:53

Ima raznih egzotičnijih stvari:
4:53 - 4:57

životinje, automobili, zebre, žirafe.
4:57 - 4:59

A sada idemo učiniti nešto zabavno.
4:59 - 5:01

Samo ćemo otići u publiku
5:01 - 5:03

i vidjeti što možemo otkriti.
5:03 - 5:04

Želi li tko plišanu životinju?
5:06 - 5:08

Tamo ima nekih medvjedića.
5:10 - 5:15

Možemo malo smanjiti prag detekcije,
5:15 - 5:18

tako da možemo naći više vas u publici.
5:20 - 5:22

Da vidimo možemo li dobiti
ove znakove STOP.
5:22 - 5:24

Nalazimo neke ruksake.
5:26 - 5:28

Zumirajmo samo malo.
5:30 - 5:32

I to je super.
5:32 - 5:35

Sva obrada se događa u stvarnom vremenu
5:35 - 5:36

na laptopu.
5:37 - 5:38

I to je važno zapamtiti
5:38 - 5:42

da je ovo sustav za detekciju objekta
opće namjene,
5:42 - 5:47

možemo ga trenirati za bilo koju domenu.
5:48 - 5:51

Isti kod koji koristimo
5:51 - 5:53

za pronaći znakove STOP ili pješake,
5:53 - 5:55

bicikle u autonomnim vozilima,
5:55 - 5:58

može se koristiti
kako bi pronašli stanice raka
5:58 - 6:01

u biopsiji tkiva.
6:01 - 6:05

A znanstvenici diljem svijeta već
koriste ovu tehnologiju
6:06 - 6:10

za napredak u medicini, robotici.
6:10 - 6:11

Jutros sam pročitao članak
6:11 - 6:16

o popisu životinja u
Nacionalnom parku Nairobi
6:16 - 6:19

koristeći YOLO u sustavu detekcije.
6:19 - 6:22

A to je zato što je Darknet open source,
6:22 - 6:24

u javnoj domeni, besplatan
svakomu za korištenje.
6:26 - 6:31

(Pljesak)
6:31 - 6:36

No, željeli smo napraviti detekciju
još dostupnijom i korisnijom
6:36 - 6:40

pa smo kombinacijom optimizacije modela,
6:40 - 6:43

binarizacije mreže i aproksimacije
6:43 - 6:47

dobili detekciju objekata
koja radi na mobitelu.
6:53 - 6:58

(Pljesak)
6:59 - 7:04

A ja sam stvarno uzbuđen
jer sada imamo moćno rješenje
7:04 - 7:06

problema računalnog vida
na osnovnoj razini,
7:06 - 7:10

i svatko ga može uzeti
i graditi nešto njime.
7:10 - 7:13

Sad je sve ostalo do vas
7:13 - 7:16

i ljudi diljem svijeta
s pristupom tom softveru,
7:16 - 7:20

jedva čekam vidjeti što će
ljudi učiniti s ovom tehnologijom.
7:20 - 7:21

Hvala vam.
7:21 - 7:23

(Pljesak)

Title:: Kako računalo uči trenutačno prepoznavati objekte
Speaker:: Joseph Redmon
Description:: Prije deset godina, istraživači su mislili da je gotovo nemoguće naučiti računalo prepoznati razliku između mačke i psa. Danas sustavi računalnog vida to rade s više od 99 posto točnosti. Kako? Joseph Redmon radi na sustavu YOLO (You Only Look Once), metodi detekcije objekata otvorenog koda koja može prepoznati predmete u slikama i videozapisima - od zebre do zaustavnih znakova - munjevitom brzinom. U izvanrednom demo prikazu, Redmon pokazuje ovaj važan korak naprijed za aplikacije poput autonomnih automobila, robotike, pa čak i otkrivanja raka.

more » « less
Video Language:: English
Team:: closed TED
Project:: TEDTalks
Duration:: 07:37

	Sanda L approved Croatian subtitles for How computers learn to recognize objects instantly
	Sanda L accepted Croatian subtitles for How computers learn to recognize objects instantly
	Sanda L edited Croatian subtitles for How computers learn to recognize objects instantly
	Ivan Nekić edited Croatian subtitles for How computers learn to recognize objects instantly
	Ivan Nekić edited Croatian subtitles for How computers learn to recognize objects instantly
	Ivan Nekić edited Croatian subtitles for How computers learn to recognize objects instantly

Croatian subtitles

Revisions

Revision 4 Edited

Sanda L

Kako računalo uči trenutačno prepoznavati objekte

Revisions

Our website uses cookies

Operating cookies (Required)