Return to Video

Kako računalo uči trenutačno prepoznavati objekte

  • 0:01 - 0:02
    Prije deset godina,
  • 0:02 - 0:05
    istraživači računalnog vida mislili su
    da je naučiti računalo
  • 0:05 - 0:07
    kako razlikovati između mačke i psa
  • 0:08 - 0:09
    gotovo nemoguće,
  • 0:10 - 0:13
    čak i uz značajan napredak
    u razvoju umjetne inteligencije.
  • 0:13 - 0:17
    Sad to možemo učiniti
    s više od 99 posto točnosti.
  • 0:18 - 0:20
    To se zove klasifikacija slike -
  • 0:20 - 0:23
    dati sliku, staviti oznaku na sliku -
  • 0:23 - 0:26
    a računala znaju
    i tisuće drugih kategorija.
  • 0:27 - 0:30
    Ja sam postdiplomac
    na Sveučilištu u Washingtonu
  • 0:30 - 0:32
    i radim na projektu pod nazivom Darknet,
  • 0:32 - 0:33
    što je neuronska mrežna struktura
  • 0:33 - 0:36
    za obuku i testiranje
    modela računalnog vida.
  • 0:36 - 0:39
    Pa pogledajmo što Darknet misli
  • 0:39 - 0:41
    o ovoj slici koju imamo.
  • 0:43 - 0:45
    Kad smo pokrenuti naš klasifikator
  • 0:45 - 0:46
    na ovoj slici,
  • 0:46 - 0:49
    ne dobivamo samo predviđanja
    je li to pas ili mačka,
  • 0:49 - 0:51
    nego čak i određena predviđanja pasmine.
  • 0:51 - 0:53
    To je razina zrnatosti koju imamo sada.
  • 0:53 - 0:55
    I to je točno.
  • 0:55 - 0:57
    Moj pas je doista malamut.
  • 0:57 - 1:01
    Napravili smo nevjerojatne pomake
    u klasifikaciji slike,
  • 1:01 - 1:03
    ali što se događa kad
    pokrenemo klasifikator
  • 1:03 - 1:05
    na sliku koja izgleda ovako?
  • 1:07 - 1:08
    Dobro ...
  • 1:13 - 1:17
    Vidimo da je klasifikator vraća
    uz prilično slična predviđanja.
  • 1:17 - 1:20
    I to je točno, na slici je malamut,
  • 1:20 - 1:23
    ali samo s tom oznakom
    ne znamo mnogo
  • 1:23 - 1:25
    o tome što se događa na slici.
  • 1:25 - 1:27
    Trebamo nešto snažnije.
  • 1:27 - 1:30
    Radim na problemu koji se zove
    otkrivanje objekta,
  • 1:30 - 1:33
    gdje gledamo sliku i
    pokušavamo pronaći sve objekte,
  • 1:33 - 1:34
    staviti okvire oko njih
  • 1:34 - 1:36
    i reći ono što ti predmeti su.
  • 1:36 - 1:40
    Evo što se događa kad pokrenemo
    detektor na ovoj slici.
  • 1:41 - 1:43
    Ovakvom vrstom rezultata
  • 1:43 - 1:46
    možemo napraviti puno više
    s algoritmima računalnog vida.
  • 1:46 - 1:49
    Vidimo da zna da su tu mačka i pas.
  • 1:49 - 1:51
    Zna njihove relativne položaje,
  • 1:52 - 1:53
    njihovu veličinu.
  • 1:53 - 1:54
    Čak može znati neke dodatne informacije.
  • 1:54 - 1:57
    U pozadini je knjiga.
  • 1:57 - 2:01
    Ako želite izgraditi sustav
    na osnovi računalnog vida,
  • 2:01 - 2:04
    recimo autonomno vozilo
    ili robotski sustav,
  • 2:04 - 2:06
    ovo je vrsta informacija koje želite.
  • 2:07 - 2:10
    Želite nešto da možete
    komunicirati s fizičkim svijetom.
  • 2:11 - 2:13
    Kad sam počeo raditi na
    prepoznavanju objekata,
  • 2:13 - 2:16
    trebalo je 20 sekundi
    za obradu jedne slike.
  • 2:16 - 2:20
    A kako biste dobili osjećaj zašto je
    brzina ovdje tako važna,
  • 2:21 - 2:24
    evo primjera detektora objekta
  • 2:24 - 2:26
    koji treba dvije sekunde za obradu slike.
  • 2:26 - 2:29
    Dakle ovo je 10 puta brže
  • 2:29 - 2:32
    od detektora kojem treba
    20 sekundi po slici,
  • 2:32 - 2:35
    i možete vidjeti da se za vrijeme
    dok on učini predviđanja,
  • 2:35 - 2:37
    promijenilo čitavo stanje u svijetu,
  • 2:38 - 2:40
    i to ne bi bilo vrlo korisno
  • 2:40 - 2:42
    za neku primjenu.
  • 2:42 - 2:44
    Ako ovo gore ubrzamo
    još jednom za faktor 10,
  • 2:44 - 2:47
    to je detektor koji radi
    na pet sličica u sekundi.
  • 2:47 - 2:49
    To je puno bolje,
  • 2:49 - 2:51
    ali, na primjer,
  • 2:51 - 2:53
    ako postoji bilo kakav značajan pokret,
  • 2:53 - 2:56
    ne bih želio da sustav poput ovog
    vozi moj auto.
  • 2:57 - 3:00
    Ovo je naš sustav otkrivanja
    u realnom vremenu na mom laptopu.
  • 3:01 - 3:04
    Glatko me prati kako se krećem kroz kadar,
  • 3:04 - 3:08
    i otporan je na razne promjene veličine,
  • 3:09 - 3:11
    položaja,
  • 3:11 - 3:13
    naprijed, natrag.
  • 3:13 - 3:14
    Ovo je super.
  • 3:14 - 3:16
    To je ono što stvarno trebamo
  • 3:16 - 3:19
    ako ćemo graditi sustave
    na osnovi računalnog vida,
  • 3:19 - 3:23
    (Pljesak)
  • 3:24 - 3:26
    U samo nekoliko godina
  • 3:26 - 3:29
    došli smo od 20 sekundi po slici
  • 3:29 - 3:33
    do 20 milisekundi po slici,
    tisuću puta brže.
  • 3:33 - 3:34
    Kako smo došli dovde?
  • 3:34 - 3:37
    Nekada su sustavi za otkrivanje predmeta
  • 3:37 - 3:39
    uzimali sliku poput ove
  • 3:39 - 3:42
    i podijelili je na hrpu područja
  • 3:42 - 3:45
    i zatim pokrenuli klasifikator
    na svakom od tih područja.
  • 3:45 - 3:47
    Visoki rezultati za taj klasifikator
  • 3:47 - 3:51
    smatrali su se detekcijom u slici.
  • 3:51 - 3:55
    No, to je značilo rad klasifikatora
    tisuće puta na slici,
  • 3:55 - 3:58
    tisuće procjena neuronskih mreža
    kako bi dobili detekciju.
  • 3:59 - 4:04
    Umjesto toga smo naučili jednu mrežu
    da učini sve detekcije za nas.
  • 4:04 - 4:08
    Ona istodobno proizvodi sve okvire
    i klase vjerojatnosti.
  • 4:09 - 4:12
    S našim sustavom, umjesto da
    gledate sliku tisuće puta
  • 4:12 - 4:14
    kako bi postigao detekciju,
  • 4:14 - 4:15
    gledate samo jednom,
  • 4:15 - 4:18
    zato ga zovemo YOLO metoda
    za detekciju objekta.
  • 4:19 - 4:23
    Dakle, ovom brzinom
    nismo ograničeni samo na slike;
  • 4:23 - 4:26
    možemo obraditi video u realnom vremenu.
  • 4:26 - 4:29
    Sad, umjesto da samo vidimo mačku i psa,
  • 4:29 - 4:32
    vidimo kako se kreću
    i međusobno komuniciraju.
  • 4:35 - 4:37
    To je detektor koji smo obučili
  • 4:37 - 4:41
    na 80 različitih klasa
  • 4:41 - 4:44
    u Microsoftovoj zbirci podataka COCO.
  • 4:44 - 4:48
    Ona ima svašta, poput žlice
    i vilice, zdjele,
  • 4:48 - 4:49
    obične predmete poput tih.
  • 4:50 - 4:53
    Ima raznih egzotičnijih stvari:
  • 4:53 - 4:57
    životinje, automobili, zebre, žirafe.
  • 4:57 - 4:59
    A sada idemo učiniti nešto zabavno.
  • 4:59 - 5:01
    Samo ćemo otići u publiku
  • 5:01 - 5:03
    i vidjeti što možemo otkriti.
  • 5:03 - 5:04
    Želi li tko plišanu životinju?
  • 5:06 - 5:08
    Tamo ima nekih medvjedića.
  • 5:10 - 5:15
    Možemo malo smanjiti prag detekcije,
  • 5:15 - 5:18
    tako da možemo naći više vas u publici.
  • 5:20 - 5:22
    Da vidimo možemo li dobiti
    ove znakove STOP.
  • 5:22 - 5:24
    Nalazimo neke ruksake.
  • 5:26 - 5:28
    Zumirajmo samo malo.
  • 5:30 - 5:32
    I to je super.
  • 5:32 - 5:35
    Sva obrada se događa u stvarnom vremenu
  • 5:35 - 5:36
    na laptopu.
  • 5:37 - 5:38
    I to je važno zapamtiti
  • 5:38 - 5:42
    da je ovo sustav za detekciju objekta
    opće namjene,
  • 5:42 - 5:47
    možemo ga trenirati za bilo koju domenu.
  • 5:48 - 5:51
    Isti kod koji koristimo
  • 5:51 - 5:53
    za pronaći znakove STOP ili pješake,
  • 5:53 - 5:55
    bicikle u autonomnim vozilima,
  • 5:55 - 5:58
    može se koristiti
    kako bi pronašli stanice raka
  • 5:58 - 6:01
    u biopsiji tkiva.
  • 6:01 - 6:05
    A znanstvenici diljem svijeta već
    koriste ovu tehnologiju
  • 6:06 - 6:10
    za napredak u medicini, robotici.
  • 6:10 - 6:11
    Jutros sam pročitao članak
  • 6:11 - 6:16
    o popisu životinja u
    Nacionalnom parku Nairobi
  • 6:16 - 6:19
    koristeći YOLO u sustavu detekcije.
  • 6:19 - 6:22
    A to je zato što je Darknet open source,
  • 6:22 - 6:24
    u javnoj domeni, besplatan
    svakomu za korištenje.
  • 6:26 - 6:31
    (Pljesak)
  • 6:31 - 6:36
    No, željeli smo napraviti detekciju
    još dostupnijom i korisnijom
  • 6:36 - 6:40
    pa smo kombinacijom optimizacije modela,
  • 6:40 - 6:43
    binarizacije mreže i aproksimacije
  • 6:43 - 6:47
    dobili detekciju objekata
    koja radi na mobitelu.
  • 6:53 - 6:58
    (Pljesak)
  • 6:59 - 7:04
    A ja sam stvarno uzbuđen
    jer sada imamo moćno rješenje
  • 7:04 - 7:06
    problema računalnog vida
    na osnovnoj razini,
  • 7:06 - 7:10
    i svatko ga može uzeti
    i graditi nešto njime.
  • 7:10 - 7:13
    Sad je sve ostalo do vas
  • 7:13 - 7:16
    i ljudi diljem svijeta
    s pristupom tom softveru,
  • 7:16 - 7:20
    jedva čekam vidjeti što će
    ljudi učiniti s ovom tehnologijom.
  • 7:20 - 7:21
    Hvala vam.
  • 7:21 - 7:23
    (Pljesak)
Title:
Kako računalo uči trenutačno prepoznavati objekte
Speaker:
Joseph Redmon
Description:

Prije deset godina, istraživači su mislili da je gotovo nemoguće naučiti računalo prepoznati razliku između mačke i psa. Danas sustavi računalnog vida to rade s više od 99 posto točnosti. Kako? Joseph Redmon radi na sustavu YOLO (You Only Look Once), metodi detekcije objekata otvorenog koda koja može prepoznati predmete u slikama i videozapisima - od zebre do zaustavnih znakova - munjevitom brzinom. U izvanrednom demo prikazu, Redmon pokazuje ovaj važan korak naprijed za aplikacije poput autonomnih automobila, robotike, pa čak i otkrivanja raka.

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
07:37

Croatian subtitles

Revisions