Return to Video

Si po i mësojmë kompjuterat të kuptojnë imazhet

  • 0:02 - 0:06
    Më lejoni t'ju tregoj dicka.
  • 0:06 - 0:10
    (Video) Vajza: Kjo është një
    mace e ulur në krevat.
  • 0:10 - 0:14
    Djali po përkëdhel elefantin.
  • 0:14 - 0:19
    Janë njerëz që po shkojnë drejt
    një aeroplani.
  • 0:19 - 0:21
    Eshtë një aeroplan i madh.
  • 0:21 - 0:24
    Fei-Fei Li: Ky është një fëmijë
    tre-vjeçar
  • 0:24 - 0:27
    duke përshkruar atë që sheh
    në një seri fotosh.
  • 0:27 - 0:30
    Ajo mund të ketë ende shumë
    për të mësuar rreth botës,
  • 0:30 - 0:35
    por ajo është tashmë mjeshtre
    në një detyrë shumë të rëndësishme:
  • 0:35 - 0:38
    të kuptojë se çfarë po sheh.
  • 0:38 - 0:42
    Shoqëria jonë është më shumë se kurrë e
    avancuar teknologjikisht.
  • 0:42 - 0:46
    Ne dërgojmë njerëz në hënë,
    i bëjmë telefonat të komunikojnë me ne
  • 0:46 - 0:51
    apo i përshtasim stacionet e radios
    të luajnë muzikën që na pëlqen.
  • 0:51 - 0:55
    Prapë, makinat dhe kompjuterët tanë
    më të avancuar
  • 0:55 - 0:58
    e kanë të vështirë këtë punë.
  • 0:58 - 1:01
    Jam sot këtu t'ju jap
    një raport të ecurisë
  • 1:01 - 1:05
    mbi zhvillimet më të fundit
    në kërkimet tona në vizionin kompjuterik,
  • 1:05 - 1:10
    një nga teknologjitë më të reja
    dhe potencialisht revolucionare
  • 1:10 - 1:13
    në shkencat kompjuterike.
  • 1:13 - 1:17
    Po, kemi krijuar prototipe të makinave
    që vetë-drejtohen
  • 1:17 - 1:21
    por pa një vizion inteligjent,
    ato nuk mund ta gjejnë ndryshimin
  • 1:21 - 1:25
    midis një qese letre të zhubrosur
    në rrugë, mbi të cilën mund të kalosh,
  • 1:25 - 1:29
    dhe një guri po të të njejtave përmasa,
    i cili duhet shmangur.
  • 1:29 - 1:33
    Ne kemi krijuar kamera
    me rezolucion të lartë,
  • 1:33 - 1:36
    por nuk i kemi dhënë shikim të verbërve.
  • 1:36 - 1:40
    Avionët e telekomanduar fluturojnë gjatë
    dhe mbi hapsira masive toke,
  • 1:40 - 1:42
    por teknologjia vizive
    nuk është e mjaftueshme
  • 1:42 - 1:45
    për të monitoruar ndryshimet
    e pyjeve tropikale.
  • 1:45 - 1:48
    Kamerat e sigurisë janë kudo,
  • 1:48 - 1:53
    por nuk na lajmërojnë kur një fëmijë
    është duke u mbytur në pishinë.
  • 1:54 - 2:00
    Fotot dhe videot po bëhen një pjesë
    e pandashme e jetës globale.
  • 2:00 - 2:04
    Ata po gjenerohen me një ritëm aq të
    shpejtë, sa është e pamundur që
  • 2:04 - 2:07
    një individ, apo një grup individësh
    t'i shohë të gjitha,
  • 2:07 - 2:11
    dhe unë bashkë me ju po kontribojmë
    për këtë qëllim në TED.
  • 2:11 - 2:16
    Megjithatë, programet tona më të avancuara
    e kanë të vështirë ta kuptojnë
  • 2:16 - 2:20
    dhe menaxhojnë këtë sasi kaq të madhe
    informacioni.
  • 2:20 - 2:25
    Pra, me fjalë të tjera,
    bashkarisht si shoqëri,
  • 2:25 - 2:27
    ne jemi disi të verbër,
  • 2:27 - 2:30
    pasi makinat tona më inteligjente
    janë akoma të verbra.
  • 2:32 - 2:34
    "Pse është kaq e vështirë?"
    do të pyesnit ju.
  • 2:34 - 2:37
    Kamerat mund të kapin foto si kjo këtu
  • 2:37 - 2:41
    duke i shndërruar dritat në
    një matricë numrash
  • 2:41 - 2:43
    të njohura si piksela,
  • 2:43 - 2:45
    por këto janë thjesht numra pa jetë.
  • 2:45 - 2:48
    Nuk mbartin ndonjë kuptim në vetvete.
  • 2:48 - 2:52
    Njësoj si të dëgjuarit nuk është njësoj
    si ta kuptosh atë që dëgjon,
  • 2:52 - 2:57
    ashtu dhe të kapësh foto nuk është
    njësoj si të shohësh,
  • 2:57 - 3:00
    dhe me shikimin, ne nënkuptojmë
    dhe të kuptuarin e asaj që shohim.
  • 3:01 - 3:07
    Në fakt, Nënës Natyrë iu deshën
    540 milionë vjet
  • 3:07 - 3:09
    për ta bërë këtë gjë,
  • 3:09 - 3:11
    dhe pjesa më e madhe e mundit
  • 3:11 - 3:17
    shkoi për zhvillimin e aparatit të
    përpunimit vizual në trurin tonë,
  • 3:17 - 3:19
    e jo vetëm për sytë.
  • 3:19 - 3:22
    Pra shikimi fillon me sytë,
  • 3:22 - 3:26
    por në të vërtetë zhvillohet në tru.
  • 3:26 - 3:31
    Kështu për 15 vjet, duke filluar me
    doktoraturën në Caltech
  • 3:31 - 3:34
    dhe më pas në krye të Vision Lab
    në Stanford,
  • 3:34 - 3:39
    kam punuar me mentorët, bashkëpunuesit
    dhe studentët e mi
  • 3:39 - 3:42
    për t'i mësuar kompjuterat të shohin.
  • 3:43 - 3:46
    Fusha jonë kërkimore quhet
    computer vision dhe machine learning.
  • 3:46 - 3:50
    Është pjesë e fushës së përgjithshme të
    inteligjencës artificiale.
  • 3:51 - 3:56
    Përfundimisht, ne duam t'i bëjmë
    kompjuterat të shohin ashtu si vetë ne:
  • 3:56 - 4:02
    të emërtojnë objekte, të identifikojnë
    njerëz, t'i shohin gjërat me 3 dimensione,
  • 4:02 - 4:08
    të kuptojnë marrdhëniet, emocionet,
    veprimet dhe qëllimet.
  • 4:08 - 4:14
    Ne thurim së bashku histori të tëra
    mbi njerëz, vende dhe sende
  • 4:14 - 4:16
    momentin e parë kur i hedhim një vështrim.
  • 4:17 - 4:23
    Hapi i parë drejt këtij qëllimi është
    t'i mësojmë kompjuterat të shohin objekte,
  • 4:23 - 4:26
    baza për ndërtimin e botës vizuale.
  • 4:26 - 4:30
    Në kushtet më të thjeshta,
    imagjinojeni këtë proces
  • 4:30 - 4:33
    si t'i tregosh kompjuterave
    disa imazhe të një objekti të caktuar
  • 4:33 - 4:37
    për shembull, imazhe te maceve,
  • 4:37 - 4:41
    dhe të ndërtosh një model që trajnohet
    dhe mëson nga këto imazhe.
  • 4:41 - 4:43
    Sa e vështirë mund të jetë?
  • 4:43 - 4:47
    Në fund të fundit, një mace është thjesht
    një grumbull formash dhe ngjyrash,
  • 4:47 - 4:52
    dhe me këtë mendim ecëm në ditët e hershme
    të modelimit të objekteve.
  • 4:52 - 4:55
    Ne do të përdornim matematikën
    për t'i treguar algoritmit kompjuterik
  • 4:55 - 4:59
    se një mace ka fytyrë të rrumbullakët,
    një trup topolak,
  • 4:59 - 5:01
    dy veshë me majë, dhe një bisht të gjatë,
  • 5:01 - 5:02
    dhe çdo gjë dukej mirë.
  • 5:03 - 5:05
    Po a do të funksiononte me këtë mace?
  • 5:05 - 5:06
    (Të qeshura)
  • 5:06 - 5:08
    Është komplet e ngatërruar.
  • 5:08 - 5:12
    Në këtë rast duhet t'i shtojmë një formë
    dhe këndvështrim tjetër modelit të objektit.
  • 5:12 - 5:14
    Po nëqoftëse macet janë të fshehura?
  • 5:15 - 5:17
    Po këto mace qesharake?
    (Të qeshura)
  • 5:19 - 5:22
    Tani besoj se e kuptoni ku e kam fjalën.
  • 5:22 - 5:25
    Edhe diçka kaq e thjeshtë
    sa një kafshë shtëpiake
  • 5:25 - 5:29
    përfaqësohet nga variacione të panumërta
    për të krijuar modelin e objektit,
  • 5:29 - 5:32
    dhe ky është vetëm një rast.
  • 5:33 - 5:35
    Pra rreth tetë vjet më parë,
  • 5:35 - 5:40
    një vrojtim mjaft i thjeshtë dhe i thellë
    ndryshoi mënyrën time të të menduarit.
  • 5:41 - 5:44
    Një fëmije askush nuk i mëson si të shohë,
  • 5:44 - 5:46
    veçanërisht në vitet e para të jetës.
  • 5:46 - 5:51
    Ato mësojnë përmes eksperiencave
    dhe shembujve.
  • 5:51 - 5:54
    Nëse i mendojmë sytë e një fëmije
  • 5:54 - 5:57
    si aparate fotografike biologjike,
  • 5:57 - 6:01
    ato kapin një foto çdo 200 millisekonda,
  • 6:01 - 6:04
    që është shpejtësia mesatare e
    lëvizjes së syrit.
  • 6:04 - 6:10
    Kështu deri në moshën tre-vjeçare,
    një fëmijë ka parë qindra miliona foto
  • 6:10 - 6:11
    të botës reale.
  • 6:11 - 6:14
    Këto janë shumë shembuj trajnues.
  • 6:14 - 6:20
    Pra, në vënd që të fokusohemi vetëm te
    përmirësimi i algoritmave,
  • 6:20 - 6:26
    ideja ime ishte t'i ushqenim dhe trajnonim
    algoritmat me atë tip të dhënash
  • 6:26 - 6:29
    që një fëmijë merr përmes eksperiences
  • 6:29 - 6:33
    në cilësi dhe sasi.
  • 6:33 - 6:35
    Me këtë ide,
  • 6:35 - 6:38
    e dinim se na duhej të mblidhnim
    një grup të dhënash
  • 6:38 - 6:42
    që përmban shumë më tepër imazhe
    seç mund të kemi patur ndonjëherë,
  • 6:42 - 6:45
    ndoshta njëmijë herë më shumë,
  • 6:45 - 6:49
    dhe së bashku me Profesorin
    Kai Li të Universitetit Princeton,
  • 6:49 - 6:54
    ne nisëm projektin ImageNet në 2007.
  • 6:54 - 6:57
    Për fat të mirë, nuk na u desh të montonim
    një aparat fotografik në kokë
  • 6:57 - 6:59
    dhe të prisnim për shumë vite.
  • 6:59 - 7:01
    Ne iu drejtuam internetit,
  • 7:01 - 7:05
    thesari më i madh i fotove
    që njerëzit kanë krijuar ndonjëherë.
  • 7:05 - 7:08
    Shkarkuam rreth një bilion imazhe
  • 7:08 - 7:14
    dhe përdorëm crowdsourcing, teknologjinë
    e kontributit të përbashkët online
  • 7:14 - 7:16
    si platformën Amazon Mechanical Turk, për
    të na ndihmuar në etiketimin e imazheve.
  • 7:16 - 7:21
    Në majat e veta, ImageNet ishte një nga
    punëdhënësit më të mëdhenj
  • 7:21 - 7:24
    të punonjësve të Amazon Mechanical Turk:
  • 7:24 - 7:28
    së bashku, gati 50,000 punonjës
  • 7:28 - 7:32
    nga 167 shtete nga e gjithë bota
  • 7:32 - 7:36
    na ndihmuan të përzgjidhnim,
    të klasifikonim dhe të etiketonim
  • 7:36 - 7:40
    rreth nje bilion imazhe potenciale.
  • 7:41 - 7:43
    Kjo ishte puna që u desh
  • 7:43 - 7:47
    për kapjen e çdo fraksioni të
    shëmbëlltyrës
  • 7:47 - 7:51
    që mendja e një fëmije regjistron
    në vitet e para të zhvillimit
  • 7:52 - 7:56
    Në retrospektivë, ideja e përdorimit
    të "big data"
  • 7:56 - 8:01
    për trajnimin e algoritmave kompjuterikë
    mund të duket e qartë tani,
  • 8:01 - 8:05
    por vite më parë, në 2007,
    nuk ishte kaq e qartë.
  • 8:05 - 8:09
    Ne ishim vërtet vetëm në këtë rrugëtim
    për mjaft kohë.
  • 8:09 - 8:14
    Disa kolegë të mitë, miqësisht më
    këshilluan të bëja diçka më të vlefshme,
  • 8:14 - 8:18
    dhe vazhdimisht luftonim
    për financimin e kërkimeve.
  • 8:18 - 8:20
    Njëherë madje, unë bëra shaka
    me studentët e diplomuar
  • 8:20 - 8:24
    se do të hapja sërish dyqanin tim të
    pastrimit kimik për të financuar ImageNet.
  • 8:24 - 8:29
    Në fund të fundit, ashtu arrita
    të financoj dhe studimet e mia.
  • 8:29 - 8:31
    Pra ne vazhduam.
  • 8:31 - 8:35
    Në 2009-n, projekti ImageNet paraqiti
  • 8:35 - 8:39
    një databazë me 15 milion imazhe
  • 8:39 - 8:44
    të klasifikuara në 22,000 klasa
    objektesh dhe gjërash
  • 8:44 - 8:47
    të organizuara sipas fjalëve të përdorura
    në Anglishten e përditshme.
  • 8:47 - 8:50
    Si në cilësi, ashtu dhe në sasi,
  • 8:50 - 8:53
    kjo ishte një arritje e paparë.
  • 8:53 - 8:56
    Si shembull, në rastin e maceve,
  • 8:56 - 8:59
    kemi më shumë se 62,000 mace
  • 8:59 - 9:03
    të të gjitha pamjeve, pozicioneve
  • 9:03 - 9:08
    dhe llojeve të maceve shtëpiake
    apo të egra.
  • 9:08 - 9:12
    Ne ishim të ngazëllyer
    nga puna e bërë me ImageNet,
  • 9:12 - 9:16
    dhe donim që e gjithë bota kërkimore
    të përfitonte nga rezultatet,
  • 9:16 - 9:20
    kështu në një mënyrë të ngjashme me TED,
    ne ia ofruam të dhënat falas
  • 9:20 - 9:23
    komunitetit kërkimor në të gjithë botën.
  • 9:25 - 9:29
    (Duartrokitje)
  • 9:29 - 9:34
    Tani që i kemi të dhënat
    për të ushqyer trurin e kompjuterit,
  • 9:34 - 9:38
    jemi gati t'i rikthehemi algoritmeve.
  • 9:38 - 9:43
    Rezultoi se, pasuria informative e ofruar
    nga ImageNet
  • 9:43 - 9:48
    përkonte në mënyrë të përkryer me një
    kategori të veçantë algoritmesh
  • 9:48 - 9:50
    të machine learning, që quhen
    convolutional neural network,
  • 9:50 - 9:55
    të aplikuar fillimisht nga Kunihiko
    Fukushima, Geoff Hinton, dhe Yann LeCun
  • 9:55 - 9:59
    ne vitet '70 dhe '80.
  • 9:59 - 10:05
    Ashtu si truri që përbëhet nga miliarda
    neurone të lidhura ngushtë,
  • 10:05 - 10:08
    njësia baze operative e një rrjeti
    neuronesh (neural network)
  • 10:08 - 10:11
    është një nyje e ngjashme me neuronin.
  • 10:11 - 10:13
    Ajo merr të dhëna nga nyjet e tjera
  • 10:13 - 10:16
    dhe i dërgon rezultatin e përpunimit
    të tjerave.
  • 10:16 - 10:21
    Për më tepër, këto qindra mijra
    madje edhe miliona nyje
  • 10:21 - 10:24
    janë të organizuara në shtresa hierarkike,
  • 10:24 - 10:27
    gjithashtu të ngjashme me trurin.
  • 10:27 - 10:31
    Në një rrjet tipik neuronesh për të
    trajnuar modelin për njohjen e objekteve,
  • 10:31 - 10:35
    ndodhen 24 milion nyje,
  • 10:35 - 10:38
    140 milion parametra,
  • 10:38 - 10:41
    dhe 15 miliardë lidhje.
  • 10:41 - 10:43
    Ky është një model gjigand.
  • 10:43 - 10:47
    Falë të dhënave masive ofruar nga ImageNet
  • 10:47 - 10:52
    dhe CPU-të dhe GPU-të moderne
    për trajnimin e nje modeli kaq të madh,
  • 10:52 - 10:55
    rrjeti konvolucional i neuroneve
    (convolutional neural network)
  • 10:55 - 10:58
    lulëzoi në një mënyrë që askush se priste.
  • 10:58 - 11:01
    U kthye në një arkitekturë fitimtare
  • 11:01 - 11:06
    për gjenerimin e rezultateve të reja
    në identifikimin e objekteve.
  • 11:06 - 11:09
    Ky është një kompjuter duke na treguar
  • 11:09 - 11:11
    se ky imazh përmban një mace
  • 11:11 - 11:13
    dhe vendin ku macja ndodhet.
  • 11:13 - 11:15
    Sigurisht ekzistojnë dhe gjëra të tjera
    përvec maceve,
  • 11:15 - 11:18
    pra ja një algoritëm komjuterik
    duke na treguar
  • 11:18 - 11:21
    se imazhi përmban nje djalë
    dhe një arush teddy;
  • 11:21 - 11:25
    një qen, një person, dhe një balonë
    të vogël në sfond;
  • 11:25 - 11:28
    apo një imazh shumë i ngarkuar me objekte
  • 11:28 - 11:33
    si një burrë, një skateboard,
    kangjella, e kështu me rradhë.
  • 11:33 - 11:38
    Ndonjëherë, kur kompjuteri nuk është
    mjaft i sigurt për atë që sheh,
  • 11:39 - 11:42
    ne e kemi mësuar të tregohet i zgjuar
  • 11:42 - 11:46
    e të na jap nje përgjigje të vagët por
    më të sigurt, në vend që t'ia fusë kot
  • 11:46 - 11:48
    sic bëjmë ne,
  • 11:48 - 11:53
    por në raste të tjera, algoritmi ynë është
    i jashtëzakonshëm kur na tregon
  • 11:53 - 11:55
    saktësisht se me cilin objekt
    kemi të bëjmë,
  • 11:55 - 11:59
    si përbërjen, modelin, vitin e prodhimit
    të makinave.
  • 11:59 - 12:04
    Ne e aplikuam këtë algoritëm në miliona
    imazhe të Google Street View
  • 12:04 - 12:07
    të qindra qyteteve amerikane,
  • 12:07 - 12:10
    dhe mësuam dicka shumë interesante:
  • 12:10 - 12:14
    së pari, konfirmoi atë qe na
    thotë dhe logjika
  • 12:14 - 12:17
    cmimet e makinave janë
    në përpjestim të drejtë
  • 12:17 - 12:19
    me të ardhurat familjare.
  • 12:19 - 12:24
    Por per cudi, ato lidhen
  • 12:24 - 12:26
    dhe me shkallën e krimit në qytete,
  • 12:27 - 12:31
    apo mënyrën e votimit
    sipas kodeve postare.
  • 12:32 - 12:34
    Prit një minutë. Kaq ishte?
  • 12:34 - 12:39
    Arriti kompjuteri tashmë në të njejtin
    nivel madje dhe më lart se njeriu?
  • 12:39 - 12:42
    Jo kaq shpejt.
  • 12:42 - 12:46
    Deri tani, i kemi mësuar kompjuterit
    të shohë objekte.
  • 12:46 - 12:51
    Si të jetë një fëmijë i vogël
    duke mësuar ca emra.
  • 12:51 - 12:54
    është një arritje e pabesueshme,
  • 12:54 - 12:56
    por është vetëm hapi i parë.
  • 12:56 - 13:00
    Së shpejti do të hidhet një hap
    tjetër i madh zhvillimi,
  • 13:00 - 13:03
    dhe fëmijët do të fillojnë të flasin
    me fjali.
  • 13:03 - 13:08
    Kështu në vënd që të thonë
    se këtu në foto është një mace,
  • 13:08 - 13:13
    ju e dëgjuat tashmë vajzën e vogël duke na
    treguar se macja është shtrirë në krevat.
  • 13:13 - 13:18
    Pra, për t'i mësuar kompjuterit
    të shohë një foto dhe të gjenerojë fjali,
  • 13:18 - 13:22
    bashkimi i ngushtë mes të dhënave
    dhe algoritmit
  • 13:22 - 13:25
    duhet të hedhë një hap tjetër.
  • 13:25 - 13:29
    Tani, kompjuteri duhet të mësojë
    edhe nga imazhet
  • 13:29 - 13:32
    edhe nga gjuha natyrore
  • 13:32 - 13:35
    e folur nga njerëzit.
  • 13:35 - 13:39
    Ashtu sic truri integron
    shikimin me gjuhën,
  • 13:39 - 13:44
    ne zhvilluam një model
    që lidh pjesë vizuale të objekteve
  • 13:44 - 13:46
    si copëza vizuale
  • 13:46 - 13:50
    me fjalë dhe shprehje në fjali.
  • 13:50 - 13:53
    Rreth katër muaj më parë,
  • 13:53 - 13:56
    më në fund i bashkuam të gjitha
  • 13:56 - 13:59
    dhe prodhuam një nga modelet e para
    të vizionit kompjuterik
  • 13:59 - 14:03
    që bën të mundur gjenerimin e fjalive
    të ngjashme me ato që thonë njerëzit
  • 14:03 - 14:07
    kur shohin një foto për herë të parë.
  • 14:07 - 14:12
    Tani, jam gati t'ju tregoj
    se cfare thotë kompjuteri
  • 14:12 - 14:14
    kur sheh të njëjtën foto
  • 14:14 - 14:17
    që vajza e vogël po shihte
    në fillim të kësaj bisede.
  • 14:20 - 14:23
    (Video) Kompjuteri: Një njeri po qëndron
    pranë një elefanti.
  • 14:24 - 14:28
    Një avjon i madh duke qëndruar
    në një pistë aeroporti.
  • 14:29 - 14:33
    FFL: Patjeter, ne po punojmë ende fort
    për përmirësimin e algoritmave tanë,
  • 14:33 - 14:36
    dhe kemi ende shumë për t'i mësuar.
  • 14:36 - 14:38
    (Duartrokitje)
  • 14:40 - 14:43
    Dhe kompjuteri prapë bën gabime.
  • 14:43 - 14:46
    (Video) Kompjuteri: Një mace e shtrirë
    në një krevat në një batanije.
  • 14:46 - 14:49
    FFL: Sigurisht, kur sheh kaq shumë mace,
  • 14:49 - 14:52
    mendon pastaj që cdo gjë
    mund të duket si mace.
  • 14:53 - 14:56
    (Video) Kompjuteri: Një djalë i vogël
    duke mbajtur një shkop bejzbolli.
  • 14:56 - 14:58
    (Të qeshura)
  • 14:58 - 15:03
    FFL: Nëse s'ka parë kurrë furcë dhëmbësh,
    e ngatërron atë me një shkop bejzbolli
  • 15:03 - 15:07
    (Video) Kompjuteri: Një burrë hipur
    mbi kalë në një rrugë pranë një ndërtese.
  • 15:07 - 15:09
    (Të qeshura)
  • 15:09 - 15:12
    FFL: Ende nuk i kemi mësuar art
    kompjuterave.
  • 15:14 - 15:17
    (Video) Kompjuteri: Një zebra duke
    qëndruar në një fushë me bar
  • 15:17 - 15:20
    FFL: Dhe ende nuk ka mësuar të çmojë
    bukurinë mahnitëse të natyrës
  • 15:20 - 15:22
    ashtu siç bëjmë ne.
  • 15:22 - 15:25
    Pra ka qenë një udhëtim i gjatë.
  • 15:25 - 15:30
    Ishte mjaft vështirë të shkonim
    nga mosha zero në tre.
  • 15:30 - 15:35
    Sfida e vërtetë është të shkojmë
    nga tre në 13 e më tej.
  • 15:35 - 15:39
    Më lini t'ju risjell këtë foto
    të djalit me tortën.
  • 15:39 - 15:44
    Deri tani, ne i kemi mësuar kompjuterave
    të shohin sende
  • 15:44 - 15:48
    madje dhe të na tregojnë histori
    të thjeshta duke parë një foto.
  • 15:48 - 15:52
    (Video) Kompjuteri: Nje person i ulur
    pranë tavolinës me një tortë.
  • 15:52 - 15:54
    FFL: Por ka shumë më tepër në këtë foto
  • 15:54 - 15:56
    sesa thjesht një person dhe një tortë.
  • 15:56 - 16:01
    Kompjuteri nuk mund të shohë
    se kjo është një tortë e vecantë italiane
  • 16:01 - 16:04
    që shërbehet vetëm në kohën e Pashkëve.
  • 16:04 - 16:07
    Djali ka veshur bluzën e tij të preferuar
  • 16:07 - 16:11
    të cilën ia ka dhuruar i ati,
    pas një udhëtimi ne Sidney,
  • 16:11 - 16:15
    dhe ne mund ta shohim
    se sa i lumtur është ai
  • 16:15 - 16:18
    dhe cfarë i kalon nëpër mend
    në ato momente.
  • 16:19 - 16:22
    Ky është im bir, Leo.
  • 16:22 - 16:25
    Në kërkimin tim për inteligjencë vizuale,
  • 16:25 - 16:27
    mendoj për Leon vazhdimisht
  • 16:27 - 16:30
    dhe për botën e së ardhmes
    ku ai do të jetojë.
  • 16:30 - 16:32
    Kur një makineri do të mund të shohë,
  • 16:32 - 16:37
    doktorët dhe infermjerët do të kenë
    një palë sy të palodhur shtesë
  • 16:37 - 16:41
    për t'i ndihmuar të përcaktojnë diagnoza
    dhe të kujdesen për pacientët.
  • 16:41 - 16:45
    Makinat do të vozitin në mënyrë
    më inteligjente dhe më të sigurtë
  • 16:45 - 16:48
    Robotët, jo vetëm njerëzit,
  • 16:48 - 16:53
    do të na ndihmojnë të deportojmë në zonat
    e fatkeqësive, të shpëtojmë të plagosurit
  • 16:54 - 16:58
    Ne do të zbulojmë specie të reja,
    materiale më të mira,
  • 16:58 - 17:02
    dhe do të eksplorojmë kufij të padukshëm
    me ndihmën e kompjuterave
  • 17:03 - 17:07
    Dalë ngadalë, po i japim kompjuterit
    aftësinë për të parë.
  • 17:07 - 17:10
    Në fillim i mësojmë të shohin.
  • 17:10 - 17:13
    Më pas, ata na ndihmojnë ne të shohim
    më mirë.
  • 17:13 - 17:17
    Për herë të parë, sytë njerëzorë,
    nuk do të jenë të vetmit
  • 17:17 - 17:20
    që do të shohin dhe eksplorojnë botën.
  • 17:20 - 17:23
    Nuk do t'i përdorim kompjuterat
    vetëm për inteligjencën,
  • 17:23 - 17:30
    por do të bashkëpunojmë me to
    në mënyra që as nuk mund t'i imagjinojmë.
  • 17:30 - 17:32
    Ky është qëllimi im:
  • 17:32 - 17:34
    t'i japim kompjuterave
    inteligjencë vizuale
  • 17:34 - 17:40
    dhe të krijojmë një të ardhme më të mirë
    për Leon dhe botën.
  • 17:40 - 17:41
    Faleminderit.
  • 17:41 - 17:45
    (Duartrokitje)
Title:
Si po i mësojmë kompjuterat të kuptojnë imazhet
Speaker:
Fei-Fei Li
Description:

Kur një vajzë e vogël sheh një foto, ajo mund të identifikojë elementë të thjeshtë: "macja", "libri", "karrigia". Tani, kompjuterat po zhvillohen mjaftueshëm që dhe ata të bëjnë të njejtën gjë. Çfarë vjen më pas? Në një fjalim drithërues, ekspertja në vizionin komjuterik (computer vision), Fei-Fei Li përshkruan punën e bërë -- duke përfshirë një databazë prej 15 milion fotosh që skuadra e saj ndërtoi për të "edukuar" kompjuterat të kuptojnë imazhet -- dhe çfarë premton e ardhmja.

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
17:58

Albanian subtitles

Revisions