Return to Video

Hogyan tanulnak a számítógépek alkotókészséget

  • 0:01 - 0:04
    A Google-nál a gépi intelligenciával
    foglalkozó részleget vezetem.
  • 0:04 - 0:08
    Ez a mérnöki terület számítógépeket
    és készülékeket tesz alkalmassá arra,
  • 0:08 - 0:11
    hogy az emberi agyéhoz hasonló
    tevékenységet végezzenek.
  • 0:11 - 0:15
    Ez sarkall bennünket arra,
    hogy az aggyal
  • 0:15 - 0:16
    és az idegtudománnyal foglalkozzunk,
  • 0:16 - 0:20
    különösen azzal, amiben agyunk egyelőre
  • 0:20 - 0:24
    jócskán fölülmúlja a számítógépet.
  • 0:25 - 0:29
    Történetileg az egyik ilyen terület
    az érzékelés folyamata,
  • 0:29 - 0:32
    amelyben a környezetünkben lévő dolgok
  • 0:32 - 0:33
    – hangok és képek –
  • 0:34 - 0:36
    agyunkban fogalommá alakulnak.
  • 0:36 - 0:39
    Tudatunk számára ez nélkülözhetetlen,
  • 0:39 - 0:41
    de igen hasznos a számítógépeknek is.
  • 0:42 - 0:45
    A gépi érzékelés algoritmusai
    – csoportunk ezen dolgozik –
  • 0:45 - 0:49
    teszik az önök Google Photoson
    lévő fotóit kereshetővé annak alapján,
  • 0:49 - 0:50
    hogy mi látható rajtuk.
  • 0:52 - 0:55
    Az érzékelés másik oldala
    az alkotókészség:
  • 0:55 - 0:58
    az elképzelések valóra váltása.
  • 0:58 - 1:03
    A gépi érzékeléssel végzett munkánk
    2015-ben váratlanul
  • 1:03 - 1:07
    hozzákapcsolódott a gépi alkotókészséghez
  • 1:07 - 1:08
    és a gépi művészethez.
  • 1:09 - 1:12
    Az hiszem, Michelangelo
    nagyon is beleérzett
  • 1:12 - 1:16
    az érzékelés és az alkotókészség
    közötti kettős viszonyba.
  • 1:16 - 1:18
    Van egy híres mondása:
  • 1:18 - 1:21
    "Minden kőtömb szobrot rejt a belsejében,
  • 1:22 - 1:25
    és a szobrász dolga, hogy kiszabadítsa."
  • 1:26 - 1:29
    Azt hiszem, Michelangelo ezen azt értette,
  • 1:29 - 1:32
    hogy érzékelés útján alkotunk,
  • 1:32 - 1:35
    és az érzékelés nem más,
    mint a képzelet folyamata
  • 1:36 - 1:38
    és az alkotókészség terméke.
  • 1:39 - 1:43
    A gondolkodás, az érzékelés
    és a képzelet irányítója
  • 1:43 - 1:44
    természetesen az agy.
  • 1:45 - 1:48
    Egy történeti áttekintéssel
    szeretném kezdeni,
  • 1:48 - 1:50
    hogy mit tudunk az agyunkról.
  • 1:50 - 1:53
    Mert eltérően a szívtől és a belektől,
  • 1:53 - 1:56
    ránézésre nem sokat mondhatunk az agyról,
  • 1:56 - 1:58
    ha csupán szabad szemmel nézzük.
  • 1:58 - 2:00
    Az agyat vizsgáló első anatómusok
  • 2:00 - 2:04
    a felszíni képleteknek
    furcsa neveket adtak,
  • 2:04 - 2:07
    pl. a hippokampusz csikóhalat jelent.
  • 2:07 - 2:09
    Persze a nevek nem sokat
    árulnak el arról,
  • 2:09 - 2:12
    hogy mi zajlik belül.
  • 2:13 - 2:16
    Az első, aki valóban sokat tett azért,
  • 2:16 - 2:18
    hogy megtudjuk, mi történik az agyban,
  • 2:18 - 2:22
    Santiago Ramón y Cajal,
    a nagy spanyol ideganatómus volt
  • 2:22 - 2:24
    a 19. században.
  • 2:24 - 2:28
    Mikroszkópot használt,
    és különleges eljárást alkalmazott,
  • 2:28 - 2:32
    amellyel szelektíven tudta
    megfesteni az egyes idegsejteket,
  • 2:32 - 2:34
    jó kontrasztot érve el a megjelenítésben,
  • 2:34 - 2:37
    hogy alaktanuk érthetőbb legyen.
  • 2:38 - 2:41
    Ilyesféle képeket készített
    az idegsejtekről
  • 2:41 - 2:42
    a 19. században:
  • 2:42 - 2:44
    Ezt egy madár agyáról készült.
  • 2:44 - 2:47
    Látják, milyen hihetetlenül
    változatosak a különféle sejtek;
  • 2:47 - 2:51
    ekkor még maga
    a sejtelmélet is vadonatúj volt.
  • 2:51 - 2:52
    Ezek a képletek,
  • 2:52 - 2:54
    ezek a dendritnyúlványok a sejteken,
  • 2:54 - 2:57
    ezek az ágacskák, amelyek igen
    messze ki tudnak nyúlni,
  • 2:57 - 2:58
    akkoriban újdonságnak számítottak.
  • 2:59 - 3:02
    Vezetékekre emlékeztetnek.
  • 3:02 - 3:05
    Ez a 19. században némelyeknek
    kézenfekvőnek tűnt:
  • 3:05 - 3:10
    éppen folyamatban volt a vezetékek
    és a villamosság forradalma.
  • 3:10 - 3:11
    De több vonatkozásban
  • 3:11 - 3:14
    Ramón y Cajal mikroanatómiai rajzai,
  • 3:15 - 3:17
    mint ez is, fölülmúlhatatlanok.
  • 3:17 - 3:19
    Még most, egy bő évszázaddal később is
  • 3:19 - 3:22
    csak törekszünk bevégezni
    a Cajal által megkezdett munkát.
  • 3:22 - 3:25
    Ezek a nyers adatok itt partnereinktől,
  • 3:25 - 3:28
    a Max Planck Idegtudományi
    Intézetből származnak.
  • 3:28 - 3:30
    Partnereink képet készítettek
  • 3:30 - 3:34
    az agyszövet pirinyó részeiről.
  • 3:34 - 3:38
    Az itt látható minta
    összességében is csupán 1 mm³,
  • 3:38 - 3:40
    én pedig ennek is
    csak egy pici részét mutatom.
  • 3:40 - 3:43
    A bal oldali vonás kb. 1 mikron.
  • 3:43 - 3:45
    Az itt látható képletek a mitokondriumok,
  • 3:45 - 3:47
    ezek baktériumméretűek.
  • 3:47 - 3:49
    Ezek pedig a nagyon parányi szövetdarab
  • 3:49 - 3:52
    folytatólagos metszetei.
  • 3:52 - 3:55
    Csak összevetésül:
  • 3:55 - 3:58
    egy átlagos hajszál átmérője
    kb. 100 mikron.
  • 3:58 - 4:01
    Ami szemünk előtt van,
    az sokkal-sokkal kisebb,
  • 4:01 - 4:02
    mint a hajszál vastagsága.
  • 4:02 - 4:06
    Ha ezeknek az elektronmikroszkópos
    metszeteknek a sorozatából
  • 4:06 - 4:11
    3D-ben rekonstruáljuk az idegsejteket,
    valami ilyet kapunk.
  • 4:11 - 4:14
    Ezek jellegükben hasonlítanak
    Ramón y Cajal képeire.
  • 4:14 - 4:16
    Csak pár idegsejt van megvilágítva,
  • 4:16 - 4:19
    különben nem látnánk semmit,
  • 4:19 - 4:20
    olyan zsúfolt lenne a kép
  • 4:20 - 4:21
    az egy-egy idegsejtet
  • 4:21 - 4:24
    a többivel összekötő vezetékgubanctól.
  • 4:25 - 4:28
    Ramón y Cajal egy kissé megelőzte korát;
  • 4:28 - 4:31
    az agy megértésének folyamata
    csak lassan haladt
  • 4:31 - 4:33
    a következő évtizedek során.
  • 4:33 - 4:36
    Tudtuk, hogy az idegsejtek az
    elektromosságot használják,
  • 4:36 - 4:39
    és a II. világháború idejére
    technológiánk elég fejlett volt ahhoz,
  • 4:39 - 4:42
    hogy élő idegsejteken valódi
    kísérleteket végezzünk
  • 4:42 - 4:44
    villamos árammal,
    hogy működésüket megértsük.
  • 4:45 - 4:49
    Ugyanebben az időben találták föl -
    az agy működését alapul véve -
  • 4:49 - 4:52
    a számítógépet, avagy
    az "értelmes szerkezetet",
  • 4:52 - 4:55

    ahogy Alan Turing,
  • 4:55 - 4:57
    a számítástechnika egyik atyja nevezte,
  • 4:58 - 5:02
    Warren McCulloch és Walter Pitts
    megvizsgálta
  • 5:02 - 5:04
    Cajalnak a látókéregről készített,
  • 5:04 - 5:05
    itt látható rajzát.
  • 5:06 - 5:10
    Ez az agykéreg dolgozza föl
    a szemünkből érkező képeket.
  • 5:10 - 5:14
    Számukra ez olyan volt,
    mint egy kapcsolási rajz.
  • 5:14 - 5:18
    Sok részlet McCulloch
    és Pitts kapcsolási rajzán
  • 5:18 - 5:20
    nem teljesen pontos.
  • 5:20 - 5:21
    De az alapelv,
  • 5:21 - 5:25
    hogy a látókéreg úgy működik,
    mint számítási egységek sorozata,
  • 5:25 - 5:28
    amelyek egymásnak adják
    tovább az információt,
  • 5:28 - 5:29
    alapvetően helyes.
  • 5:29 - 5:32
    Beszéljünk egy kicsit arról,
  • 5:32 - 5:36
    hogy mit kéne csinálnia egy képi
    információt földolgozó modellnek.
  • 5:36 - 5:39
    Az érzékelés fő feladata,
  • 5:39 - 5:43
    hogy rögzítse az ilyen képet,
    és jelentse ki:
  • 5:43 - 5:44
    "ez egy madár",
  • 5:44 - 5:47
    ami agyunknak gyerekjáték.
  • 5:47 - 5:51
    De mindannyiuknak tudnunk kell,
    hogy a számítógép számára ez
  • 5:51 - 5:54
    néhány éve megoldhatatlan feladat volt.
  • 5:54 - 5:56
    A klasszikus számítási paradigma alapján
  • 5:56 - 5:58
    ez nem egykönnyen megoldható feladat.
  • 5:59 - 6:02
    Ami a pixelek között történik,
  • 6:02 - 6:06
    a madár képe és a "madár" szó között,
    lényegében annyi,
  • 6:06 - 6:08
    hogy az idegsejtek egy halmaza
  • 6:08 - 6:10
    összekapcsolódott egy ideghálózatban,
  • 6:10 - 6:11
    ahogy itt fölvázolom.
  • 6:11 - 6:15
    Ez lehet egy élő sejtekből álló
    neuronhálózat a látókéregben,
  • 6:15 - 6:17
    vagy annak egy számítógépe modellje,
  • 6:17 - 6:19
    aminek elkészítésére ma már
    kezdünk képesek lenni.
  • 6:20 - 6:22
    Megmutatom, hogy néz ez ki.
  • 6:22 - 6:26
    A képpontok fölfoghatók
    az idegsejtek első rétegeként,
  • 6:26 - 6:28
    és valóban így működik ez a szemben;
  • 6:28 - 6:29
    ezek a recehártyán lévő idegsejtek.
  • 6:29 - 6:31
    Aztán továbbadják a következő rétegnek,
  • 6:31 - 6:34
    egyik a másiknak, egymás után,
    mindegyik a következőnek,
  • 6:34 - 6:38
    ezek mind különböző súllyal szereplő
    szinapszissal vannak összekötve.
  • 6:38 - 6:39
    A hálózat viselkedését
  • 6:39 - 6:42
    a szinapszisok erőssége jellemzi.
  • 6:42 - 6:46
    Ezek írják le a hálózat
    számítási tulajdonságait.
  • 6:46 - 6:47
    A végeredmény
  • 6:47 - 6:50
    egy idegsejt, vagy sejtek kis csoportja,
  • 6:50 - 6:52
    amelyek fölvillannak,
    és azt mondják: madár.
  • 6:52 - 6:55
    Ezt a három dolgot mutatom meg:
  • 6:55 - 7:00
    a bemeneti képpontokat,
    az ideghálózat szinapszisait,
  • 7:00 - 7:01
    és a madarat, a kimenetet,
  • 7:01 - 7:04
    Három változó, az x, w és y segítségével.
  • 7:05 - 7:07
    Talán milliónyi x,
  • 7:07 - 7:09
    milliónyi képpont van ezen a képen.
  • 7:09 - 7:11
    Milliárdnyi vagy billiónyi w létezik,
  • 7:11 - 7:14
    ami az ideghálózatban lévő
    szinapszisok súlyát jellemzi.
  • 7:14 - 7:16
    Az y-ok - a hálózati kimenetek - száma
  • 7:16 - 7:18
    viszont egy elég kis szám.
  • 7:18 - 7:20
    A "madár" csak öt betű, ugye?
  • 7:21 - 7:25
    Tegyünk úgy, mintha ez
    az egyszerű képlet létezne:
  • 7:25 - 7:27
    x "*" w = y
  • 7:27 - 7:29
    Idézőjelbe tettem a szorzásjelet,
  • 7:29 - 7:31
    mert persze ott egy sor
  • 7:31 - 7:34
    nagyon bonyolult matematikai művelet áll.
  • 7:35 - 7:36
    Ez egy egyenlet.
  • 7:36 - 7:38
    Három változója van.
  • 7:38 - 7:41
    Tudjuk, hogy ha van egy egyenletünk,
  • 7:41 - 7:45
    megoldhatjuk az egyik változóra,
    ha ismerjük a másik kettőt.
  • 7:45 - 7:49
    A levezetés problémája,
  • 7:49 - 7:51
    azaz hogy kiderítsük,
    hogy a madár képe egy madáré,
  • 7:51 - 7:53
    így foglalható össze:
  • 7:53 - 7:56
    az y az ismeretlen, w és x ismert.
  • 7:56 - 7:59
    Ismerjük az ideghálózatot
    és a képpontokat.
  • 7:59 - 8:02
    Látható, hogy a feladat
    viszonylag egyszerű.
  • 8:02 - 8:04
    Összeszorozzuk a kettőt
    a hárommal, és kész.
  • 8:05 - 8:07
    Mutatok egy mesterséges ideghálózatot,
  • 8:07 - 8:10
    amit mostanában építettünk,
    és ami pontosan ezt csinálja.
  • 8:10 - 8:12
    Valós időben működik mobilon,
  • 8:13 - 8:16
    és az már önmagában is csodálatos,
  • 8:16 - 8:19
    hogy a mobiltelefonok másodpercenként
    milliárdnyi vagy billiónyi
  • 8:19 - 8:21
    műveletre képesek.
  • 8:21 - 8:22
    Előttünk egy telefon,
  • 8:22 - 8:26
    amely folyamatosan madárképeket pörget,
  • 8:26 - 8:29
    és nemcsak azt mondja,
    hogy: "Igen, ez madár",
  • 8:29 - 8:32
    hanem a hálózat segítségével
    a madárfajt is fölismeri.
  • 8:33 - 8:35
    A képen
  • 8:35 - 8:39
    x és w ismert, y az ismeretlen.
  • 8:39 - 8:41
    Átsiklok a legbonyolultabb
    részeken, nevezetesen:
  • 8:41 - 8:45
    hogy a pokolba számoljuk ki w-t,
  • 8:45 - 8:47
    és hogyan képes erre az agy?
  • 8:47 - 8:49
    Hogyan hozhatunk létre ilyen modellt?
  • 8:49 - 8:53
    Tehát ez tanulási folyamat:
    megoldás keresése w-re.
  • 8:53 - 8:55
    Ha ezt egy egyszerű egyenletre tesszük,
  • 8:55 - 8:57
    ahol az ismeretleneket számnak tekintjük,
  • 8:57 - 9:00
    akkor pontosan tudjuk,
    miként kell a 6 = 2 * w -t megoldani.,
  • 9:00 - 9:03
    mindkét oldalt 2-vel kell osztani.
  • 9:04 - 9:06
    A bökkenő ezzel az operátorral van.
  • 9:07 - 9:08
    Osztás...
  • 9:08 - 9:11
    Azért osztást alkalmaztunk,
    mert ez a szorzás inverze,
  • 9:11 - 9:13
    de ahogy már mondtam,
  • 9:13 - 9:15
    itt nem igazi szorzásról van szó.
  • 9:15 - 9:18
    Ez itt egy igen kacifántos,
    nemlineáris művelet;
  • 9:18 - 9:20
    és nincs inverze.
  • 9:20 - 9:23
    Rá kell jönnünk, milyen módszerrel
    oldható meg az egyenlet
  • 9:23 - 9:25
    osztási művelet nélkül.
  • 9:25 - 9:28
    A módszer elég egyszerű.
  • 9:28 - 9:30
    Alkalmazzunk egy kis algebrai trükköt,
  • 9:30 - 9:33
    és vigyük át a 6-ost
    az egyenlet jobb oldalára.
  • 9:33 - 9:35
    A szorzás továbbra is megvan.
  • 9:36 - 9:39
    A nullát meg tekintsük a hiba mértékének.
  • 9:39 - 9:42
    Azaz, ha w-re helyesen
    oldjuk meg az egyenletet,
  • 9:42 - 9:43
    a hiba nulla lesz.
  • 9:43 - 9:45
    Ha a megoldás nem teljesen helyes,
  • 9:45 - 9:47
    a hiba nullánál nagyobb lesz.
  • 9:47 - 9:51
    Most a hiba minimalizálása végett
    próbálgatnunk kell,
  • 9:51 - 9:53
    ebben pedig a számítógép igen jó.
  • 9:53 - 9:55
    Kiinduló becslésnek ezt vettük:
  • 9:55 - 9:56
    mi a helyzet, ha w = 0?
  • 9:56 - 9:57
    Akkor a hiba 6-tal egyenlő.
  • 9:57 - 9:59
    És ha w = 1? Akkor a hiba 4.
  • 9:59 - 10:01
    Akkor a gép játszhatja
    a Marco Polo-játékot,
  • 10:01 - 10:04
    és a hibát nullához közelítheti.
  • 10:04 - 10:07
    Így w fokozatos közelítéseit kapjuk.
  • 10:07 - 10:11
    Általában nem kapunk pontos eredményt,
    de tucatnyi lépés után
  • 10:11 - 10:15
    w = 2,999-et kapunk,
    ami elég jó közelítés.
  • 10:16 - 10:18
    Ez tanulási folyamat.
  • 10:18 - 10:21
    Ne feledjük, hogy az történt,
  • 10:21 - 10:25
    hogy vettünk egy csomó
    ismert x-et és ismert y-t,
  • 10:25 - 10:29
    és iterációs úton kerestünk
    w-re egy megoldást.
  • 10:29 - 10:32
    Pontosan ilyen módszerrel
    tanulunk mi magunk is.
  • 10:32 - 10:35
    Kisbabakorunkban sok képet látunk,
  • 10:35 - 10:37
    és valaki azt mondja:
    "Ez madár, ez nem madár."
  • 10:38 - 10:40
    Idővel iteráció révén
  • 10:40 - 10:43
    megoldjuk w-re, megtaláljuk
    az idegi kapcsolatokat.
  • 10:43 - 10:48
    Most az y kiszámolásához
    ismert az x és a w;
  • 10:48 - 10:49
    ez a mindennapi, gyors érzékelés.
  • 10:49 - 10:51
    Megoldást találni w-re,
  • 10:51 - 10:53
    ez tanulás, ami jóval nehezebb,
  • 10:53 - 10:55
    mert a hibát minimalizálni kell,
  • 10:55 - 10:57
    sok gyakorlópélda segítségével.
  • 10:57 - 11:00
    Alex Mordvintsev kollégánk kb. egy éve
    elhatározta, hogy kipróbálja,
  • 11:00 - 11:04
    mi van, ha x-re
    próbálunk megoldást keresni
  • 11:04 - 11:06
    w és y ismeretében.
  • 11:06 - 11:07
    Másként fogalmazva,
  • 11:07 - 11:09
    tudjuk, hogy ez egy madár,
  • 11:09 - 11:12
    és ideghálózatunk már
    be van tanítva madarakra,
  • 11:12 - 11:14
    de milyen is egy madár képe?
  • 11:15 - 11:20
    Kiderül, hogy ez is működik, ha ugyanazt
    a hibaminimalizáló eljárást alkalmazzuk
  • 11:20 - 11:24
    a madarak fölismerésére
    betanított hálózatra,
  • 11:24 - 11:27
    és az eredménye egy kép,
  • 11:30 - 11:32
    amelyen madarak láthatók.
  • 11:33 - 11:37
    Ezt a képet a madarak
    fölismerésére betanított
  • 11:37 - 11:38
    neurális hálózat
    hozta létre egyszerűen úgy,
  • 11:38 - 11:42
    hogy x-re, nem pedig y-ra
    kerestük a megoldást
  • 11:42 - 11:43
    közelítő eljárással.
  • 11:44 - 11:46
    Ez pedig egy másik érdekes példa.
  • 11:46 - 11:49
    Ezt egyik kollégánk, Mike Tyka csinálta,
  • 11:49 - 11:51
    és az állatok fölvonulásának nevezte el.
  • 11:51 - 11:54
    Engem William Kentridge
    műalkotásaira emlékeztet:
  • 11:54 - 11:57
    vázlatokat készít, kitörli őket,
  • 11:57 - 11:58
    vázlatokat készít, kitörli,
  • 11:58 - 12:00
    és így készít filmet.
  • 12:00 - 12:01
    Ebben az esetben Mike
  • 12:01 - 12:04
    y-t futtatja végig különféle állatokon,
  • 12:04 - 12:06
    egy állatok fölismerésére
  • 12:06 - 12:09
    és megkülönböztetésére
    tervezett hálózaton.
  • 12:09 - 12:12
    Így ilyen furcsán, Escher-szerűen
    tűnik át egyik állat a másikba.
  • 12:14 - 12:19
    Itt Mike és Alex megpróbált
    az összes y alapján
  • 12:19 - 12:22
    egyetlen kétdimenziós képet létrehozni,
  • 12:22 - 12:25
    a hálózat által felismert
    valamennyi tárgyat
  • 12:25 - 12:27
    a síkba leképezve.
  • 12:27 - 12:29
    Efféle szintézist elvégezve,
  • 12:29 - 12:31
    a teljes felületet használva,
  • 12:31 - 12:34
    y variálásával ilyesféle
    leképezést készítünk:
  • 12:34 - 12:37
    a vizuális megjelenítését mindannak,
    amit a hálózat felismer.
  • 12:37 - 12:40
    Minden állat itt van;
    ez itt az armadillo, azaz a tatu.
  • 12:41 - 12:43
    Ugyanez megtehető
    másfajta hálózatokkal is.
  • 12:43 - 12:46
    Ezt a hálózatot
    arcfölismerésre hozták létre,
  • 12:46 - 12:49
    hogy képes legyen arcokat
    megkülönböztetni egymástól.
  • 12:49 - 12:52
    Itt az y jelentése: "én",
  • 12:52 - 12:53
    az én arcom paraméterei.
  • 12:53 - 12:55
    Amikor ez megoldást keres x-re,
  • 12:55 - 12:58
    az eredmény az én idétlen, kubista,
  • 12:58 - 13:02
    szürreális és pszichedelikus képem,
  • 13:02 - 13:04
    egyidejűleg különböző nézőpontokból.
  • 13:04 - 13:07
    Az egyidejű különböző nézőpontok indoka:
  • 13:07 - 13:10
    a hálózatot úgy tervezték,
    hogy megszabaduljon a félreértésektől,
  • 13:10 - 13:13
    amelyek az arc eltérő helyzeteiből
  • 13:13 - 13:16
    vagy az eltérő megvilágításból adódhatnak.
  • 13:16 - 13:18
    Ha ilyen rekonstrukciót végzünk,
  • 13:18 - 13:21
    és nem használunk támpontul
    valamilyen képet
  • 13:21 - 13:22
    vagy statisztikát,
  • 13:22 - 13:26
    akkor a különféle nézőpontok
    valami káosza keletkezik,
  • 13:26 - 13:27
    mert félreérthető.
  • 13:28 - 13:32
    Ez az eredmény, ha Alex támpontul
    tulajdon arcát használja
  • 13:32 - 13:35
    az optimalizálás folyamán
    az én arcom rekonstruálásához.
  • 13:36 - 13:39
    Láthatóan nem tökéletes.
  • 13:39 - 13:41
    Még sok a teendőnk
  • 13:41 - 13:43
    a folyamat optimalizálásában.
  • 13:43 - 13:46
    De a kapott arc már kivehetőbb,
  • 13:46 - 13:48
    ha a támpontul az én arcom szolgált.
  • 13:49 - 13:51
    Nem szükséges
  • 13:51 - 13:53
    nulláról kezdenünk.
  • 13:53 - 13:54
    Ha x-et keressük,
  • 13:54 - 13:58
    kezdhetjük egy másik képhez
    tartozó x-szel,
  • 13:58 - 14:00
    ahogy ezen a kis bemutatón is látható.
  • 14:00 - 14:05
    E hálózat különféle tárgyak -
    pl. állatok, ember alkotta struktúrák -
  • 14:05 - 14:08

    osztályba sorolására készült.
  • 14:08 - 14:10
    Itt egyszerűen felhők képével kezdünk,
  • 14:10 - 14:12
    és ahogy optimalizálunk,
  • 14:12 - 14:17
    a hálózat eldönti,
    hogy mit lát bele a felhőkbe.
  • 14:17 - 14:19
    Minél tovább nézzük,
  • 14:19 - 14:22
    annál több dolgot látunk beléjük.
  • 14:23 - 14:26
    Használhatjuk az arcfölismerő hálózatot,
    hogy arcokat lássunk bele,
  • 14:26 - 14:28
    és eléggé észbontó dolgokhoz jutunk.
  • 14:28 - 14:29
    (Nevetés)
  • 14:30 - 14:33
    Mike végzett egy másik kísérletet:
  • 14:33 - 14:37
    vette ezt a felhős képet,
  • 14:37 - 14:41
    értelmeztette, zoomolt, értelmeztette,
    zoomolt, értelmeztette, zoomolt...
  • 14:41 - 14:42
    Ily módon
  • 14:42 - 14:45
    szerintem a hálózatnak amolyan
    disszociatív fugaállapotához jutunk,
  • 14:46 - 14:49
    vagy valamiféle szabad asszociációkhoz,
  • 14:49 - 14:51
    amelyben a hálózat saját farkába harap.
  • 14:51 - 14:55
    Mindegyik kép láttán az jár az eszünkben,
  • 14:55 - 14:57
    hogy vajon mit látok majd a következőn,
  • 14:57 - 14:59
    és a következőn, és a következőn.
  • 14:59 - 15:02
    Ezt nyilvánosan először Seattle-ben
  • 15:02 - 15:08
    egy Felsőoktatás c. előadáson mutattam be,
  • 15:08 - 15:10
    rögtön a marihuána legalizálása után.
  • 15:10 - 15:13
    (Nevetés)
  • 15:15 - 15:17
    Azzal a megjegyzéssel zárnám gyorsan,
  • 15:17 - 15:21
    hogy a technológia lehetőségei
    beláthatatlanok.
  • 15:21 - 15:25
    Csupán vizuális példákat hoztam föl,
    mert ezek nagyon mutatósak.
  • 15:25 - 15:27
    Nemcsak képi technológia létezik.
  • 15:27 - 15:29
    Művész munkatársunk, Ross Goodwin,
  • 15:29 - 15:33
    kísérleteihez fényképezőgépet használ,
    amely készít egy fölvételt,
  • 15:33 - 15:37
    majd a hátizsákjában lévő számítógép
  • 15:37 - 15:39
    e fénykép tartalmából
    ihletet merítve verset ír.
  • 15:39 - 15:42
    E költői neurális hálózatot
    a 20.századi költészet
  • 15:42 - 15:44
    egy terjedelmes gyűjteménye
    alapján hozták létre.
  • 15:44 - 15:46
    Szerintem az így készült versek
  • 15:46 - 15:48
    nem is olyan rosszak.
  • 15:48 - 15:49
    (Nevetés)
  • 15:49 - 15:50
    Végezetül,
  • 15:50 - 15:53
    ami Michelangelót illeti,
  • 15:53 - 15:54
    úgy vélem, igaza volt:
  • 15:54 - 15:57
    az észlelés és az alkotókészség
    szorosan összefügg.
  • 15:58 - 16:00
    Amiket láttunk, azok olyan
    neurális hálózatok,
  • 16:00 - 16:03
    amelyeket arra tanítottak,
    hogy megkülönböztessenek
  • 16:03 - 16:05
    és fölismerjenek különböző tárgyakat,
  • 16:05 - 16:08
    és amelyek fordított irányú működésre,
    generálásra is képesek.
  • 16:08 - 16:10
    Nemcsak azért gondolom ezt,
  • 16:10 - 16:12
    mert Michelangelo tényleg látta
  • 16:12 - 16:15
    a szobrot a kőtömb belsejében,
  • 16:15 - 16:18
    hanem mert bármely teremtmény,
    lény, Földön kívüli,
  • 16:18 - 16:22
    amely ilyen észlelésre képes,
  • 16:22 - 16:23
    képes alkotni is,
  • 16:23 - 16:27
    mert ezek mindkét esetben
    pontosan ugyanazon műveletek.
  • 16:27 - 16:31
    Azt hiszem, hogy az észlelés
    és az alkotás semmi esetre sem
  • 16:31 - 16:33
    korlátozódik az emberre.
  • 16:33 - 16:36
    Kezdenek megjelenni olyan számítógépes
    modellek, amelyek képesek ugyanerre.
  • 16:36 - 16:40
    Ez nem meglepő, hiszen az agy is
    egy sajátságos számítógép.
  • 16:40 - 16:42
    Végül, az informatika
  • 16:42 - 16:46
    a mesterséges értelem létrehozására
    tett kísérletként indult.
  • 16:46 - 16:48
    Jórészt azt modellezte le,
  • 16:48 - 16:51
    hogy miként tehetjük a gépeket okossá.
  • 16:52 - 16:54
    Most kezdjük lassacskán beváltani
  • 16:54 - 16:56
    az útkeresők bizonyos ígéreteit:
  • 16:56 - 16:58
    Turingét, Neumann Jánosét,
  • 16:59 - 17:00
    McCullochét és Pittsét.
  • 17:01 - 17:04
    Azt hiszem, az informatika
    nem korlátozódik a könyvelésre,
  • 17:05 - 17:07
    a Candy Crush játékra vagy ilyesmikre.
  • 17:07 - 17:10
    A kezdetektől fogva agyunk
    alapján modelleztük.
  • 17:10 - 17:12
    Hozzájárul agyunk jobb megértéséhez,
  • 17:12 - 17:14
    és képességei kiterjesztéséhez.
  • 17:15 - 17:16
    Köszönöm szépen.
  • 17:16 - 17:21
    (Taps)
Title:
Hogyan tanulnak a számítógépek alkotókészséget
Speaker:
Blaise Agüera y Arcas
Description:

A művészet és az alkotókészség újabb határmezsgyéjén járunk, ez pedig nem emberi jellegű. Blaise Agüera y Arcas, a Google vezető kutatója a gépi észlelésre és elosztott tanulásra szolgáló mély neurális hálózatokkal foglalkozik. Lebilincselő előadásában bemutatja, hogy a neurális hálózatok miként tanulják meg képek fölismerését és az ellenkező irányú folyamatot: létrehozásukat. Az eredmény: látványos, hallucinációs kollázsok, sőt, versek is, amelyek dacolnak a műfaji osztályba sorolással. "Az észlelés és az alkotókészség szorosan összefügg" – mondja Agüera y Arcas. "Bármely teremtmény, lény, Földön kívüli, amely észlelésre képes, képes alkotásra is",

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
17:34

Hungarian subtitles

Revisions