Return to Video

Cara komputer belajar mengenali objek secara langsung

  • 0:01 - 0:02
    Sepuluh tahun lalu,
  • 0:02 - 0:05
    peneliti penglihatan komputer
    merasa bahwa memerintahkan
  • 0:05 - 0:07
    komputer membedakan kucing dan anjing
  • 0:08 - 0:09
    hampir dikatakan mustahil,
  • 0:10 - 0:13
    bahkan dengan kemajuan signifikan
    dalam bidang kecerdasan buatan.
  • 0:13 - 0:17
    Sekarang, kita dapat melakukannya
    dengan akurasi lebih dari 99 persen.
  • 0:18 - 0:20
    Inilah yang disebut klasifikasi gambar,
  • 0:20 - 0:23
    taruhlah satu gambar,
    beri label gambar itu,
  • 0:23 - 0:26
    dan komputer juga akan tahu
    ribuan kategori lainnya.
  • 0:27 - 0:30
    Saya mahasiswa pascasarjana
    di University of Washington,
  • 0:30 - 0:31
    dan sedang mengerjakan projek Darknet,
  • 0:32 - 0:33
    yaitu kerangka kerja jaringan saraf
  • 0:33 - 0:36
    untuk melatih dan menguji
    model penglihatan komputer.
  • 0:36 - 0:39
    Mari kita lihat apa yang Darknet pikirkan
  • 0:39 - 0:41
    mengenai gambar ini.
  • 0:43 - 0:45
    Saat kita menjalankan alat klasifikasi
  • 0:45 - 0:46
    pada gambar ini,
  • 0:46 - 0:49
    kita melihat tidak hanya
    prediksi anjing dan kucing,
  • 0:49 - 0:51
    tetapi juga prediksi turunannya
    secara spesifik.
  • 0:51 - 0:53
    Kita juga mendapat
    prediksi lebih detail lagi.
  • 0:53 - 0:55
    Yap, itu benar.
  • 0:55 - 0:57
    Anjing saya memang
    dari jenis malamute.
  • 0:57 - 1:01
    Kita sudah membuat langkah luar biasa
    dalam klasifikasi gambar,
  • 1:01 - 1:03
    bagaimana jika alat klasifikasi dijalankan
  • 1:03 - 1:05
    pada gambar seperti ini?
  • 1:07 - 1:08
    Mari kita lihat...
  • 1:13 - 1:17
    Alat klasifikasi memberikan
    prediksi yang lumayan mirip.
  • 1:17 - 1:20
    Yap, itu benar, ada seekor malamute
    dalam gambar,
  • 1:20 - 1:23
    tapi jika hanya dari labelnya,
    kita tidak tahu banyak tentang
  • 1:23 - 1:25
    apa yang terjadi dalam gambar itu.
  • 1:25 - 1:27
    Kita butuh lebih dari itu.
  • 1:27 - 1:30
    Saya memikirkan satu persoalan
    disebut deteksi objek,
  • 1:30 - 1:33
    yaitu kita melihat gambar dan
    mencoba mencari semua objek,
  • 1:33 - 1:34
    membuat kotak pembatas,
  • 1:34 - 1:36
    dan melabeli semua objek itu.
  • 1:36 - 1:40
    Jadi, seperti inilah jika detektor
    dijalankan pada gambar.
  • 1:41 - 1:43
    Dengan hasil seperti ini, banyak yang bisa
  • 1:44 - 1:46
    dilakukan dengan algoritme
    penglihatan komputer.
  • 1:46 - 1:49
    Bisa kita lihat bahwa komputer
    tahu ada kucing dan anjing,
  • 1:49 - 1:51
    tahu lokasi relatif dan juga
  • 1:52 - 1:53
    ukuran hewan-hewan itu.
  • 1:53 - 1:55
    Bahkan ia juga tahu informasi lainya.
  • 1:55 - 1:57
    Ada buku di belakang sana.
  • 1:57 - 2:01
    Jika Anda ingin membuat sistem
    berkekuatan penglihatan komputer,
  • 2:01 - 2:04
    misalnya mobil otonom
    atau sistem robotika,
  • 2:04 - 2:06
    inilah jenis informasi
    yang Anda inginkan.
  • 2:07 - 2:10
    Ada tentu butuh sesuatu agar
    dapat berinteraksi dengan dunia fisik.
  • 2:11 - 2:13
    Ketika mulai mengerjakan deteksi objek,
  • 2:13 - 2:16
    butuh waktu 20 detik untuk
    memproses satu gambar.
  • 2:16 - 2:20
    Agar Anda memahami alasan betapa kecepatan
    sangat penting dalam domain ini,
  • 2:21 - 2:24
    inilah contoh pendeteksi objek
  • 2:24 - 2:26
    yang butuh waktu 2 detik
    untuk memproses 1 gambar.
  • 2:26 - 2:29
    Proses ini 10 kali lebih cepat
  • 2:29 - 2:32
    daripada alat deteksi 20-detik-per-gambar,
  • 2:32 - 2:35
    dan dapat Anda lihat bahwa selagi
    komputer memprediksi,
  • 2:35 - 2:37
    keadaan lingkungan sekitarnya berubah,
  • 2:38 - 2:40
    tentu hal ini tidak akan berguna
  • 2:40 - 2:42
    bagi aplikasi.
  • 2:42 - 2:44
    Jika kita tingkatkan kecepatan
    hingga 10 kali lipat,
  • 2:44 - 2:47
    pendeteksi ini berjalan dengan
    lima bingkai per detik.
  • 2:47 - 2:49
    Dan menjadi jauh lebih baik,
  • 2:49 - 2:51
    tetapi seandainya,
  • 2:51 - 2:53
    ada pergerakan yang signifikan,
  • 2:53 - 2:56
    saya tidak ingin sistem ini
    mengemudikan mobil saya.
  • 2:57 - 3:00
    Sistem deteksi kita ini beroperasi di
    laptop dalam waktu nyata.
  • 3:01 - 3:04
    Dengan mulus ia melacak selagi
    saya bergerak di sekitar bingkai,
  • 3:04 - 3:08
    dan cekatan dalam mendeteksi
    berbagai perubahan ukuran,
  • 3:09 - 3:11
    pose,
  • 3:11 - 3:13
    ke depan, ke belakang.
  • 3:13 - 3:14
    Luar biasa.
  • 3:14 - 3:16
    Ini yang sangat kita butuhkan
  • 3:16 - 3:19
    jika akan membuat sistem berkekuatan
    penglihatan komputer.
  • 3:19 - 3:23
    (Tepuk tangan)
  • 3:24 - 3:26
    Hanya dalam beberapa tahun,
  • 3:26 - 3:29
    ada kemajuan dari 20 detik per gambar
  • 3:29 - 3:33
    menjadi 20 milidetik per gambar,
    seribu kali lebih cepat.
  • 3:33 - 3:34
    Bagaimana bisa demikian?
  • 3:34 - 3:37
    Dulu, sistem deteksi objek
  • 3:37 - 3:39
    menggunakan gambar seperti ini
  • 3:39 - 3:42
    dan membaginya menjadi
    sekelompok area
  • 3:42 - 3:45
    lalu menjalankan alat klasifikasi
    pada masing-masing area,
  • 3:45 - 3:47
    dan skor tinggi dari alat klasifikasi
  • 3:47 - 3:51
    dianggap sebagai deteksi dalam gambar.
  • 3:51 - 3:55
    Tetapi metode ini mengharuskan ribuan kali
    deteksi pada satu gambar,
  • 3:55 - 3:58
    ribuan evaluasi kerangka saraf
    untuk menghasilkan deteksi.
  • 3:59 - 4:04
    Alih-alih, kami melatih satu jaringan
    untuk melakukan semua deteksi.
  • 4:04 - 4:08
    Jaringan itu memunculkan kotak pembatas
    sekaligus probabilitas kelas.
  • 4:09 - 4:12
    Dengan sistem ini, alih-alih melihat
    satu gambar ribuan kali
  • 4:12 - 4:14
    untuk menghasilkan deteksi,
  • 4:14 - 4:15
    Anda cukup lihat sekali,
  • 4:15 - 4:18
    oleh karena itulah kami menyebutnya
    metode deteksi objek YOLO.
  • 4:19 - 4:23
    Dengan kecepatan seperti ini,
    kita dapat memproses tidak hanya gambar,
  • 4:23 - 4:26
    tetapi juga video dalam waktu nyata.
  • 4:26 - 4:29
    Sehingga, alih-alih hanya
    melihat kucing dan anjing,
  • 4:29 - 4:32
    kita juga dapat melihat hewan ini
    bergerak dan berinteraksi.
  • 4:35 - 4:37
    Inilah pendeteksi yang kami latih
  • 4:37 - 4:41
    pada 80 kelas berbeda
  • 4:41 - 4:44
    dalam dataset COCO milik Microsoft.
  • 4:44 - 4:48
    Dataset ini memiliki semua jenis benda,
    sendok dan garpu, mangkuk
  • 4:48 - 4:49
    benda-benda umum semacam itu.
  • 4:50 - 4:53
    Juga ada beragam benda eksotik lainnya:
  • 4:53 - 4:57
    binatang, mobil, zebra, jerapah.
  • 4:57 - 4:59
    Mari kita lakukan sesuatu yang menarik.
  • 4:59 - 5:01
    Saya akan mengarahkan kamera ke penonton
  • 5:01 - 5:03
    dan lihatlah benda yang dapat terdeteksi.
  • 5:03 - 5:04
    Ada yang mau boneka hewan?
  • 5:06 - 5:08
    Ada beberapa boneka beruang di sana.
  • 5:10 - 5:15
    Kita dapat menurunkan
    ambang pendeteksinya sedikit,
  • 5:15 - 5:18
    agar ia dapat mendeteksi
    lebih banyak penonton.
  • 5:20 - 5:22
    Ada rambu berhenti yang terdeteksi.
  • 5:22 - 5:24
    Ada tas ransel.
  • 5:26 - 5:28
    Mari kita perbesar sedikit.
  • 5:30 - 5:32
    Luar biasa.
  • 5:32 - 5:35
    Semua proses ini terjadi saat ini juga
  • 5:35 - 5:36
    dengan laptop.
  • 5:37 - 5:39
    Penting untuk diingat bahwa
  • 5:39 - 5:42
    inilah tujuan umum
    sistem deteksi objek,
  • 5:42 - 5:47
    agar kami dapat melatihnya
    pada domain gambar mana pun.
  • 5:48 - 5:51
    Kode yang sama yang kita pakai untuk
  • 5:51 - 5:53
    menemukan tanda berhenti
    atau pejalan kaki,
  • 5:53 - 5:55
    sepeda dan mobil otonom,
  • 5:55 - 5:58
    yang dapat dipakai untuk
    menemukan sel kanker
  • 5:58 - 6:01
    dalam biopsi jaringan.
  • 6:01 - 6:05
    Ada banyak peneliti di seluruh dunia
    yang sudah menggunakan teknologi ini
  • 6:06 - 6:10
    untuk pengembangan dalam
    obat-obatan, robotika.
  • 6:10 - 6:11
    Tadi pagi saya membaca koran
  • 6:11 - 6:16
    bahwa ada sensus binatang
    di Taman Nasional Nairobi
  • 6:16 - 6:19
    menggunakan YOLO sebagai
    bagian dari sistem deteksi ini.
  • 6:19 - 6:22
    Itu karena Darknet adalah sumber terbuka
  • 6:22 - 6:24
    ada di domain publik,
    gratis untuk siapa saja.
  • 6:26 - 6:31
    (Tepuk tangan)
  • 6:31 - 6:36
    Tapi kami ingin agar teknologi ini
    lebih mudah diperoleh dan berguna,
  • 6:36 - 6:40
    jadi melalui kombinasi
    pengoptimalan model,
  • 6:40 - 6:43
    binarisasi dan pendekatan jaringan,
  • 6:43 - 6:47
    kita punya deteksi obyek yang
    berjalan dalam ponsel.
  • 6:53 - 6:58
    (Tepuk tangan)
  • 6:59 - 7:04
    Dan saya sangat senang karena
    sekarang ada solusi yang cukup kuat
  • 7:04 - 7:06
    atas masalah penglihatan
    komputer level rendah,
  • 7:06 - 7:10
    dan siapa pun boleh mengambil dan
    membuat sesuatu dengan memakainya.
  • 7:10 - 7:13
    Selebihnya terserah Anda
    dan orang-orang
  • 7:13 - 7:16
    di seluruh dunia yang mengakses
    perangkat lunak ini,
  • 7:16 - 7:20
    saya tidak sabar ingin melihat apa yang
    mereka buat dengan teknologi ini.
  • 7:20 - 7:21
    Terima kasih.
  • 7:21 - 7:25
    (Tepuk tangan)
Title:
Cara komputer belajar mengenali objek secara langsung
Speaker:
Joseph Redmon
Description:

Sepuluh tahun lalu, peneliti menganggap bahwa memerintahkan komputer membedakan kucing dan anjing adalah hal yang hampir mustahil. Sekarang, sistem penglihatan komputer melakukannya dengan akurasi lebih dari 99 persen. Bagaimana bisa? Joseph Redmon mengerjakan sistem YOLO (You Only Look Once/Anda hanya melihat sekali), sebuah metode sumber terbuka deteksi objek yang dapat mengidentifikasi objek dalam gambar dan video -- mulai dari zebra hingga rambu tanda berhenti -- secepat kilat. Melalui demo langsung yang luar biasa, Redmon memamerkan kemajuan penting ini untuk aplikasi seperti mobil otonom (tanpa supir), robotika, dan bahkan deteksi kanker.

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
07:37

Indonesian subtitles

Revisions