Cara komputer belajar mengenali objek secara langsung

0:01 - 0:02

Sepuluh tahun lalu,
0:02 - 0:05

peneliti penglihatan komputer
merasa bahwa memerintahkan
0:05 - 0:07

komputer membedakan kucing dan anjing
0:08 - 0:09

hampir dikatakan mustahil,
0:10 - 0:13

bahkan dengan kemajuan signifikan
dalam bidang kecerdasan buatan.
0:13 - 0:17

Sekarang, kita dapat melakukannya
dengan akurasi lebih dari 99 persen.
0:18 - 0:20

Inilah yang disebut klasifikasi gambar,
0:20 - 0:23

taruhlah satu gambar,
beri label gambar itu,
0:23 - 0:26

dan komputer juga akan tahu
ribuan kategori lainnya.
0:27 - 0:30

Saya mahasiswa pascasarjana
di University of Washington,
0:30 - 0:31

dan sedang mengerjakan projek Darknet,
0:32 - 0:33

yaitu kerangka kerja jaringan saraf
0:33 - 0:36

untuk melatih dan menguji
model penglihatan komputer.
0:36 - 0:39

Mari kita lihat apa yang Darknet pikirkan
0:39 - 0:41

mengenai gambar ini.
0:43 - 0:45

Saat kita menjalankan alat klasifikasi
0:45 - 0:46

pada gambar ini,
0:46 - 0:49

kita melihat tidak hanya
prediksi anjing dan kucing,
0:49 - 0:51

tetapi juga prediksi turunannya
secara spesifik.
0:51 - 0:53

Kita juga mendapat
prediksi lebih detail lagi.
0:53 - 0:55

Yap, itu benar.
0:55 - 0:57

Anjing saya memang
dari jenis malamute.
0:57 - 1:01

Kita sudah membuat langkah luar biasa
dalam klasifikasi gambar,
1:01 - 1:03

bagaimana jika alat klasifikasi dijalankan
1:03 - 1:05

pada gambar seperti ini?
1:07 - 1:08

Mari kita lihat...
1:13 - 1:17

Alat klasifikasi memberikan
prediksi yang lumayan mirip.
1:17 - 1:20

Yap, itu benar, ada seekor malamute
dalam gambar,
1:20 - 1:23

tapi jika hanya dari labelnya,
kita tidak tahu banyak tentang
1:23 - 1:25

apa yang terjadi dalam gambar itu.
1:25 - 1:27

Kita butuh lebih dari itu.
1:27 - 1:30

Saya memikirkan satu persoalan
disebut deteksi objek,
1:30 - 1:33

yaitu kita melihat gambar dan
mencoba mencari semua objek,
1:33 - 1:34

membuat kotak pembatas,
1:34 - 1:36

dan melabeli semua objek itu.
1:36 - 1:40

Jadi, seperti inilah jika detektor
dijalankan pada gambar.
1:41 - 1:43

Dengan hasil seperti ini, banyak yang bisa
1:44 - 1:46

dilakukan dengan algoritme
penglihatan komputer.
1:46 - 1:49

Bisa kita lihat bahwa komputer
tahu ada kucing dan anjing,
1:49 - 1:51

tahu lokasi relatif dan juga
1:52 - 1:53

ukuran hewan-hewan itu.
1:53 - 1:55

Bahkan ia juga tahu informasi lainya.
1:55 - 1:57

Ada buku di belakang sana.
1:57 - 2:01

Jika Anda ingin membuat sistem
berkekuatan penglihatan komputer,
2:01 - 2:04

misalnya mobil otonom
atau sistem robotika,
2:04 - 2:06

inilah jenis informasi
yang Anda inginkan.
2:07 - 2:10

Ada tentu butuh sesuatu agar
dapat berinteraksi dengan dunia fisik.
2:11 - 2:13

Ketika mulai mengerjakan deteksi objek,
2:13 - 2:16

butuh waktu 20 detik untuk
memproses satu gambar.
2:16 - 2:20

Agar Anda memahami alasan betapa kecepatan
sangat penting dalam domain ini,
2:21 - 2:24

inilah contoh pendeteksi objek
2:24 - 2:26

yang butuh waktu 2 detik
untuk memproses 1 gambar.
2:26 - 2:29

Proses ini 10 kali lebih cepat
2:29 - 2:32

daripada alat deteksi 20-detik-per-gambar,
2:32 - 2:35

dan dapat Anda lihat bahwa selagi
komputer memprediksi,
2:35 - 2:37

keadaan lingkungan sekitarnya berubah,
2:38 - 2:40

tentu hal ini tidak akan berguna
2:40 - 2:42

bagi aplikasi.
2:42 - 2:44

Jika kita tingkatkan kecepatan
hingga 10 kali lipat,
2:44 - 2:47

pendeteksi ini berjalan dengan
lima bingkai per detik.
2:47 - 2:49

Dan menjadi jauh lebih baik,
2:49 - 2:51

tetapi seandainya,
2:51 - 2:53

ada pergerakan yang signifikan,
2:53 - 2:56

saya tidak ingin sistem ini
mengemudikan mobil saya.
2:57 - 3:00

Sistem deteksi kita ini beroperasi di
laptop dalam waktu nyata.
3:01 - 3:04

Dengan mulus ia melacak selagi
saya bergerak di sekitar bingkai,
3:04 - 3:08

dan cekatan dalam mendeteksi
berbagai perubahan ukuran,
3:09 - 3:11

pose,
3:11 - 3:13

ke depan, ke belakang.
3:13 - 3:14

Luar biasa.
3:14 - 3:16

Ini yang sangat kita butuhkan
3:16 - 3:19

jika akan membuat sistem berkekuatan
penglihatan komputer.
3:19 - 3:23

(Tepuk tangan)
3:24 - 3:26

Hanya dalam beberapa tahun,
3:26 - 3:29

ada kemajuan dari 20 detik per gambar
3:29 - 3:33

menjadi 20 milidetik per gambar,
seribu kali lebih cepat.
3:33 - 3:34

Bagaimana bisa demikian?
3:34 - 3:37

Dulu, sistem deteksi objek
3:37 - 3:39

menggunakan gambar seperti ini
3:39 - 3:42

dan membaginya menjadi
sekelompok area
3:42 - 3:45

lalu menjalankan alat klasifikasi
pada masing-masing area,
3:45 - 3:47

dan skor tinggi dari alat klasifikasi
3:47 - 3:51

dianggap sebagai deteksi dalam gambar.
3:51 - 3:55

Tetapi metode ini mengharuskan ribuan kali
deteksi pada satu gambar,
3:55 - 3:58

ribuan evaluasi kerangka saraf
untuk menghasilkan deteksi.
3:59 - 4:04

Alih-alih, kami melatih satu jaringan
untuk melakukan semua deteksi.
4:04 - 4:08

Jaringan itu memunculkan kotak pembatas
sekaligus probabilitas kelas.
4:09 - 4:12

Dengan sistem ini, alih-alih melihat
satu gambar ribuan kali
4:12 - 4:14

untuk menghasilkan deteksi,
4:14 - 4:15

Anda cukup lihat sekali,
4:15 - 4:18

oleh karena itulah kami menyebutnya
metode deteksi objek YOLO.
4:19 - 4:23

Dengan kecepatan seperti ini,
kita dapat memproses tidak hanya gambar,
4:23 - 4:26

tetapi juga video dalam waktu nyata.
4:26 - 4:29

Sehingga, alih-alih hanya
melihat kucing dan anjing,
4:29 - 4:32

kita juga dapat melihat hewan ini
bergerak dan berinteraksi.
4:35 - 4:37

Inilah pendeteksi yang kami latih
4:37 - 4:41

pada 80 kelas berbeda
4:41 - 4:44

dalam dataset COCO milik Microsoft.
4:44 - 4:48

Dataset ini memiliki semua jenis benda,
sendok dan garpu, mangkuk
4:48 - 4:49

benda-benda umum semacam itu.
4:50 - 4:53

Juga ada beragam benda eksotik lainnya:
4:53 - 4:57

binatang, mobil, zebra, jerapah.
4:57 - 4:59

Mari kita lakukan sesuatu yang menarik.
4:59 - 5:01

Saya akan mengarahkan kamera ke penonton
5:01 - 5:03

dan lihatlah benda yang dapat terdeteksi.
5:03 - 5:04

Ada yang mau boneka hewan?
5:06 - 5:08

Ada beberapa boneka beruang di sana.
5:10 - 5:15

Kita dapat menurunkan
ambang pendeteksinya sedikit,
5:15 - 5:18

agar ia dapat mendeteksi
lebih banyak penonton.
5:20 - 5:22

Ada rambu berhenti yang terdeteksi.
5:22 - 5:24

Ada tas ransel.
5:26 - 5:28

Mari kita perbesar sedikit.
5:30 - 5:32

Luar biasa.
5:32 - 5:35

Semua proses ini terjadi saat ini juga
5:35 - 5:36

dengan laptop.
5:37 - 5:39

Penting untuk diingat bahwa
5:39 - 5:42

inilah tujuan umum
sistem deteksi objek,
5:42 - 5:47

agar kami dapat melatihnya
pada domain gambar mana pun.
5:48 - 5:51

Kode yang sama yang kita pakai untuk
5:51 - 5:53

menemukan tanda berhenti
atau pejalan kaki,
5:53 - 5:55

sepeda dan mobil otonom,
5:55 - 5:58

yang dapat dipakai untuk
menemukan sel kanker
5:58 - 6:01

dalam biopsi jaringan.
6:01 - 6:05

Ada banyak peneliti di seluruh dunia
yang sudah menggunakan teknologi ini
6:06 - 6:10

untuk pengembangan dalam
obat-obatan, robotika.
6:10 - 6:11

Tadi pagi saya membaca koran
6:11 - 6:16

bahwa ada sensus binatang
di Taman Nasional Nairobi
6:16 - 6:19

menggunakan YOLO sebagai
bagian dari sistem deteksi ini.
6:19 - 6:22

Itu karena Darknet adalah sumber terbuka
6:22 - 6:24

ada di domain publik,
gratis untuk siapa saja.
6:26 - 6:31

(Tepuk tangan)
6:31 - 6:36

Tapi kami ingin agar teknologi ini
lebih mudah diperoleh dan berguna,
6:36 - 6:40

jadi melalui kombinasi
pengoptimalan model,
6:40 - 6:43

binarisasi dan pendekatan jaringan,
6:43 - 6:47

kita punya deteksi obyek yang
berjalan dalam ponsel.
6:53 - 6:58

(Tepuk tangan)
6:59 - 7:04

Dan saya sangat senang karena
sekarang ada solusi yang cukup kuat
7:04 - 7:06

atas masalah penglihatan
komputer level rendah,
7:06 - 7:10

dan siapa pun boleh mengambil dan
membuat sesuatu dengan memakainya.
7:10 - 7:13

Selebihnya terserah Anda
dan orang-orang
7:13 - 7:16

di seluruh dunia yang mengakses
perangkat lunak ini,
7:16 - 7:20

saya tidak sabar ingin melihat apa yang
mereka buat dengan teknologi ini.
7:20 - 7:21

Terima kasih.
7:21 - 7:25

(Tepuk tangan)

Title:: Cara komputer belajar mengenali objek secara langsung
Speaker:: Joseph Redmon
Description:: Sepuluh tahun lalu, peneliti menganggap bahwa memerintahkan komputer membedakan kucing dan anjing adalah hal yang hampir mustahil. Sekarang, sistem penglihatan komputer melakukannya dengan akurasi lebih dari 99 persen. Bagaimana bisa? Joseph Redmon mengerjakan sistem YOLO (You Only Look Once/Anda hanya melihat sekali), sebuah metode sumber terbuka deteksi objek yang dapat mengidentifikasi objek dalam gambar dan video -- mulai dari zebra hingga rambu tanda berhenti -- secepat kilat. Melalui demo langsung yang luar biasa, Redmon memamerkan kemajuan penting ini untuk aplikasi seperti mobil otonom (tanpa supir), robotika, dan bahkan deteksi kanker.

more » « less
Video Language:: English
Team:: closed TED
Project:: TEDTalks
Duration:: 07:37

	Ade Indarta approved Indonesian subtitles for How computers learn to recognize objects instantly
	Ade Indarta edited Indonesian subtitles for How computers learn to recognize objects instantly
	Rifkul Uswati accepted Indonesian subtitles for How computers learn to recognize objects instantly
	Rifkul Uswati edited Indonesian subtitles for How computers learn to recognize objects instantly
	Rifkul Uswati edited Indonesian subtitles for How computers learn to recognize objects instantly
	Rifkul Uswati edited Indonesian subtitles for How computers learn to recognize objects instantly
	Rifkul Uswati edited Indonesian subtitles for How computers learn to recognize objects instantly
	Rifkul Uswati edited Indonesian subtitles for How computers learn to recognize objects instantly

Show all

Indonesian subtitles

Revisions

Revision 20 Edited

Ade Indarta

Cara komputer belajar mengenali objek secara langsung

Revisions

Our website uses cookies

Operating cookies (Required)