즉각적 사물 인식을 컴퓨터가 학습하는 과정

0:01 - 0:02

십년 전 만해도
0:02 - 0:05

컴퓨터 시각 연구자들은
0:05 - 0:07

개와 고양이를 컴퓨터가
구별해 내는 것은
0:08 - 0:09

거의 불가능하다 생각했습니다.
0:10 - 0:13

아무리 인공지능이
발전해도 말이지요.
0:13 - 0:17

지금은 99% 이상 정확하게
그 일이 가능한데,
0:18 - 0:20

이것을 '이미지 분류' 라고 합니다.
0:20 - 0:23

이미지 마다 이름표를 붙여주면
0:23 - 0:26

컴퓨터는 수천 개의 다른
유형까지 알아냅니다.
0:27 - 0:30

저는 워싱턴 대학교에서
석사과정을 밟고 있고
0:30 - 0:31

'다크넷' 이라 불리는
프로젝트를 연구하고 있습니다.
0:32 - 0:33

일종의 신경망 체제의 프로그램인데
0:35 - 0:36

컴퓨터 시각 견본을
교육하고 실험하는데 쓰입니다.
0:36 - 0:39

자 이제,
'다크넷'이 어떤 식으로
0:39 - 0:41

이 이미지를 인식하는지 보겠습니다.
0:43 - 0:45

지금 이 이미지에
0:45 - 0:46

저희가 개발한 선별법을 적용하면
0:46 - 0:49

단지 개 또는 고양이의
예측 뿐만 아니라
0:49 - 0:51

자세한 종까지도 알아 낼 수 있습니다.
0:51 - 0:53

이미 이 정도로
세밀한 수준에 올라와 있습니다.
0:53 - 0:55

아주 정확하기까지 합니다.
0:55 - 0:57

제 반려견은 말라뮤트 입니다.
0:57 - 1:01

'이미지 선별법'이 엄청나게
발전을 해왔는데
1:01 - 1:03

이런 종류의 이미지에
저희 선별법을 적용시키면
1:03 - 1:05

과연 어떤 결과가 나올까요?
1:07 - 1:08

자...
1:13 - 1:17

대략 비슷한 예측을
하는 것을 볼 수 있습니다.
1:17 - 1:20

맞습니다, 사진에 말라뮤트가 있죠.
1:20 - 1:23

하지만 이 정도로는 어떤 장면인지
1:23 - 1:25

많은 것을 알 수 없습니다.
1:25 - 1:27

좀 더 효과적인 것이 필요하겠지요.
1:27 - 1:30

저는 지금 '사물감지'라 불리는
문제에 대해 연구하고 있습니다.
1:30 - 1:33

한 이미지 안에 있는
모든 사물들을 찾아내서
1:33 - 1:34

테두리 상자를 치고
1:34 - 1:36

그것이 무엇인지 맞추는 것입니다.
1:36 - 1:40

여기에 감지법을 적용하면
어떻게 되는지 보겠습니다.
1:41 - 1:43

자, 이런 식의 결과라면
1:44 - 1:46

컴퓨터 시각 알고리듬으로
더 많은 것을 해낼 수 있겠군요.
1:46 - 1:49

이제 이미지 안에 고양이와 개가 있고
1:49 - 1:51

대략 그들의 위치
1:52 - 1:53

그리고 크기까지 파악하고 있습니다.
1:53 - 1:55

그외 다른 정보들까지
알고 있을지도 모르겠네요.
1:55 - 1:57

저 뒤 쪽에 책 한 권이 있네요.
1:57 - 2:01

이 컴퓨터 시각을 이용해서
어떤 시스템을 개발한다면,
2:01 - 2:04

자율주행 자동차나 로봇 시스템일텐데
2:04 - 2:06

바로 이런 것들이
여러분들이 원하는 정보일 겁니다.
2:07 - 2:10

물리적 세계와 교감을
가능하게 하는 것들 말이지요.
2:11 - 2:13

자, 제가 처음으로
'사물감지' 연구에 들어갔을 때
2:13 - 2:16

이미지 하나를 처리하는데
20초가 걸렸습니다.
2:16 - 2:20

이 분야에서 왜 속도가
중요한지 알고 싶다면
2:21 - 2:24

여기 사물감지기능의 한 예가 있습니다.
2:24 - 2:26

이미지 하나를 처리하는데
2초 밖에 걸리지 않습니다.
2:26 - 2:29

20초 짜리 감지기능보다는
2:29 - 2:32

10배나 빠른 속도이지요.
2:32 - 2:35

보시는 것 처럼, 이 기능이
예측을 하기 시작할 때면
2:35 - 2:37

이미 벌어지고 상황은
바뀌어 있을 테니까
2:38 - 2:40

응용 프로그램으로는
2:40 - 2:42

별 효용이 없을 겁니다.
2:42 - 2:44

만일 10배를 더 빠르게 한다면
2:44 - 2:47

초당 다섯 장면을 처리하는
감지기능이 됩니다.
2:47 - 2:49

훨씬 낫죠.
2:49 - 2:51

하지만 만일,
2:51 - 2:53

여기서 더 큰 발전이 없다면
2:53 - 2:56

이 정도의 시스템이 제 차를
운전하기를 원친 않겠지요.
2:57 - 3:00

이것이 제 노트북에서 실시간으로
작동되고 있는 감지 시스템입니다.
3:01 - 3:04

아주 부드럽게 제가 틀안에서
움직이는 대로 따라오죠.
3:04 - 3:08

아무 문제가 없습니다.
다양한 크기
3:09 - 3:11

자세
3:11 - 3:13

앞뒤 움직임에도
3:13 - 3:14

훌륭하죠.
3:14 - 3:16

이런 것이 바로
우리에게 필요한 것입니다.
3:16 - 3:19

컴퓨터 시각을 이용한
시스템을 개발할 때 말이지요.
3:19 - 3:23

(박수)
3:24 - 3:26

불과 몇년 만에
3:26 - 3:29

한 이미지를 처리하는 시간이 20초에서
3:29 - 3:33

500분의 1초로,
천배나 빨라졌습니다.
3:33 - 3:34

어떻게 가능했을까요?
3:34 - 3:37

과거에는, 사물감지 시스템들은
3:37 - 3:39

이런 이미지를 가지고
3:39 - 3:42

여러 영역으로 잘라내서
3:42 - 3:45

각 영역 마다 선별작업을 실행하고
3:45 - 3:47

그 선별작업에서 산출된
가장 높은 점수들이
3:47 - 3:51

이미지의 감지로
간주되는 방식이었습니다.
3:51 - 3:55

하지만, 감지를 하기까지 한 이미지에
수천 번의 분류작업이
3:55 - 3:58

또 수천 번의 신경망 감정을
거쳐야 했습니다.
3:59 - 4:04

대신에, 우리는 단일 네트워크로
모든 탐지가 가능케 했습니다.
4:04 - 4:08

모든 테두리 상자와 분류 개연성을
동시에 처리해 내는 것이지요.
4:09 - 4:12

저희 시스템에서는 감지를 해내기 위해
4:12 - 4:14

한 이미지를 수천 번이 아니라
4:14 - 4:15

단 한 번 보는 것으로 가능하고
4:15 - 4:18

저희가 이것을 사물감지의 '욜로'법 으로
부르는 이유입니다.
4:19 - 4:23

이 속도로는, 이미지 뿐만 아니라
4:23 - 4:26

동영상도 실시간으로
처리할 수 있습니다.
4:26 - 4:29

이제는 단순히 개와 고양이를
인지하는 것을 넘어서
4:29 - 4:32

그들이 돌아다니는 것도,
서로 어울리는 것도 볼 수 있습니다.
4:35 - 4:37

이것이 저희가 개발해낸
감지기능입니다.
4:37 - 4:41

마이크로소프트의
코코 데이터 세트 안에서
4:41 - 4:44

80개의 등급에 적용시켜
얻어낸 것이지요.
4:44 - 4:48

숟가락, 포크, 그릇 같이
평범한 물건들이
4:48 - 4:49

다양하게 있네요.
4:50 - 4:53

좀 특이한 것들도 보이지요.
4:53 - 4:57

동물, 자동차, 얼룩말, 기린.
4:57 - 4:59

재미난 걸 한번 해볼까요.
4:59 - 5:01

방청석으로 들어가서
5:01 - 5:03

어떤 물건들이 감지되는지 보겠습니다.
5:03 - 5:04

동물인형 갖고 싶으신 분?
5:06 - 5:08

저기 곰인형도 몇개 있네요.
5:10 - 5:15

감지한계치를 조금 낮추면,
5:15 - 5:18

더 많은 분들이 화면에 잡히겠지요.
5:20 - 5:22

이 정지표지판들도
잡아낼 수 있는지 보겠습니다.
5:22 - 5:24

배낭도 몇개 보이네요.
5:26 - 5:28

조금 가까이 당겨 보지요.
5:30 - 5:32

좋습니다.
5:32 - 5:35

이 모든 것이 컴퓨터에서 실시간으로
5:35 - 5:36

처리되고 있습니다.
5:37 - 5:39

꼭 알아둘 것은
5:39 - 5:42

이것이 총괄적인
사물감지 시스템이란 것입니다.
5:42 - 5:47

그래야 어떠한 이미지 종류에도
적용시킬 수 있겠지요.
5:48 - 5:51

동일한 코드가
5:51 - 5:53

정지표지판 또는 보행자
5:53 - 5:55

자율주행 자동차 안의 자전거들을
찾아내기도 하고
5:55 - 5:58

조직검사를 통해 암세포를
5:58 - 6:01

찾아낼 때도 사용될 수 있습니다.
6:01 - 6:05

이미 세계 곳곳의 연구원들이 이 기술을
6:06 - 6:10

의학과 로봇공학의 발전 등에
쓰고 있습니다.
6:10 - 6:11

오늘 아침 신문에
6:11 - 6:16

나이로비 국립공원의 동물 수 조사에
6:16 - 6:19

욜로가 감지 시스템의 일부로
사용된다고 나왔더군요.
6:19 - 6:22

다크넷이 오픈소스이기도 하고
6:22 - 6:24

모두가 무료로 사용할 수
있도록 열려있기 때문입니다.
6:26 - 6:31

(박수)
6:31 - 6:36

그런데, 저희는 감지기능의
접근성과 사용성을 더 높이고 싶었고
6:36 - 6:40

견본 최적화
6:40 - 6:43

네트워크 이진화와 근사치의
적절한 조화를 통해서
6:43 - 6:47

이제 휴대전화에서도
사물감지가 가능하게 했습니다.
6:53 - 6:58

(박수)
6:59 - 7:04

아주 흥분되는데요. 왜냐면
급이 낮은 컴퓨터 시각 문제점들을
7:04 - 7:06

해결할 아주 효과적인
방법이 있으니까요.
7:06 - 7:10

누구나 이 기술을 가지고
원하는 것들을 만들어 낼 수 있습니다.
7:10 - 7:13

이제 나머지는
여러분들의 몫이고요.
7:13 - 7:16

또 이 소프트웨어를 사용하는
세상의 모든 분들의 몫입니다.
7:16 - 7:20

이 기술로 사람들이 어떤 것들을
만들어 낼지 너무 기대됩니다.
7:20 - 7:21

감사합니다.
7:21 - 7:24

(박수)

Title:: 즉각적 사물 인식을 컴퓨터가 학습하는 과정
Speaker:: 조셉 레드몬(Joseph Redmon)
Description:: 10년 전만 해도, 연구원들은 컴퓨터가 고양이와 강아지를 구분해 내는 일은 거의 불가능할 것이라고 생각했습니다. 오늘날, 컴퓨터 시각장치는 99퍼센트 이상의 정확도로 이 일을 해 내고 있습니다. 어떻게 가능할까요? 조셉 레드몬은 빛처럼 빠른 속도로 얼룩말과 정지표시 등의 이미지와 동영상을 식별할 수 있는 오픈소스 사물식별법인 "욜로"시스템을 연구하고 있습니다. 이 놀라운 실시간 시연을 통해, 레드몬은 자율주행 자동차, 로봇공학, 심지어는 암 발견에까지 응용할 수 있는 이 중요한 발전을 자랑스럽게 보여줍니다.

more » « less
Video Language:: English
Team:: closed TED
Project:: TEDTalks
Duration:: 07:37

	Jihyeon J. Kim approved Korean subtitles for How computers learn to recognize objects instantly
	Jihyeon J. Kim edited Korean subtitles for How computers learn to recognize objects instantly
	Jihyeon J. Kim edited Korean subtitles for How computers learn to recognize objects instantly
	Jihyeon J. Kim edited Korean subtitles for How computers learn to recognize objects instantly
	Jihyeon J. Kim edited Korean subtitles for How computers learn to recognize objects instantly
	Taz B. K accepted Korean subtitles for How computers learn to recognize objects instantly
	Taz B. K edited Korean subtitles for How computers learn to recognize objects instantly
	Taz B. K edited Korean subtitles for How computers learn to recognize objects instantly

Show all

Korean subtitles

Revisions

Revision 19 Edited

Jihyeon J. Kim

즉각적 사물 인식을 컴퓨터가 학습하는 과정

Revisions

Our website uses cookies

Operating cookies (Required)