چطور به کامپیوترها فهمیدن عکسها را میاموزیم
-
0:02 - 0:06اجازه دهید چیزی را به شما نشان دهم.
-
0:06 - 0:10(ویدیو)دختر: بسیار خوب،
آن گربه روی یک تخت خواب نشسته است. -
0:10 - 0:14این پسر در حال نوازش فیل است.
-
0:14 - 0:19آنها مردمی هستند
در حال سوار شدن به هواپیما. -
0:19 - 0:21این یک هواپیمای بزرگ است.
-
0:21 - 0:24فی-فی-لی: این یک کودک سه ساله است
-
0:24 - 0:27که آنچه که در مجموعه ای
از عکسها میبیند را توصیف میکند. -
0:27 - 0:30ممکن است او هنوز چیزهای زیادی
برای یادگیری درباره این جهان داشته باشد. -
0:30 - 0:35اما او در یک کار خیلی
مهم دیگه تخصص دارد: -
0:35 - 0:38درک کردن آنچه که میبیند.
-
0:38 - 0:42جامعه ما از لحاظ فناوری
از هر زمان دیگر پیشرفتهتر است. -
0:42 - 0:46ما آدمها را به ماه میفرستیم،
تلفنهایی ساختیم که با ما صحبت میکنند -
0:46 - 0:51یا ایستگاههای رادیویی سفارشی طراحی کردیم
که می توانند فقط موسیقی را که دوست داریم پخش کنند. -
0:51 - 0:55با این حال
پیشرفته ترین ماشینها و رایانههای ما -
0:55 - 0:58هنوز هم در این کار (درک تصاویر)
مشکل دارند. -
0:58 - 1:01بنابراین امروز من اینجا هستم
که یک گزارش پیشرفت به شما بدهم -
1:01 - 1:05در مورد آخرین پیشرفت
در تحقیق ما بر روی بینایی رایانهای، -
1:05 - 1:10یکی از پیشرفتهترین و
بصورت بالقوه انقلابیترین -
1:10 - 1:13فن آوریها در علوم رایانهای.
-
1:13 - 1:17بله، ما نمونه اولیه ماشینهایی را داریم
که خودشان میتوانند رانندگی کنند، -
1:17 - 1:21اما بدون دید هوشمند (smart vision)
نمی توانند فرق بگذارند -
1:21 - 1:25بین پاکت کاغذی مچاله در جاده
که میشه از روش با ماشین رد شد. -
1:25 - 1:29و یک سنگ همان اندازه که
نباید از روش رد شد -
1:29 - 1:33ما دوربینهای (با وضوح) مگاپیکسل
عالی ساخته ایم، -
1:33 - 1:36اما به نابیناها بینایی ندادهایم.
-
1:36 - 1:40هواپیماهای بدون سرنشین
که برفراز زمینهای وسیع پرواز کنند، -
1:40 - 1:42ولی فناوری بینایی کافی برای کمک به ما
-
1:42 - 1:45در رهگیری تغییرات جنگلهای بارانی
نداریم. -
1:45 - 1:48دوربین های امنیتی همه جا هست،
-
1:48 - 1:53ولی وقتی یک کودک در استخر
در حال غرق شدن است به ما هشدار نمیدهند. -
1:54 - 2:00تصاویر و ویدیوها در حال تبدیل شدن به
جز مهمی از زندگی جهانی هستند. -
2:00 - 2:04تصاویر با سرعتی فراتر از آنچه هر انسان
یا گروهی از انسانها، -
2:04 - 2:07بتواند امیدوار به دیدن آنها باشد
تولید میشوند، -
2:07 - 2:11و من و شما در این TED
یعنی تولید تصاویر مشارکت میکنیم. -
2:11 - 2:16با این وجود پیشرفتهترین
نرم افزارها همچنان -
2:16 - 2:20در فهم و مدیریت این حجم عظیم مشکل دارند.
-
2:20 - 2:25به عبارت دیگر در مجموع
به عنوان جامعه -
2:25 - 2:27ما کاملا کور هستیم،
-
2:27 - 2:30چون باهوشترین
ماشینهای ما هنوز نابینا هستند. -
2:32 - 2:34شاید بپرسید "چرا انقدر سخته؟"
-
2:34 - 2:37دوربینها میتوانند تصاویری
مثل این را بگیرند: -
2:37 - 2:41با تبدیل نور به
آرایه دو بعدی اعداد -
2:41 - 2:43به نام "پیکسل"
-
2:43 - 2:45ولی اینها فقط اعداد بی روح هستند،
-
2:45 - 2:48هیچ معنی به خودی خود ندارند.
-
2:48 - 2:52مثل اینکه:
شنیدن با گوش کردن یکی نیستند، -
2:52 - 2:57عکس گرفتن با دیدن یکی نیستند،
-
2:57 - 3:00یا اینکه منظور از دیدن واقعا فهمیدن نیست.
-
3:01 - 3:07در حقیقت ۵۴۰ میلیون سال وقت مادر طبیعت
-
3:07 - 3:09صرف انجام این کار سخت شده
-
3:09 - 3:11و بیشتر این تلاش به تکامل
-
3:11 - 3:17ابزار پردازش دید مغزمان اختصاص داده شده
-
3:17 - 3:19و نه به خود چشمها.
-
3:19 - 3:22پس، دیدن با چشم آغاز میشود،
-
3:22 - 3:26ولی در حقیقت در مغز شکل میگیرد.
-
3:26 - 3:31برای ۱۵ سال با شروع از دکترا در کلتک
-
3:31 - 3:34و سپس رهبری آزمایشگاه بینایی در استانفورد،
-
3:34 - 3:39من با مربی هایم، همکارانم و شاگردانم
تلاش کرده ام -
3:39 - 3:42که به رایانه ها یاد بدهیم که ببینند.
-
3:43 - 3:46اسم زمینه تحقیقاتی ما
بینایی رایانه ای و آموزش ماشین هست. -
3:46 - 3:50این بخشی از زمینه عمومی تر هوش مصنوعی هست
-
3:51 - 3:56در نهایت میخواهیم به ماشین ها
یاد بدهیم که ببینند همانند ما: -
3:56 - 4:02اسم گذاشتن بر روی اشیا، تشخیص افراد
، استنباط سه بعدی از اشیا -
4:02 - 4:08فهم ارتباط، احساسات، اعمال و نیت ها.
-
4:08 - 4:14من و شما وقتی نگاهمون به آدمها، مکانها
و اشیا میافتد -
4:14 - 4:16دربارشون قصه میسازیم.
-
4:17 - 4:23اولین قدم در راه این هدف این هست
که به رایانهها یاد بدهیم تا اشیا را ببینند؛ -
4:23 - 4:26سنگ بنای دنیای بصری.
-
4:26 - 4:30به ساده ترین حالت این فرایند آموزش
را مانند نشان دادن تعدادی -
4:30 - 4:33عکس آموزشی از یک شی خاص
-
4:33 - 4:37مثلا گربه ها به رایانه تصور کنید.
-
4:37 - 4:41و طراحی یک مدل (برای رایانه)
که ازدیدن این عکسها یاد میگیرد. -
4:41 - 4:43اینکار چقدر میتونه سخت باشه؟
-
4:43 - 4:47بالاخره یک گربه مجموعه ایست
از شکل ها و رنگها، -
4:47 - 4:52و این کاری هست که در روزهای ابتدایی
طراحی اشیا انجام میدادیم. -
4:52 - 4:55ما به الگوریتم رایانه به زبان ریاضی میگوییم
-
4:55 - 4:59که یک گربه صورت گرد دارد،
بدن تپل دارد، -
4:59 - 5:01دو تا گوش تیز دارد و یک دم دراز
-
5:01 - 5:02و این کافی بود.
-
5:03 - 5:05ولی این یکی گربه چطور؟
-
5:05 - 5:06(خنده حضار)
-
5:06 - 5:08این یکی کاملا خم شده
-
5:08 - 5:12حالا شما باید یک شکل و
زاویه دید دیگه به مدل شی اضافه کنید -
5:12 - 5:14ولی اگه گربهها قایم شده باشند چی؟
-
5:15 - 5:17این گربه های بامزه چطور؟
-
5:19 - 5:22جالا متوجه منظور من میشوید.
-
5:22 - 5:25حتی یک چیز ساده مثل حیوان خانگی
-
5:25 - 5:29میتونه مدلهای بینهایت
گونه گون از مدل شی را ارائه کند، -
5:29 - 5:32و این تازه فقط یک شی هست.
-
5:33 - 5:35تقریبا هشت سال پیش
-
5:35 - 5:40یک مشاهده ساده و عمیق
طرز فکر من را تغییر داد. -
5:41 - 5:44کسی به یک کودک نمیگه چطور ببیند،
-
5:44 - 5:46به ویژه در سالهای ابتدایی.
-
5:46 - 5:51اونها این کار را از طریق تجربیات و مثالهای
دنیای واقعی یاد میگیرند. -
5:51 - 5:54اگر چشمهای یک کودک را مثل
-
5:54 - 5:57یک جفت دوربین بیولوژیک در نظر بگیرید،
-
5:57 - 6:01آنها هر ۲۰۰ میلی ثانیه
یک تصویر میگیرند، -
6:01 - 6:04مدت زمان متوسطی که
حرکت چشم صورت میگیرد. -
6:04 - 6:10پس تا سه سالگی یک کودک
صدها میلیون تصویر -
6:10 - 6:11از دنیای واقعی دیده
-
6:11 - 6:14این تعداد زیادی از مثالهای آموزشی هست.
-
6:14 - 6:20پس بجای تمرکزصرف بر الگوریتمهای
بهتر و بهتر -
6:20 - 6:26نگرش من این بود که به الگوریتمها
ـآن دسته از دادههای آموزشی -
6:26 - 6:29که به یک کودک از طریق تجربه داده میشود
-
6:29 - 6:33را در همان حجم و کیفیت بدهیم.
-
6:33 - 6:35وقتی این را فهمیدیم
متوجه شدیم که -
6:35 - 6:38به جمع آوری مجموعه اطلاعات نیاز داریم
-
6:38 - 6:42که خیلی بیشتر از آنچه تاکنون داشته ایم
عکس داشته باشد، -
6:42 - 6:45احتمالا هزاران بار بیشتر،
-
6:45 - 6:49و با همکاری پرفسور کای لی
در دانشگاه پرینستون -
6:49 - 6:54ما پروژه ImageNet را
در سال ۲۰۰۷ راه اندازی کردیم. -
6:54 - 6:57خوشبختانه احتیاج نداشتیم
که یک دوربین روی سرمان نصب کنیم -
6:57 - 6:59و سالها منتظر بمانیم.
-
6:59 - 7:01رفتیم سراغ اینترنت
-
7:01 - 7:05بزرگترین گنجینه عکسها
که انسانها تاکنون آفریده اند. -
7:05 - 7:08نزدیک به یک میلیارد عکس دانلود کردیم
-
7:08 - 7:14و از فناوری CrowdSourcing
همانند Amazon Mechanical Turk platform -
7:14 - 7:16استفاده کردیم تا برای برچسب زدن این
عکسها به ما کمک کند. -
7:16 - 7:21در اوج خودش، ImageNet
از بزرگترین کارفرماهای -
7:21 - 7:24Amazon Mechanical Turk بود
-
7:24 - 7:28در مجموع تقریبا ۵۰٫۰۰۰ کارمند
-
7:28 - 7:32از ۱۶۷ کشور جهان
-
7:32 - 7:36به ما کمک کردند تا
نزدیک به یک میلیارد عکس منتخب را -
7:36 - 7:40اصلاح، منظم و برچسب گذاری کنند.
-
7:41 - 7:43این میزانی بود که زحمت برد
-
7:43 - 7:47برای ثبت کسری از تصویرگری که
-
7:47 - 7:51ذهن یک کودک در سالهای اولیه
تکامل خود انجام میدهد. -
7:52 - 7:56پس از گذشت زمان و کسب تجربه
ایده استفاده از حجم عظیم دادهها -
7:56 - 8:01برای آموزش الگوریتم رایانهها،
شاید الان بدیهی بنظر برسد، -
8:01 - 8:05ولی قبلا در سال ۲۰۰۷ انقدر واضح نبود.
-
8:05 - 8:09ما توی این سفر برای مدتی کاملا تنها بودیم.
-
8:09 - 8:14بعضی از همکاران نزدیکم به من توصیه کردند
که برای استخدام قطعی من کار مفیدتری بکنم -
8:14 - 8:18و مدام برای بودجه تحقیقاتی مشکل داشتیم.
-
8:18 - 8:20یکبار با دانشجوهای تحصیلات تکمیلیام
شوخی کردم که -
8:20 - 8:24برای تامین بودجه ImageNet
حشکشوییام را دوباره باز کنم. -
8:24 - 8:29بهر حال این راهی بود که من
پول تحصیلام را در آورده بودم. -
8:29 - 8:31پس ادامه دادیم.
-
8:31 - 8:35در سال ۲۰۰۹ پروژه ImageNet
-
8:35 - 8:39یک پایگاه داده از ۱۵ میلیون عکس
-
8:39 - 8:44در وسعت ۲۲٫۰۰۰ کلاس از شی ها
-
8:44 - 8:47که با کلمات انگلیسی روزمره منظم شده بودند
تحویل داد. -
8:47 - 8:50از لحاظ کیفیت و کمیت
-
8:50 - 8:53این مقیاس بیسابقه بود.
-
8:53 - 8:56بعنوان مثال در مورد گربهها
-
8:56 - 8:59بیش از ۶۲٫۰۰۰ (تصویر) گربه
-
8:59 - 9:03در انواع شکل ها و فرم بدن
-
9:03 - 9:08و در تمام گونههای اهلی و وحشی داشتیم.
-
9:08 - 9:12ما از اینکه ImageNet را ساخته بودیم
هیجان زده بودیم و -
9:12 - 9:16و میخواستیم که تمام دنیای تحقیقات
از آن بهره ببرند -
9:16 - 9:20پس به شیوه TED
تمام مجموعه داده را -
9:20 - 9:23برای دنیای تحقیقات بصورت رایگان
باز کردیم. -
9:25 - 9:29(تشویق حضار)
-
9:29 - 9:34حالا که دادهها را برای تغذیه مغز
رایانه هایمان داریم، -
9:34 - 9:38آماده ایم که برگردیم سراغ
خود الگوریتم ها. -
9:38 - 9:43اینطور شد که
وفور اطلاعات تهیه شده توسط ImageNet -
9:43 - 9:48خیلی خوب به کلاس خاصی از الگوریتمهای
یادگیری ماشینی -
9:48 - 9:50به نام "شبکه های عصبی در هم تنیده"
تطابق داشت، -
9:50 - 9:55که پیشگامانش کونیهیکو فوکوشیما و
جف هینتون و یان لیکان -
9:55 - 9:59در دهههای ۱۹۷۰ و ۱۹۸۰ بودند.
-
9:59 - 10:05درست مثل مغز که از میلیاردها
نورون پیوسته تشکیل شده -
10:05 - 10:08یک واحد عملیاتی بنیادی در یک شبکه عصبی
-
10:08 - 10:11یک گره نورون-مانند است.
-
10:11 - 10:13از گرههای دیگر ورودی میگیرد و
-
10:13 - 10:16و خروجی را به دیگر گرهها میفرستند.
-
10:16 - 10:21به علاوه، این صدها یا هزاران یا حتی
میلیونها گره -
10:21 - 10:24در لایههایی با سلسله مراتب منظم شدهاند،
-
10:24 - 10:27مانند مغز.
-
10:27 - 10:31در یک شبکه عصبی نوعی، برای آموزش
مدل تشخیص اشیا، -
10:31 - 10:35۲۴ میلیون گره،
-
10:35 - 10:38۱۴۰ میلیون پارامتر،
-
10:38 - 10:41و ۱۵ میلیارد اتصال وجود دارد.
-
10:41 - 10:43این یک مدل عظیم است.
-
10:43 - 10:47با استفاده از نیروی عظیم داده ها
از ImageNet -
10:47 - 10:52و CPU و GPU های مدرن
برای آموزش چنین مدل یکدستی، -
10:52 - 10:55"شبکه عصبی در هم تنیده"...
-
10:55 - 10:58به شکلی که کسی انتظار نداشت
شکوفا شد. -
10:58 - 11:01تبدیل شد به معماری برتر
-
11:01 - 11:06برای تولید نتایج تازه و هیجان انگیز
در تشخیص اشیا. -
11:06 - 11:09این یک کامپیوتر هست که به ما میگه
-
11:09 - 11:11این تصویر شامل یک گربه است
-
11:11 - 11:13و اینکه گربه کجاست.
-
11:13 - 11:15البته چیزهای بیشتری از گربه وجود دارد،
-
11:15 - 11:18پس این یک الگوریتم رایانهای
هست که به ما میگوید -
11:18 - 11:21تصویر شامل یک پسر هست
و یک عروسک خرس؛ -
11:21 - 11:25یک سگ، یک آدم، و بادبادک کوچک
در پس زمینه؛ -
11:25 - 11:28یا تصویر چیزهای شلوغتر
-
11:28 - 11:33مثل یک مرد، تخته اسکیت، نردهها،
تیر چراغ برق و چیزهای دیگر. -
11:33 - 11:38بعضی وقتها که رایانه مطمئن نیست
از چیزی که به آن نگاه میکند، -
11:39 - 11:42بهش یاد دادیم که به اندازه کافی باهوش باشد
-
11:42 - 11:46تا به جای کار زیادی یک جواب مطمئن
به ما بدهد، -
11:46 - 11:48درست مثل کاری که ما انجام میدهیم،
-
11:48 - 11:53ولی در موارد دیگر الگوریتم رایانه ای ما
در گفتن اینکه -
11:53 - 11:55اشیا چه هستند فوق العاده است
-
11:55 - 11:59مثل نوع ، مدل و سال ساخت ماشین.
-
11:59 - 12:04ما این الگوریتم را به میلیونها عکس
-
12:04 - 12:07"منظره خیابان گوگل"
در صدها شهر آمریکا اعمال کردیم -
12:07 - 12:10و چیز جالبی را متوجه شدیم:
-
12:10 - 12:14اول اینکه عقل سلیم ما را تایید کرد
-
12:14 - 12:17که قیمت خودرو وابستگی زیادی به
-
12:17 - 12:19درآمد خانوارها دارد.
-
12:19 - 12:24اما تعجب اینکه، قیمت خودرو
بستگی زیادی هم به -
12:24 - 12:26نرخ جرایم در شهرها،
-
12:27 - 12:31یا الگوی رای دادن در شهرها بر اساس
کدپستی دارد. -
12:32 - 12:34صبر کن ببینم! همین؟!
-
12:34 - 12:39آیا دیگر توانایی رایانه با توانایی انسان
مطابقت دارد یا از آن پیشی گرفته؟ -
12:39 - 12:42نه به این زودی.
-
12:42 - 12:46تا حالا به رایانه یاد دادیم
که اشیا را ببیند. -
12:46 - 12:51این مثل این هست که کودک
یاد بگیرد چند اسم بگوید. -
12:51 - 12:54این یک موفقیت باورنکردنی است،
-
12:54 - 12:56اما فقط اولین قدم است.
-
12:56 - 13:00بزودی یک مرحله مهم طی خواهد شد
-
13:00 - 13:03و کودکان یاد میگیرند
تا بصورت گفتن جمله ارتباط برقرار کنند. -
13:03 - 13:08پس به جای اینکه بگوید
این یک گربه در این عکس است که قبلا شنیدید -
13:08 - 13:13دختر کوچولو به ما گفت این
یک گربه خوابیده روی تخت است. -
13:13 - 13:18برای یاد دادن به رایانه که تصویری را
ببیند و جملاتی تولید کند، -
13:18 - 13:22پیوند بین دادههای عظیم و
الگوریتم آموزش ماشین -
13:22 - 13:25باید گام دیگری بردارد.
-
13:25 - 13:29حالا رایانه باید هم از تصاویر یاد بگیرد
-
13:29 - 13:32هم از جملات زبان طبیعی
-
13:32 - 13:35که توسط انسان تولید میشوند.
-
13:35 - 13:39درست مثل مغز که بینایی و
زبان را به هم میآمیزد -
13:39 - 13:44ما هم مدلی ایجاد کردیم که قسمت های
اجسام بصری -
13:44 - 13:46مانند خرده تصاویر
-
13:46 - 13:50را به کلمات و عبارات در جملات پیوند میزند.
-
13:50 - 13:53حدود چهار ماه پیش،
-
13:53 - 13:56بالاخره همه اینها را به هم پیوند زدیم
-
13:56 - 13:59و یکی از اولین مدلهای دید رایانهای را
-
13:59 - 14:03که وقتی یک تصویر را برای اولین بار میبیند
-
14:03 - 14:07قادر به تولید جملات
همانند انسانها هست تولید کردیم. -
14:07 - 14:12حالا آماده هستم که بهتون نشان دهم
که یک رایانه وقتی تصویری که -
14:12 - 14:14وقتی تصویری را میبیند که
-
14:14 - 14:17اون دختر کوچولوی اول سخنرانی آن را دید.
-
14:20 - 14:23(صدای رایانه): یک مرد کنار یک فیل
ایستاده است. -
14:24 - 14:28یک هواپیمای بزرگ روی
باند پروازفرودگاه نشسته. -
14:29 - 14:33(سخنران): البته ما هنوز داریم سخت تلاش
میکنیم که الگوریتممان را بهتر کنیم، -
14:33 - 14:36و هنوز چیزهای زیادی هست که باید یاد بگیرد.
-
14:36 - 14:38(تشویق حضار)
-
14:40 - 14:43و رایانه هنوز اشتباه میکند.
-
14:43 - 14:46(صدای رایانه): یک گربه زیر لحاف
دراز کشیده روی تخت. -
14:46 - 14:49(سخنران): قطعا وقتی
تعداد زیادی گربه میبیند -
14:49 - 14:52ممکن است فکر کند که همه چیز شبیه گربه است.
-
14:53 - 14:56(صدای رایانه): یک پسربچه
یک چوب بیسبال در دست دارد. -
14:56 - 14:58(خنده حضار)
-
14:58 - 15:03(سخنران): و اگر مسواک ندیده باشد
آن را با چوب بیسبال اشتباه میگیرد. -
15:03 - 15:07(صدای رایانه): مردی که در خیابان
کنار یک ساختمان اسب سواری میکند. -
15:07 - 15:09(خنده حضار)
-
15:09 - 15:12(سخنران): ما به رایانهها کلاس
هنر پایه تدریس نکردیم. -
15:14 - 15:17(صدای رایانه): یک گورخر ایستاده
در زمینی پوشیده از علف. -
15:17 - 15:20(سخنران): و یاد نگرفته که قدر
زیبایی مسحور کننده طبیعت -
15:20 - 15:22را مثل من و شما بداند.
-
15:22 - 15:25بله، سفر درازی بوده
-
15:25 - 15:30تا از سن صفر به سه سالگی برسیم
دشوار بود. -
15:30 - 15:35سختی واقعی رفتن از سه سالگی به
۱۳ سالگی و فراتر هست. -
15:35 - 15:39اجازه بدهید به شما با این تصویر
پسر و کیک یادآوری کنم. -
15:39 - 15:44تا الان به رایانه یاد دادیم
که اجسام را ببیند -
15:44 - 15:48یا حتی وقتی یک تصویر را میبیند
یک داستان ساده به ما بگوید. -
15:48 - 15:52(صدای رایانه): یک شخص نشسته سر یک میز
با یک کیک. -
15:52 - 15:54(سخنران): اما در این عکس
خیلی چیزهای دیگر غیر از یک -
15:54 - 15:56آدم و کیک هست.
-
15:56 - 16:01چیزی که رایانه نمیبیند این است که
این یک کیک مخصوص ایتالیایی -
16:01 - 16:04که فقط در زمان عید پاک پخته میشود
هست. -
16:04 - 16:07پسر تیشرت مورد علاقهاش را پوشیده
-
16:07 - 16:11که توسط پدرش بعنوان هدیه بعد از سفر
به سیدنی به او داده شده. -
16:11 - 16:15و من و شما همه میتوانیم بگویم
که چقدر خوشحال هست -
16:15 - 16:18و دقیقا در آن لحظه در ذهنش چه میگذرد.
-
16:19 - 16:22این پسر من "لیو" هست.
-
16:22 - 16:25در جستجوی من برای هوش بصری
-
16:25 - 16:27مدام به "لیو" فکر میکنم
-
16:27 - 16:30و آیندهای که او زندگی خواهد کرد.
-
16:30 - 16:32زمانی که ماشینها میتوانند ببینند،
-
16:32 - 16:37پزشکان و پرستاران یک جفت چشم
خستگی ناپذیراضافه خواهند داشت -
16:37 - 16:41که به آنها کمک خواهد کرد برای تشخیص
و مراقبت از بیماران. -
16:41 - 16:45خودروها هوشمندانهتر و ایمنتر
در جادهها حرکت خواهند کرد. -
16:45 - 16:48رباتها، نه فقط انسانها
-
16:48 - 16:53به ما در خطرکردن در مناطق فاجعهزده برای
نجات مصدومان و زخمیها کمک خواهند کرد. -
16:54 - 16:58گونههای جدید خواهیم یافت،
مواد بهتر، -
16:58 - 17:02و مرزهای نادیده را با کمک ماشینها
اکتشاف خواهیم کرد. -
17:03 - 17:07کم کم داریم به ماشینها بینایی میبخشیم.
-
17:07 - 17:10ابتدا ما به آنها دیدن را میآموزیم.
-
17:10 - 17:13سپس آنها به ما کمک میکنند تا بهتر ببینیم.
-
17:13 - 17:17برای اولین بار چشمان انسان
تنها چشمانی نخواهند بود -
17:17 - 17:20که تفکر میکنند و جهان ما را کاوش میکنند.
-
17:20 - 17:23ما نه تنها از ماشینها برای
هوش آنها استفاده میکنیم، -
17:23 - 17:30بلکه با آنها به روش هایی که
نمیتوانیم تصور کنیم همکاری خواهیم کرد. -
17:30 - 17:32این جستجوی من است:
-
17:32 - 17:34تا به رایانه ها هوش بصری بدهم
-
17:34 - 17:40و آینده بهتری برای "لیو" و جهان خلق کنم.
-
17:40 - 17:41متشکرم.
-
17:41 - 17:45(تشویق حضار)
- Title:
- چطور به کامپیوترها فهمیدن عکسها را میاموزیم
- Speaker:
- فی-فی لی
- Description:
-
وقتی یک دختر بچه خیلی کوچولو به عکسی نگاه میکند، عناصر کوچکی را تشخیص میدهد: "گربه"، " کتاب" و "صندلی". اکنون کامپیوترها نیز برای انجا این کار هوشمند میشوند. گام بعدی چیست؟ در سخنرانی هیجانانگیز، متخصص بینایی کامپیوتر فی-فی لی موقعیت این هنر را شرح میدهد-- از جمله پایگاه دادهها با 15 میلیون عکس که تیمش ساخته تا به کامپیوتر فهمیدن عکسها را بیاموزد-- و هنوز افقهای اصلی در راه هستند.
- Video Language:
- English
- Team:
- closed TED
- Project:
- TEDTalks
- Duration:
- 17:58
b a approved Persian subtitles for How we're teaching computers to understand pictures | ||
b a edited Persian subtitles for How we're teaching computers to understand pictures | ||
b a edited Persian subtitles for How we're teaching computers to understand pictures | ||
b a edited Persian subtitles for How we're teaching computers to understand pictures | ||
Leila Ataei accepted Persian subtitles for How we're teaching computers to understand pictures | ||
Leila Ataei edited Persian subtitles for How we're teaching computers to understand pictures | ||
Leila Ataei edited Persian subtitles for How we're teaching computers to understand pictures | ||
Leila Ataei edited Persian subtitles for How we're teaching computers to understand pictures |