كيف يتعلم الحاسوب التعرف على الأشياء فورًا؟
-
0:01 - 0:02منذ عشر سنوات مضت،
-
0:02 - 0:05اعتقد باحثوا رؤية الكمبيوتر أن الحصول
على جهاز كمبيوتر -
0:05 - 0:07لمعرفة الفرق بين القط والكلب
-
0:08 - 0:09سيكون شبه مستحيل،
-
0:10 - 0:13وحتى مع التقدم الكبير فى حالة
الذكاء الاصطناعي. -
0:13 - 0:17يمكننا الآن أن نفعل ذلك بمستوى
دقة أعلى من 99%. -
0:18 - 0:20وهذا ما يسمى بالتصنيف الصوري --
-
0:20 - 0:23وإعطائها صورة،
ووضع تسمية لتلك الصورة -- -
0:23 - 0:26وكذلك تعرف أجهزة الكمبيوتر الآلاف
من الفئات الأخرى. -
0:27 - 0:30أنا طالب دراسات عليا فى جامعة واشنطن
-
0:30 - 0:31وأنا أعمل على مشروع يسمى "داركنيت"
-
0:32 - 0:33وهو إطار الشبكة العصبية
-
0:33 - 0:36لتدريب واختبار نماذج رؤية الكمبيوتر.
-
0:36 - 0:39ولذلك، دعونا نرى ماذا يفكر "داركنيت"
-
0:39 - 0:41فى هذه الصورة لدينا.
-
0:43 - 0:45عندما نقوم بتشغيل المصنف لدينا
-
0:45 - 0:46على هذه الصورة،
-
0:46 - 0:49نجد أننا لا نحصل فقط على تنبؤ للكلب والقط،
-
0:49 - 0:51نحن فى الواقع نحصل على
تنبؤات سلالة محددة. -
0:51 - 0:53ذلك هو مستوى التقسيمات المتوفر لنا الآن.
-
0:53 - 0:55وهو صحيح.
-
0:55 - 0:57في الحقيقة فإن كلبي هو "ملموت."
-
0:57 - 1:01ولذلك فقد حقننا خطوة مذهلة فى
تصنيف الصورة، -
1:01 - 1:03ولكن ماذا يحدث عندما
نشغّل المصنف لدينا -
1:03 - 1:05في صورة تبدو كهذه؟
-
1:07 - 1:08حسناً ...
-
1:13 - 1:17نرى أن المصنف يعود مع تنبؤ مماثل جداً.
-
1:17 - 1:20وهذا صحيح،
فهناك ملموت فى الصورة، -
1:20 - 1:23ولكن فقط نظراً لهذه التسمية،
فنحن حقاً لا نعرف الكثير -
1:23 - 1:25عن ماذا يدور فى الصورة.
-
1:25 - 1:27ونحن بحاجة إلى شيء أكثر قوة.
-
1:27 - 1:30أنا أعمل على مشكلة
تسمى الكشف عن الكائن، -
1:30 - 1:33حيث ننظر إلى صورة
ونحاول العثور على كل الكائنات، -
1:33 - 1:34ووضع المربعات المحيطة بهم
-
1:34 - 1:36ونقول ما هي تلك الكائنات.
-
1:36 - 1:40وهنا ما يحدث عندما نقوم بتشغيل
المكشاف على هذه الصورة. -
1:41 - 1:43والآن، مع نتيجة من هذا النوع،
-
1:44 - 1:46نستطيع فعل أكثر من ذللك بكثير
مع خوارزمياتنا لرؤية الكمبيوتر. -
1:46 - 1:49نجد أنه يعرف أن هناك قط وكلب.
-
1:49 - 1:51ويعرف مواقعهم النسبية،
-
1:52 - 1:53وحجمهم.
-
1:53 - 1:55وربما يعرف معلومات إضافية.
-
1:55 - 1:57يوجد كتاب فى الخلفية.
-
1:57 - 2:01وإذا أردت بناء نظام أعلى رؤية الكمبيوتر،
-
2:01 - 2:04فلنقل سيارة ذاتية القيادة أو نظام روبوتية
-
2:04 - 2:06هذا هو نوع المعلومات التي تريدها.
-
2:07 - 2:10تريد شيئًا بحيث يمكنك التفاعل
مع العالم المادي. -
2:11 - 2:13والآن، عندما بدأت العمل
في الكشف عن الكائنات، -
2:13 - 2:16فقد استغرق الأمر 20 ثانية
لمعالجة صورة واحدة. -
2:16 - 2:20وللحصول على شعور
لماذا السرعة مهمة جدًا فى هذا المجال، -
2:21 - 2:24هنا مثال للكشف عن كائن
-
2:24 - 2:26والذي يستغرق تانيتين
لمعالجة صورة. -
2:26 - 2:29لذا فهذا أسرع ب 10 مرات
-
2:29 - 2:32من 20 تانية لكل كشف على صورة واحدة،
-
2:32 - 2:35ويمكنك فى نفس الوقت أن ترى
أنه يقوم بتنبؤات، -
2:35 - 2:37فقد تغيّرت حالة العالم بأسرها،
-
2:38 - 2:40وهذا لن يكون مفيدًا جدًا
-
2:40 - 2:42للتطبيق.
-
2:42 - 2:44إذا قمنا بتسريع هذا
بواسطة عامل آخر بمقدار 10 -
2:44 - 2:47فهذا كاشف يعمل
بمعدل خمسة إطارات فى الثانية الواحدة. -
2:47 - 2:49وهذا أفضل بكثير،
-
2:49 - 2:51ولكن على سبيل المثال،
-
2:51 - 2:53فإذا كان هناك أي حركة كبيرة،
-
2:53 - 2:56فلن أحتاج إلى نظام مثل قيادة سيارتي.
-
2:57 - 3:00هذا هو نظام الكشف لدينا المشغّل
فى الوقت الحقيقي على كمبيوتري المحمول. -
3:01 - 3:04حيث يتتبعني بسلاسة
بينما أتحرك في جميع أنحاء الإطار، -
3:04 - 3:08وهي قوى لمجموعة واسعة
من التغيرات في الحجم، -
3:09 - 3:11والتشكيل،
-
3:11 - 3:13إلى الأمام وإلى الخلف.
-
3:13 - 3:14هذا عظيم.
-
3:14 - 3:16هذا هو حقًا ما نريده
-
3:16 - 3:19إذا كنا سنبني أنظمة
على رأس رؤية الكمبيوتر. -
3:19 - 3:23(تصفيق)
-
3:24 - 3:26بالتالي في بضع سنوات فقط،
-
3:26 - 3:29فقد انتقلنا من 20 ثانية لكل صورة
-
3:29 - 3:33إلى 20 جزء من ألف جزء من الثانية لكل صورة،
أسرع بألف مرة. -
3:33 - 3:34كيف وصلنا إلى هناك؟
-
3:34 - 3:37حسناً، في الماضي
كانت أنظمة الكشف عن الكائن -
3:37 - 3:39تأخذ صورة من هذا القبيل
-
3:39 - 3:42وتقوم بتقسيمها إلى مجموعة من المناطق
-
3:42 - 3:45ثم تقوم بتشغيل المصنف
على كلّ من تلك المناطق، -
3:45 - 3:47ودرجات عالية من المصنف
-
3:47 - 3:51ستعتبر بمثابة الكشف عن الصورة.
-
3:51 - 3:55ولكن هذا ينطوى على تشغيل المصنف
الآف المرات على الصورة، -
3:55 - 3:58والآلاف من تقييم الشبكة العصبية
لإنتاج الكشف. -
3:59 - 4:04وبدلاً من ذلك، فقد قمنا بتدريب شبكة واحدة
للقيام بالكشف كاملاً لنا. -
4:04 - 4:08فهي تنتج كافة المربعات المحيطة
وفئة الإحتمالات في آن واحد. -
4:09 - 4:12مع نظامنا، بدلاً من البحث
في الصورة لآلاف المرات -
4:12 - 4:14لإنتاج كشفها،
-
4:14 - 4:15فأنت تنظر مرة واحدة فقط،
-
4:15 - 4:18ولهذا السبب نحن نسميها
طريقة الكشف عن كائن "يولو." -
4:19 - 4:23لهذا بهذه السرعة
فنحن لا نقتصر فقط على الصور؛ -
4:23 - 4:26بل نستطيع أن نعالج الفيديو في
الوقت الحقيقي. -
4:26 - 4:29والآن، بدلاً من مجرد رؤية
ذلك القط والكلب، -
4:29 - 4:32نستطيع أن نرى تحركاتهم
وتفاعلهم تجاه بعضهم البعض. -
4:35 - 4:37وهذا هو جهاز الكشف الذي قمنا بتدريبه
-
4:37 - 4:41في 80 فئة مختلفة
-
4:41 - 4:44في مجموعة بيانات "كوكو" ميكروسفت.
-
4:44 - 4:48لديها جميع أنواع االأشياء
مثل الملعقة والشوكة والسلطانية. -
4:48 - 4:49الأشياء الشائعة من هذا القبيل.
-
4:50 - 4:53لديها مجموعة متنوعة من أشياء أكثر غرابة:
-
4:53 - 4:57مثل الحيوانات والسيارات والحمر الوحشية
والزرافات -
4:57 - 4:59وسنقوم الآن بشيء مرح.
-
4:59 - 5:01سنستهدف الجمهور
-
5:01 - 5:03ونرى ما نوع الأشياء التي يمكننا
الكشف عنها. -
5:03 - 5:04هل من أحد يريد الحيوانات المحنطة؟
-
5:06 - 5:08توجد بعض الدببة هناك.
-
5:10 - 5:15ويمكننا أن نخفض العتبة
لدينا للكشف عنه قليلاً، -
5:15 - 5:18لذا فنستطيع أن نجد عددًا أكبر يا رفاق
من ذلك الجمهور. -
5:20 - 5:22لنرى إذا كان يمكننا الحصول
على علامات التوقف هذه. -
5:22 - 5:24نجد بعض حقائب الظهر.
-
5:26 - 5:28دعونا فقط نكبّر قليلاً.
-
5:30 - 5:32وهذا شيء عظيم.
-
5:32 - 5:35والتحويل يحدث كلياً
فى الوقت الحقيقي -
5:35 - 5:36على الكمبيوتر المحمول.
-
5:37 - 5:39وهذا أمر هام للتذكّر
-
5:39 - 5:42وهذا هو الغرض العام
لنظام الكشف عن الكائن، -
5:42 - 5:47نستطيع أن نُدرب هذا لأي نطاق للصورة.
-
5:48 - 5:51نفس التعليمات البرمجية التى نستخدمها
-
5:51 - 5:53لإيجاد علامات التوقف أو المشاة،
-
5:53 - 5:55والدراجات الهوائية في سيارة ذاتية القيادة
-
5:55 - 5:58يمكن استخدامها لإيجاد الخلايا السرطانية
-
5:58 - 6:01فى عينة من الأنسجة.
-
6:01 - 6:05وهناك باحثون حول العالم
يستخدمون هذه التكنولوجيا بالفعل -
6:06 - 6:10للتقدم في أمور مثل الطب
وعلم الإنسان الآلي. -
6:10 - 6:11فقد قرأت جريدة هذا الصباح
-
6:11 - 6:16حيث أنهم يتخذون إجراء تعداد
للحيوانات فى حديقة وطنية في نيروبي -
6:16 - 6:19مع "يولو" كجزء من نظام الكشف هذا.
-
6:19 - 6:22وهذا لأن "داركنيت" هو المصدر المفتوح
-
6:22 - 6:24وفى المجال العام،
كما أنه مجاناً لأي شخص ليستخدمه. -
6:26 - 6:31(تصفيق)
-
6:31 - 6:36ولكننا أردنا جعل الوصول
إلى الكشف أكتر سهولة وكذلك استعماله، -
6:36 - 6:40وذلك من خلال الجمع بين النموذج الأمثل،
-
6:40 - 6:43ووضغ البيانات على شكل ثنائي
والقيمة التقريبية، -
6:43 - 6:47ولدينا بالفعل كاشف مواد يعمل
على الهاتف المحمول. -
6:53 - 6:58(تصفيق)
-
6:59 - 7:04وأنا متحمس حقًا لأنه لدينا
الآن حل قوي جداً -
7:04 - 7:06لمشكلة رؤية الكمبيوتر ذات المستوى المنخفض،
-
7:06 - 7:10ويستطيع أي شخص أخذها
وبناء شيء باستخدامها. -
7:10 - 7:13لذا، البقية الآن متروكة لكم جميعاً
-
7:13 - 7:16والناس حول العالم ممن لهم إمكانية
وصول إلى هذا البرنامج، -
7:16 - 7:20ولا أستطيع الانتظار كي أرى ما سيبنيه
الناس باستخدام هذه التكنولوجيا. -
7:20 - 7:21شكراً لكم.
-
7:21 - 7:25(تصفيق)
- Title:
- كيف يتعلم الحاسوب التعرف على الأشياء فورًا؟
- Speaker:
- جوزيف ريدمود
- Description:
-
قبل عشر سنوات، اعتقد الباحثون أن الحصول على جهاز كمبيوتر يمكنه التفريق بين القط والكلب سيكون من المستحيل تقريبًا. لكن اليوم، تستطيع الرؤية الحاسوبية فعل ذلك مع أكثر من 99 % من الدقة. كيف ذلك؟ يعمل جوزيف ريدمون على يولو (انظر مرة واحدة فقط)، وهي طريقة مفتوحة المصدر للكشف عن الكائنات في الصور والفيديو - من الحمر الوحشية وحتى إشارات التوقف - بسرعة البرق. وذلك في عرض حي ملحوظ، ويظهر يدمون قبالة هذه الخطوة الهامة إلى الأمام لتطبيقات مثل السيارات ذاتية القيادة وتصميم واستخدام الإنسان الآلي وحتى الكشف عن السرطان.
- Video Language:
- English
- Team:
- closed TED
- Project:
- TEDTalks
- Duration:
- 07:37
Riyad Altayeb approved Arabic subtitles for How computers learn to recognize objects instantly | ||
Riyad Altayeb accepted Arabic subtitles for How computers learn to recognize objects instantly | ||
Riyad Altayeb edited Arabic subtitles for How computers learn to recognize objects instantly | ||
Riyad Altayeb edited Arabic subtitles for How computers learn to recognize objects instantly | ||
Riyad Altayeb edited Arabic subtitles for How computers learn to recognize objects instantly | ||
Riyad Altayeb edited Arabic subtitles for How computers learn to recognize objects instantly | ||
Riyad Altayeb edited Arabic subtitles for How computers learn to recognize objects instantly | ||
Abdul Rahman Malek edited Arabic subtitles for How computers learn to recognize objects instantly |