روبوتات تقوم بمهارات الفهم الاستراتيجي

تقليص
X
 
  • تصفية - فلترة
  • الوقت
  • عرض
إلغاء تحديد الكل
مشاركات جديدة

  • روبوتات تقوم بمهارات الفهم الاستراتيجي

    روبوتات تقوم بمهارات الفهم الاستراتيجي
    • أسماء محمد


    أصدر باحثون من شركة DeepMind ورقة بحثية حول استخدام التعلم المعزز العميق لتدريب الروبوتات المصغرة على مهارات الحركة المعقدة والفهم الاستراتيجي، ما أدى إلى أداء فعال في محاكاة لعبة كرة قدم فردية.

    على موقع الويب التجريبي لـ "تعلم مهارات كرة القدم الرشيقة لروبوت ذي قدمين مع التعلم العميق المعزز"، يضع الباحثون إطاراً للإطاحة بلا رحمة بالروبوتات كجزء أساسي من التقييم واختبار "المتانة ومقاومة الدفع"، على الرغم من أن الروبوتات بطبيعتها تحول التعديلات الهشة والطفيفة على الأجهزة جنباً إلى جنب مع التنظيم الأساسي للسلوك أثناء التدريب إلى حركات آمنة وفعالة مع الاستمرار في الأداء بطريقة ديناميكية ورشيقة".

    من خلال القراءة في المصطلحات الفنية، سيحقق خبراء التعلم الآلي بلا شك ثورة تقنية في مكان ما هناك. لكن مثلنا، ركز رواد وسائل التواصل الاجتماعي بدلاً من ذلك على ما هو واضح: ألا يمكنهم ترك هذه الروبوتات الصغيرة اللطيفة وشأنها؟

    لنعد إلى DeepMind، ولنكن جادين لثانية واحدة. ما الذي يقف وراء قدرة الروبوت الصغير على الاستمرار في محاولته الحثيثة للتسجيل؟ استخدم الباحثون التعلم المعزز العميق، وهو نوع من الذكاء الاصطناعي، لتدريب الروبوتات البشرية على لعب مباراة كرة قدم فردية. قاموا أولاً بتدريب المهارات على حدة، ثم قاموا بتكوينها لإعداد المباراة.

    يكتب الباحثون: "تُظهر السياسة الناتجة مهارات حركية قوية وديناميكية مثل التعافي السريع من السقوط والمشي والدوران والركل وغير ذلك؛ والانتقالات بينها بطريقة سلسة ومستقرة وفعالة - تتجاوز بكثير ما هو متوقع بشكل حدسي من الروبوت".

    إنه عمل مثير للإعجاب، لكن لا يسع المرء إلا أن يعتقد أنه في يوم من الأيام، من الناحية النظرية، يصبح ذكاء الآلة متجسداً ومدركاً بدرجة كافية لبدء النظر إلى الوراء وفهم تاريخه، فربما يكون من غير الحكمة الإطاحة بالأشخاص الصغار بمثل هذا الفرح. أو، كما قال أحد الأشخاص على Twitter، "كل شيء ممتع ومسلّ حتى يبدأ الروبوت في الدفع".

    من جهة ثانية قامت شركة Boston Dynamics الرائدة في مجال الروبوتات البشرية بمشاركة نظرة لا تصدق من وراء الكواليس على مراحل بناء الروبوتات، لتقدم لنا نظرة فاحصة للروبوت وهو يتعلم الباركور، ويأخذ بعض الضربات الشائكة، ويتم إصلاحه.

    يمنحنا مطور الروبوتات وموقع YouTube Sensation نظرة خاطفة أخرى على جهود بناء الروبوتات، هذه المرة من خلال امتلاك منصة الأبحاث الروبوتية، أطلس، للقيام ببعض أنشطة الباركور. إلى جانب إصدار مقطع فيديو مصقول للغاية، نشرت الشركة أيضاً نظرة من وراء الكواليس على ما يتطلبه الأمر للحصول على روبوت للقفز عبر مسار مليء بالعقبات. إنها أفضل نظرة على Atlas حصلنا عليها حتى الآن وتعرض لقطات مذهلة للتصنيع والبرامج والإصلاحات - بالإضافة إلى بعض عمليات المسح عندما لا تسير الأعمال المثيرة وفقاً للخطة.

    هذا هو الفيديو الثالث الذي رأيناه لأطلس وهو يمارس رياضة الباركور، وقد تتساءل عن سبب هوس شركة Boston Dynamics بجعل روبوتاتها تقفز على الصناديق وتقوم بشقلبات خلفية. يمارس الروبوت أطلس رياضة الباركور لنفس السبب الذي يجعل شركات السيارات تمارس رياضة سباق السيارات. يؤدي استخدام الرياضة لدفع حدود الأداء للآلة إلى تطوير أجزاء وتقنيات أفضل، كما أن الاختبارات لها تأثير تدريجي على المنتجات الاستهلاكية. تماماً كما أدى سباق السيارات إلى إنشاء نظام دفع رباعي، والمكابح القرصية، وأطنان من ميزات الأمان للسيارات المعدة للاستهلاك، نأمل أن يؤدي تعليم الروبوت أطلس القيام بالشقلبات الخلفية إلى تطوير روبوتات أفضل من قبل Boston Dynamics.

    يبدأ سكوت كويندرسما، قائد فريق أطلس، مقطع الفيديو ببعض إحصائيات أطلس. إذ يبلغ طول الروبوت 5 أقدام ويزن 190 رطلاً. يعمل بالبطارية ويتم تشغيله هيدروليكياً ، مع 28 درجة من الحرية. يقدم كويندرسما أيضاً عرضاً لاختبار الباركور:

    يعتبر الباركور نشاطاً تنظيمياً مفيداً لفريقنا لأنه يسلط الضوء على العديد من التحديات التي نعتقد أنها مهمة. أولاً ، كيف نبني روبوتاً متحركاً عالي الطاقة بكثافة عالية قادراً على ممارسة سلوك رياضي ممتد؟ كيف نصمم خوارزميات تحكم يمكنها إنشاء مجموعة متنوعة من السلوكيات والتحكم فيها بقوة؟ وكيف نربط الإدراك بالعمل بطريقة تلتقط الأهداف طويلة المدى مثل الانتقال من النقطة أ إلى النقطة ب والأهداف الديناميكية قصيرة المدى مثل تعديل الخطوات وتطبيق القوى التصحيحية للحفاظ على التوازن؟

    على عكس مقطعي الفيديو السابقين، اللذين أظهرا حيلاً تنفذ لمرة واحدة، يُظهر الفيديو الجديد أن الروبوت أطلس يقوم بمسار تجاوز عقبات كامل دفعة واحدة، والذي تقول الشركة عنه أنه يساعد في الموثوقية والتكرار. تؤدي محاولة اجتياز مسار عقبة كامل إلى الكثير من الإخفاقات وتساعد فرق الأجهزة والبرامج على تعقب "الترقيات الاستراتيجية" التي يجب إجراؤها لمساعدة الروبوت على اجتياز الدورة التدريبية.

    إن حركة الروبوت أطلس مدفوعة الآن بالإدراك. في السابق، كان الروبوت يقوم فقط بالباركور المبرمج مسبقاً على سطح مستوٍ أو صناديق ثابتة، لكن أطلس يكتشف الآن البيئة بكاميرات RGB وأجهزة استشعار العمق ويتفاعل معها، "هذا يعني أن المهندسين لا يحتاجون إلى برمجة حركات القفز مسبقاً لجميع الأنظمة الأساسية والفجوات التي قد يواجهها الروبوت. بدلاً من ذلك، ينشئ الفريق عدداً أقل من سلوكيات الأنموذج التي يمكن مطابقتها مع البيئة وتنفيذها عبر الإنترنت". تتعامل ثلاثة أجهزة كمبيوتر على متن الطائرة مع جميع العمليات الحسابية اللازمة لإدراك العالم حول الروبوت أطلس، ورسم مسار محدد، وإبقاء الروبوت في وضع مستقيم.

    أثناء الجري خلال الدورة، يمتلك الروبوت ما يشبه انفجار خط هيدروليكي، والذي يرش السوائل في كل مكان بينما ينهار أطلس على الأرض في كومة. مرة أخرى، تنفجر منصة تحت وزن أطلس بينما تحاول الشفة الخلفية ، ويهبط الروبوت على رأسه مباشرة في سقطة قاسية وكانت ستكون مؤلمة لرياضي من لحم ودم..

    جزء من سبب أن المحاولات الاربعة تبدو سيئة للغاية هو أنه لا يبدو أن لدى أطلس أي نوع من اكتشاف السقوط حتى الآن. لدى البشر روتين لا إرادي لاكتشاف السقوط - عادةً ما تبرز ذراعيك وتحاول الإمساك بنفسك أثناء السقوط. لكن أطلس يصطدم بالأشياء أولاً.

    ----
    بقلم: رون أماديو - بينج إدواردز

    ترجمة عن موقع: Ars Technica

يعمل...
X