الروبوت ليس روبوتًا بعد اليوم

تقليص
X
 
  • تصفية - فلترة
  • الوقت
  • عرض
إلغاء تحديد الكل
مشاركات جديدة

  • الروبوت ليس روبوتًا بعد اليوم

    الروبوت ليس روبوتًا بعد اليوم



    من أين أبدأ.. هذا ليس عملا لروبوت

    في خطوة ثورية، طور مهندسو معهد ماساتشوستس للتكنولوجيا تقنية جديدة تُدعى كليو (Clio) تساعد الروبوتات على فهم البيئة المحيطة بها وتنفيذ المهام المعقدة بكفاءة تعتمد على خوارزميات متقدمة لتحديد الأجزاء المهمة من المشهد وتنفيذ مهام متعددة في الوقت الفعلي.

    ماساتشوستس (الولايات المتحدة) - “روبوت”، طالما استخدمنا هذه الكلمة لوصف عمل مكرر ورتيب. ولكن علينا منذ اليوم أن نبحث عن كلمة أخرى لنقول إن فلانًا من الناس يعمل مثل الروبوت. الروبوت عادة يقوم بمهمة محددة. لا يمكن أن تطلب من روبوت الدخول إلى مطبخ تعم فيه الفوضى، ليعيد تنظيم الأمور والتخلص من العبوات الفارغة والطعام الذي انتهت مدة صلاحيته، والتخلص من قطع زجاج مكسور من ليلة أمس. طلب مثل هذا لا يمكن للروبوت تنفيذه، ولكن قد تتغير الصورة قريبًا بعد أن أعلن مهندسو معهد ماساتشوستس للتكنولوجيا عن تطوير طريقة تمكن الروبوتات من اتخاذ قرارات بديهية مماثلة ذات صلة بالمهام.

    يمكن النهج الجديد للفريق، المسمى كليو، الروبوت من تحديد أجزاء المشهد المهمة، بالنظر إلى المهام المطروحة. مع كليو يأخذ الروبوت قائمة من المهام الموصوفة بلغة طبيعية، وبناءً على تلك المهام يحدد مستوى الدقة المطلوب لتفسير محيطه و”تذكر” فقط أجزاء المشهد ذات الصلة. كلمة “كليو” ليست اختصارًا لتسمية أكبر، ولكنها اسم مستوحى من الأساطير اليونانية، حيث كانت كليو واحدة من تسع ميوزات (آلهات الفنون والإلهام) في الأساطير اليونانية.


    لوكا كارلون: البحث والإنقاذ هما التطبيق المحفز لهذا العمل


    كانت كليو تُعرف بأنها ميوزة التاريخ، وهي التي تلهم الشعراء والمؤرخين لتسجيل الأحداث التاريخية. في سياق الروبوتات قد يكون اختيار هذا الاسم إشارة إلى قدرة النظام على “تسجيل” أو “رسم خارطة” للمشهد بدقة، وهو ما يساعد الروبوتات على فهم البيئة المحيطة بها بشكل أفضل وتنفيذ المهام المطلوبة بكفاءة.

    في تجارب حقيقية تتراوح من حجرة مزدحمة إلى مبنى من خمسة طوابق في حرم معهد ماساتشوستس للتكنولوجيا، استخدم الفريق كليو لتقسيم المشهد تلقائيًا على مستويات مختلفة من الدقة، بناءً على مجموعة من المهام المحددة في مطالبات اللغة الطبيعية مثل “نقل رف المجلات” و”الحصول على مجموعة الإسعافات الأولية”. قام الفريق أيضًا بتشغيل كليو في الوقت الفعلي على روبوت رباعي الأطراف. أثناء استكشاف الروبوت لمبنى المكاتب، حددت كليو ورسمت خرائط تلك الأجزاء من المشهد التي تتعلق بمهام الروبوت (مثل استرداد لعبة مع تجاهل أكوام اللوازم المكتبية)، وهو ما يسمح للروبوت بفهم الأشياء المثيرة للاهتمام.

    ويتصور الباحثون أن كليو ستكون مفيدة في العديد من المواقف والبيئات التي يتعين على الروبوت فيها مسح محيطه وفهمه بسرعة في سياق مهمته المحددة. “البحث والإنقاذ هما التطبيق المحفز لهذا العمل، ولكن كليو يمكنها أيضًا تشغيل الروبوتات المنزلية والروبوتات التي تعمل على أرضية المصنع جنبًا إلى جنب مع البشر”، كما يقول لوكا كارلون، الأستاذ المشارك في قسم الملاحة الجوية والفضائية في معهد ماساتشوستس للتكنولوجيا، الباحث الرئيسي في مختبر المعلومات وأنظمة القرار (LIDS)، مضيفًا “يتعلق الأمر حقًا بمساعدة الروبوت على فهم البيئة وما يجب أن يتذكره من أجل تنفيذ مهمته”.

    ومكنت التطورات الهائلة في مجالات الرؤية الحاسوبية ومعالجة اللغة الطبيعية الروبوتات من تحديد الأشياء في محيطها. ولكن حتى وقت قريب، كانت الروبوتات قادرة على القيام بذلك فقط في سيناريوهات “المجموعة المغلقة”، حيث تتم برمجتها للعمل في بيئة منسقة وخاضعة للرقابة بعناية، مع عدد محدود من الأشياء التي تم تدريب الروبوت مسبقًا على التعرف عليها.


    ◙ كليو واحدة من تسع ميوزات (آلهات الفنون والإلهام) في الأساطير اليونانية تلهم الشعراء والمؤرخين لتسجيل الأحداث التاريخية


    في السنوات الأخيرة اتخذ الباحثون نهجًا أكثر “انفتاحًا” لتمكين الروبوتات من التعرف على الأشياء في إعدادات أكثر واقعية. وفي مجال التعرف على المواقع المفتوحة، استفاد الباحثون من أدوات التعلم العميق لبناء شبكات عصبية يمكنها معالجة مليارات الصور من الإنترنت، إلى جانب النص المرتبط بكل صورة، مثل صورة صديق على فيسبوك لكلب، مع تعليق “قابل جروا الجديد!”. من بين ملايين أزواج الصور والنصوص، تتعلم الشبكة العصبية عن طريق معالجة عدة مجموعات كبيرة من البيانات، ثم تحدد تلك الأجزاء في المشهد بطريقة تميز مصطلحات معينة. ويمكن للروبوت بعد ذلك تطبيق تلك الشبكة العصبية لاكتشاف مشهد جديد تمامًا.

    ولكن لا يزال هناك تحدٍ يتعلق بكيفية تحليل المشهد بطريقة مفيدة ذات صلة بمهمة معينة. مع كليو، يهدف فريق معهد ماساتشوستس للتكنولوجيا إلى تمكين الروبوتات من تفسير محيطها بمستوى من الدقة يمكن ضبطه تلقائيًا على المهام المطروحة. ويجمع نهج الفريق بين أحدث رؤية حاسوبية ونماذج لغوية كبيرة تضم شبكات عصبية تقوم بإجراء اتصالات بين ملايين الصور مفتوحة المصدر والنصوص الدلالية. كما أنها تتضمن أدوات رسم الخرائط التي تقسم الصورة تلقائيًا إلى العديد من الأجزاء الصغيرة، والتي يمكن إدخالها في الشبكة العصبية لتحديد ما إذا كانت أجزاء معينة متشابهة لغويًا. ثم يستفيد الباحثون من فكرة من نظرية المعلومات الكلاسيكية تسمى “عنق الزجاجة المعلوماتية”، والتي يستخدمونها لضغط عدد من مقاطع الصور بطريقة تنتقي وتخزن الأجزاء الأكثر صلة من الناحية الدلالية بمهمة معينة.

    “على سبيل المثال، لنفترض أن هناك كومة من الكتب في المشهد وأن مهمتي هي فقط الحصول على الكتاب الأخضر. في هذه الحالة، ندفع كل هذه المعلومات حول المشهد من خلال عنق الزجاجة هذا وينتهي بنا الأمر بمجموعة من الأجزاء التي تمثل الكتاب الأخضر”، وفق توضيح دومينيك ماجيو، وهو عضو في الفريق المشارك بالدراسة.


    دومينيك ماجيو: تشغيل كليو في الوقت الفعلي إنجاز كبير للفريق


    ويقول “يتم تجميع جميع الأجزاء الأخرى غير ذات الصلة في مجموعة يمكننا إزالتها ببساطة. ويتبقى لنا كائن في الدقة الصحيحة اللازمة لدعم مهمتي”. وأظهر الباحثون كليو في بيئات مختلفة في العالم الحقيقي. يقول ماجيو “ما اعتقدنا أنه سيكون تجربة لا معنى لها حقًا هو تشغيل كليو في شقتي، حيث لم أقم بأي تنظيف مسبقًا”. وضع الفريق قائمة بمهام اللغة الطبيعية، مثل “تحريك كومة الملابس”، ثم طبق كليو على صور شقة ماجيو المزدحمة. في هذه الحالات تمكنت كليو من تقسيم مشاهد الشقة بسرعة وتغذية الأجزاء من خلال خوارزمية عنق الزجاجة للمعلومات لتحديد تلك الأجزاء التي تشكل كومة الملابس.

    كما قاموا بتشغيل كليو على روبوت بوسطن ديناميك الرباعي، سبوت. أعطوا الروبوت قائمة بالمهام لإكمالها، وبينما كان الروبوت يستكشف ويرسم خارطة داخل مبنى المكاتب، ركضت كليو في الوقت الفعلي على جهاز كمبيوتر على متن الطائرة مثبت على سبوت، لاختيار مقاطع في المشاهد المعينة التي تتعلق بصريًا بالمهمة المحددة. أنشأت الطريقة خارطة تراكب تظهر الكائنات المستهدفة فقط، والتي استخدمها الروبوت بعد ذلك للاقتراب من الكائنات المحددة وإكمال المهمة فعليًا. يقول ماجيو “كان تشغيل كليو في الوقت الفعلي إنجازًا كبيرًا للفريق”، وأردف “الكثير من العمل السابق يمكن أن يستغرق عدة ساعات للتشغيل”.

    ومن الآن فصاعدًا يخطط الفريق لتكييف كليو لتكون قادرة على التعامل مع المهام عالية المستوى والبناء على التطورات الحديثة في تمثيلات المشهد المرئي الواقعي. ويضيف ماجيو "ما زلنا نعطي كليو مهام محددة إلى حد ما، مثل العثور على مجموعة البطاقات. للبحث والإنقاذ، تحتاج إلى منحها المزيد من المهام عالية المستوى، مثل العثور على الناجين، أو استعادة الطاقة. لذلك نريد الوصول إلى فهم أكثر إنسانية لكيفية إنجاز مهام أكثر تعقيدًاimage widget
يعمل...
X