إعداد أحمد الشنقيطي ضجة كبيرة أحدثتها ورقة بحثية لطالبين يابانيين، حيث أثارت القلق في نفوس أبرز المهتمين بمجال الذكاء الاصطناعي، وبعثت مخاوفهم من سرعة تطور هذه التكنولوجيا، وخشيتهم من خروجها على السيطرة.. ليس آخرهم إيلون ماسك الذي دق ناقوس خطر حول الذكاء الاصطناعي، مشيراً إلى أنه "سلاح ذو حدين"، ومشدداً على ضرورة فرض ضوابط معينة عليه للتقليل من مخاطره.
بالعودة إلى الورقة البحثية، نجد أنها تقوم على إعادة بناء التجارب المرئية من نشاط الدماغ البشري لفهم كيفية تمثيل الدماغ للعالم، وتفسير العلاقة بين نماذج رؤية الكمبيوتر ونظامنا البصري. وفي حين تم استخدام نماذج توليدية عميقة مؤخراً لهذه المهمة، لا تزال إعادة بناء الصور الواقعية بدقة دلالية عالية مشكلة صعبة.
وتتحدث الورقة البحثية التي أعدها كل من يو تاكاجي وشينجي ناشيموتو اللذين يدرسان في كلية الدراسات العليا للعلوم البيولوجية بجامعة أوساكا اليابانية، عن نتائج تجربة وضع خلالها أشخاص داخل جهاز الرنين المغناطيسي mri، وعرض بعض الصور عليهم، وتسجيل قراءات لموجات المخ وإشاراته في أثناء مشاهدتهم للصور، ثم نقلت تلك البيانات وأدخلت لنموذج ذكاء اصطناعي لتوليد الصور يسمى ldm (الانتشار المستقر).
كانت النتيجة المفاجئة أو قل "الصادمة" أن النموذج استطاع تحويل تلك البيانات إلى صور تكاد تتطابق مع الصور التي شاهدها المتطوعون للتجربة في أثناء وجودهم في جهاز الرنين المغناطيسي.
تلك الصور وإن لم تكن مطابقة للأصل، لكنها تعد قفزة كبيرة في هذا المجال، يمكن البناء عليها وتخيل ما يمكن أن تصل إليه النماذج اللغوية والتصويرية مع هذا التسابق المحموم الذي كسر توقعات الخبراء بالنسبة لهذا العالم الذي فتحه الإنسان على نفسه.
لقد أثبتت التجربة إمكانية إعادة بناء صور عالية الدقة بدقة عالية وبطريقة مباشرة، دون الحاجة إلى أي تدريب إضافي وضبط دقيق لنماذج التعلم العميق المعقدة.
وقال الطالبان في مدونة لهما، إنهما وصفا كمياً في هذه الورقة العلاقة بين نشاط الدماغ البشري ونوع من الذكاء الاصطناعي لتوليد الصور يسمى ldm (الانتشار المستقر)، فاستطعنا فك تشفير (تصور) المحتوى الإدراكي من نشاط الدماغ.
وأضاف الطالبان أن هذه الورقة توضح أنه من خلال الجمع بين المعلومات الهيكلية المرئية التي تم فك تشفيرها من النشاط في القشرة البصرية المبكرة مع السمات الدلالية التي تم فك تشفيرها من النشاط في المناطق ذات الترتيب الأعلى وعن طريق تعيين المعلومات التي تم فك تشفيرها مباشرة إلى التمثيلات الداخلية لنموذج الانتشار الكامن (ldm; الانتشار المستقر) دون ضبط دقيق، من الممكن فك تشفير (أو توليد) الصور من نشاط الدماغ.
بالعودة إلى الورقة البحثية، نجد أنها تقوم على إعادة بناء التجارب المرئية من نشاط الدماغ البشري لفهم كيفية تمثيل الدماغ للعالم، وتفسير العلاقة بين نماذج رؤية الكمبيوتر ونظامنا البصري. وفي حين تم استخدام نماذج توليدية عميقة مؤخراً لهذه المهمة، لا تزال إعادة بناء الصور الواقعية بدقة دلالية عالية مشكلة صعبة.
وتتحدث الورقة البحثية التي أعدها كل من يو تاكاجي وشينجي ناشيموتو اللذين يدرسان في كلية الدراسات العليا للعلوم البيولوجية بجامعة أوساكا اليابانية، عن نتائج تجربة وضع خلالها أشخاص داخل جهاز الرنين المغناطيسي mri، وعرض بعض الصور عليهم، وتسجيل قراءات لموجات المخ وإشاراته في أثناء مشاهدتهم للصور، ثم نقلت تلك البيانات وأدخلت لنموذج ذكاء اصطناعي لتوليد الصور يسمى ldm (الانتشار المستقر).
كانت النتيجة المفاجئة أو قل "الصادمة" أن النموذج استطاع تحويل تلك البيانات إلى صور تكاد تتطابق مع الصور التي شاهدها المتطوعون للتجربة في أثناء وجودهم في جهاز الرنين المغناطيسي.
تلك الصور وإن لم تكن مطابقة للأصل، لكنها تعد قفزة كبيرة في هذا المجال، يمكن البناء عليها وتخيل ما يمكن أن تصل إليه النماذج اللغوية والتصويرية مع هذا التسابق المحموم الذي كسر توقعات الخبراء بالنسبة لهذا العالم الذي فتحه الإنسان على نفسه.
لقد أثبتت التجربة إمكانية إعادة بناء صور عالية الدقة بدقة عالية وبطريقة مباشرة، دون الحاجة إلى أي تدريب إضافي وضبط دقيق لنماذج التعلم العميق المعقدة.
وقال الطالبان في مدونة لهما، إنهما وصفا كمياً في هذه الورقة العلاقة بين نشاط الدماغ البشري ونوع من الذكاء الاصطناعي لتوليد الصور يسمى ldm (الانتشار المستقر)، فاستطعنا فك تشفير (تصور) المحتوى الإدراكي من نشاط الدماغ.
وأضاف الطالبان أن هذه الورقة توضح أنه من خلال الجمع بين المعلومات الهيكلية المرئية التي تم فك تشفيرها من النشاط في القشرة البصرية المبكرة مع السمات الدلالية التي تم فك تشفيرها من النشاط في المناطق ذات الترتيب الأعلى وعن طريق تعيين المعلومات التي تم فك تشفيرها مباشرة إلى التمثيلات الداخلية لنموذج الانتشار الكامن (ldm; الانتشار المستقر) دون ضبط دقيق، من الممكن فك تشفير (أو توليد) الصور من نشاط الدماغ.