عارف كتاب
يبدو أنّ بروز أدوات الذكاء الاصطناعي خلال الشهور الماضية فرض نفسه بقوة على المشهد التكنولوجي، وأحدث تغييرات جذرية في طريقة تعامل الشركات الكبرى مع بيانات المستخدمين؛ إذ توشك أيّام الأنشطة الإلكترونية التي لا تستلزم اتصالاً بشبكة الإنترنت ولا تفيد الذكاء الاصطناعي أن تولّي إلى غير رجعة.
وطوال الشهرين الماضيين سارعت شركات التكنولوجيا الكبرى، مثل إكس (تويتر سابقًا) ومايكروسوفت وميتا وزوم وإنستا كارت، إلى تحديث شروط الخدمة أو سياسية الخصوصية في تطبيقاتها ومنصاتها، على أنّ تسمح لها الآن بجمع البيانات والمعلومات من الأشخاص والعملاء لاستخدامها لاحقًا في تدريب نماذج الذكاء الاصطناعي التوليدي.
ويتأتى القول إن الشركات تولي عنايتها الآن بجميع الأنشطة التي يمارسها المستخدمون في منصاتها؛ إذ ترى في التغريدات وعمليات البحث في الإنترنت والتسوق من المتاجر الإلكترونية وسائل مهمة لتطوير ذكاء اصطناعي تنبؤي وتوليدي مثل بارد وتشات جي بي تي. ولعل زوم تحظى باهتمام أكبر من الشركات الأخرى؛ فبعدما أبدت شريحة واسعة من المستخدمين استياء عارمًا من الفكرة القائلة بتضمين مكالمات الفيديو في نموذج اللغة الضخم المستعمل في تدريب الذكاء الاصطناعي، قررت الشركة لاحقًا تغيير سياسة الاستخدام المحدثة لتعلن صراحة أنّ مكالمات الفيديو للمستخدمين لن تُستغلّ بتاتًا على هذه الشاكلة.
سارعت شركات التكنولوجيا الكبر إلى تحديث شروط الخدمة أو سياسية الخصوصية في تطبيقاتها ومنصاتها، على أنّ تسمح لها الآن بجمع البيانات والمعلومات من الأشخاص والعملاء لاستخدامها لاحقًا في تدريب نماذج الذكاء الاصطناعي التوليدي.
بيد أنّ هذا الرفض والاستياء الشديدين لم يردعا شركات أخرى عن تحويل منصاتها إلى أرض خصبة لتدريب الذكاء الاصطناعي؛ فعلى سبيل المثال يعرف ريڤ (Rev) بأنّه موقع إلكتروني يقدم للمستخدمين خدمات التفريغ الصوتي للمحادثات المسجلة والمكالمات الهاتفية، فضلًا عن إنشاء نصوص توضيحية مصاحبة لمقاطع الفيديو، وقد أدخلت الشركة المالكة للموقع سلسلة من التحديثات على شروط الخدمة، فأضافت قسمًا جديدًا بمسمى "محتواكَ ومعه مخرجات الخدمات". وتنصّ بنود هذا القسم على وجود ترخيص شامل يتيح للشركة حق استخدام المحتوى المحمَّل على موقعها، العام منه أو الخاص، وتنصّ كذلك حق استعمال البيانات لتحسين خدماتها مثل تدريب نموذج ASR الذي حوّل الكلام إلى نصوص، وغيره من نماذج الذكاء الاصطناعي التابعة للشركة.
وتشير نسخةٌ منشورة في أرشيف الإنترنت إلى تحديث شروط الخدمة في موقع ريڤ خلال شهر يونيو الفائت، غيرَ أنّ الشركة لم تطالب مستخدميها بمراجعة شروط الخدمة المحدّثة إلّا في شهر سبتمبر الحالي، حينما أرسلت بريدًا إلكترونيًا أعلنت فيه عن شراكتها مع أوبن إي آي (OpenAI)- الشركة المطورة لنموذج تشات جي بي تي؛ إذ أصبحت الأخيرة معالجًا خارجيًا وفرعيًا لبيانات ريڤ. وتقتضي اتفاقية الشراكة أنْ تتولى أوبن إي آي الآن مسؤولية معالجة البيانات الواردة من ريڤ بغرض تطوير "ميزة جديدة قادمة قريبًا". وعلى العموم لم تكشف ريڤ حتى الآن طبيعة التغييرات الطارئة على شروط الخدمة لديها، واكتفى مُتحدِّثها الرسمي بالقول إنّ الشروط حُدِّثت هذا الشهر، وإنّ نموذج الذكاء الاصطناعي لديها يعوّل على "مجموعة متنوعة من البيانات الصوتية".
وتباع المتحدث كلامه: "تستخدم ريڤ البيانات على الدوام، وهذا الأمر ليس محصورًا بهذه المدة التي أصبحت فيها ريڤ من عملاء أوبن إي آي. فالشركة تُكرّس البيانات دومًا لتدريب نموذج الذكاء الاصطناعي التابع لها". وادّعى المتحدث الرسمي أنّ لمستخدمي ريڤ حقّ إلغاء مشاركة بياناتهم في تدريب الذكاء الاصطناعي، فما عليهم إلّا إرسال رسالة إلكترونية إلى البريد التالي: [email protected]. وقال المتحدّث كذلك بألا استمارة مخصصة لهذا الطلب، غير أنّ ريڤ تكفل لمستخدميها مراعاة هذه الطلبات وتنفيذها.
في المقابل عمدت شركة إنستا كارت (Instacart)- وهي منصة لتسوق منتجات البقالة عبر الإنترنت- إلى تحديث شروطها وأحكامها في شهر أغسطس الماضي، فأضافت صياغة تحظر فيها على أي شخص أو جهة استخدام محتواها وبياناتها "لأغراض إنشاء أدوات الذكاء الاصطناعي أو تدريبها أو اختبارها أو تحسينها"، على أن يسري ذلك أيضًا على نماذج اللغة الضخمة أو نماذج تعلم الآلة التي تقوم عليها.
ولا تدّخر الشركات الأخرى أي جهدٍ مستطاعٍ للحيلولة دون استخراج بياناتها من الإنترنت، وتخزينها في مجموعات البيانات اللازمة لتدريب نماذج الذكاء الاصطناعي. ومع ذلك أضافت شركة إنستا كارت صياغة مواربة تخولّها استغلال بيانات عملائها لهذا الغرض، فقالت: "لا نسمح باستخدام بياناتنا ومحتوى موقعنا لأغراض إنشاء أدوات الذكاء الاصطناعي أو تدريبها أو اختبارها أو تحسينها، ما عدا تعزيز قدرة خوارزميات تعلم الآلة لدينا بما يفيد أغراض التشغيل وتحسين خدماتنا". واللافت للاهتمام أنّ شروط الخدمة السابقة خلت كليًا من هذه الصياغة حسب نسخة متاحة في أرشيف الإنترنت. وفي هذا السياق أكد متحدّث رسمي باسم الشركة أنّها توشك على نشر أداةٍ من أدوات الذكاء الاصطناعي في منصتها.
وتابع المتحدث قوله: "إننا ندمج تجارب الذكاء الاصطناعي في منتجاتنا وخدماتنا لمساعدة العملاء في عملية التسوق، واتخاذ القرارات المتعلقة بشراء الأغذية. ومن هذا المنطلق تبين شروط الخدمة المحدثة لدينا أنّ الذكاء الاصطناعي أضحى جزءّا من منصة إنستا كارت، وهو إلى ذلك يخضع لقيود إساءة الاستخدام والأحكام العامة لشروطنا، فمعايير هذه المنتجات لا تختلف قطّ عن معايير منتجنا ببرمته".
لا تدّخر الشركات أي جهدٍ مستطاعٍ للحيلولة دون استخراج بياناتها من الإنترنت، وتخزينها في مجموعات البيانات اللازمة لتدريب نماذج الذكاء الاصطناعي
وحتّى لما تعلن الشركات عن التغييرات الواردة في تحديثات اتفاقية شروط الخدمة أو سياسة الخصوصية المتعلقة باستخدام البيانات لتدريب الذكاء الاصطناعي، فإنّها تعلنها بطريقة مبهمة؛ فعلى سبيل المثال، أضافت شروط مايكروسوفت المحدثة، التي أبرزت التغييرات التي يبدأ مفعولها منذ 30 سبتمبر/أيلول الحالي، فقرة جديدة فيها خمس نقاط عن خدمات الذكاء الاصطناعي، منها نقطة واحدة عن بيانات المستخدم جاء نصها وفق ما يلي: "في إطار توفير خدمات الذكاء الاصطناعي، تعكف مايكروسوفت على معالجة وتخزين المدخلات التي تُزوِّد بها الخدمة، والمُخرجات التي تحصل عليها، على أنْ يخضع ذلك لأغراض المراقبة ومنع الاستخدامات المسيئة للخدمة، والحيلولة دون صدور مُخرجات ضارة أو مسيئة". أما سائر النقاط الأربع المتبقية، فتتطرق لمنع مايكروسوفت لاستعمال خدمات الذكاء الاصطناعي في تطوير أدوات الذكاء الاصطناعي الأخرى.
وعلى غرار الشركات السابقة، تتيح جوجل للعموم الاطّلاع على نسخة أرشيفية من شروط الخدمة التي حُدِّثت في شهر يوليو/تموز الماضي، بيد أنّ كلامها يظل مبهمًا حينما تشير إلى طريقة تعاملها مع بيانات المستخدمين فيما يخصّ الذكاء الاصطناعي. وتبين جوجل بجلاءٍ أنّها قادرة على استخدام البيانات بمقتضى الرخصة التي تخولها "تشغيل الخدمات وتحسينها"، وهذا يضمن تطوير "مزايا ووظائف جديدة"، وتتطرق جوجل كذلك في سياسة الخصوصية- التي حُدِّثت في يوليو/تموز- إلى أداء بارد للذكاء الاصطناعي التوليدي، وتؤكد أنها "تُكرّس البيانات العامة في تدريب نماذج الذكاء الاصطناعي التابعة لها، وتطوير منتجات وميزات لأدوات متنوعة منها مترجم جوجل، وبارد، وقدرات Cloud AI".
ولا ريب أنّ شركة إكس (تويتر سابقًا) من المنصات الصريحة التي توضح بجلاء طريقة استفادتها من بيانات المستخدمين في تدريب الذكاء الاصطناعي، لا سيما أنّ مالكها، إيلون ماسك، يعكف على تطوير مشروع جديد للذكاء الاصطناعي. وسبق لمنصة إكس أنْ حدّثت سياسة الخصوصية في هذا الشهر، ووضحت قائلة: "إننا نستعمل المعلومات التي نجمعها والمعلومات العامة في تدريب نماذج تعلم الآلة والذكاء الاصطناعي، بما يتماشى مع الغايات الواردة في هذه السياسة".
وضعت ميتا نموذجًا لكي يتقدّم المستخدمون بـ "طلب" لئلا تُتخذ بياناتهم في تدريب نماذج الذكاء الاصطناعي، بيد أنّ الشركة لم تذكر بتاتًا إنْ كانت ستمتثل لطلبات كهذه.
ولم تَحِد ميتا عن سبيل الشركات الأخرى؛ إذ حدّثت سياسة الخصوصية في منصاتها خلال شهر يونيو/حزيران الماضية، فأصبح المستخدمون على دراية بأنّ "نشاطاتهم والمعلومات التي يقدمونها في منتجات ميتا وخدماتها" تُعتمَدُ لاحقًا بغرض تدريب نماذج الذكاء الاصطناعي التوليدية، والأمر عينه يسري على أي شيء نصي أو صوتي أُنشِئ باستعمال أدوات الذكاء الاصطناعي، مثل Llama 2 أو CM3leon. ولا ريب أنّ هذا معلومات تشمل تحديثات الحالات وصور إنستغرام، فهي جميعًا جزء من مجموعات بيانات تدريب الذكاء الاصطناعي لدى ميتا. ويبدو أنّ الشركة تلقي بالمسؤولية على كاهل المستخدمين لحماية معلوماتهم الشخصية التي لا يريدون مشاركتها في تدريب أدوات الذكاء الاصطناعي، فهم أصحاب القرار في منع إدراجها ضمن بيانات التدريب. وهنا تنصح ميتا الأفراد بتوخي الحذر بشأن ما يشاركونه من معلومات في الأوامر (prompts) التي يكتبونها عند استعمال الذكاء الاصطناعي.
وتنصح ميتا المستخدمين قائلة: "لا تذكروا أي معلومات شخصية عنكم، مثل رقم الهاتف أو عنوان المنزل". وعلى العموم وضعت ميتا في نهاية شهر أغسطس/آب الفائت نموذجًا بسيطًا لكي يتقدّم المستخدمون بـ "طلب" لئلا تُتخذ بياناتهم في تدريب نماذج الذكاء الاصطناعي، بيد أنّ الشركة لم تذكر بتاتًا إنْ كانت ستمتثل لطلبات كهذه.