بدون علم مؤلفيها.. 200 ألف كتاب تُستخدم لتدريب الذكاء الاصطناعي
تعمل كبرى شركات التكنولوجيا حالياً على استخدام أكثر من مئتي ألف كتاب لتدريب نظام جديد للذكاء الاصطناعي يُدعى «بووكس 3» على إيصال المعلومات للمتلقين، وتكمن المشكلة في قيام هذه الشركات بهذا الأمر دون علم المؤلفين.
ووفقاً لتحقيق أجرته مجلة «ذي أتلانتيك» تستند مجموعة البيانات إلى مجموعة من الكتب «المقرصنة» بمختلف التصنيفات الأدبية من الشعر إلى القصص المثيرة، وتسبب «بووكس 3» في مواجهة شركة «ميتا» دعاوى قضائية خاصة أنها أحد المسؤولين عن تدريب آلية الذكاء الاصطناعي.
وتتطلب أداة الذكاء الاصطناعي نصوصاً عالية الجودة لاستيعاب اللغة ما يعني أنه لا يمكن استخدام المقالات ركيكة المستوى لغوياً من الإنترنت لتدريبها، فالمحتوى عالي الجودة ضروري حتى تتمكن الأداة لاحقاً من إنتاج نصوص مقبولة ومفهومة للجمهور.
وبفضل قاعدة البيانات التي نشرتها «ذي أتلانتيك» والتي تم استخراجها من «بووكس 3» يمكن للأدباء معرفة كون مؤلفاتهم تُستخدم على وجه التحديد لتدريب الأداة الجديدة، والعديد منهم ليسوا سعداء!
ومن بين الكتاب الذين تعرضت كتبهم للقرصنة الكاتبة الرومانسية غزيرة الإنتاج نورا روبرتس بنحو 206 أعمال روائية ولا يسبقها سوى الكاتب الإنجليزي وليم شكسبير.
وقالت الكاتبة الكورية الأميركية ماري إتش كيه تشوي -وجدت بعض كتبها في القائمة- عبر حساباتها على مواقع التواصل الاجتماعي «إنني محبطة ومحطمة»، مضيفة «أنا غاضبة وفي الوقت نفسه أشعر بالعجز التام».
ومن جانبها أعربت مين جين لي مؤلفة روايات (باتشينكو) و(طعام مجاني للمليونيرات) عن أفكار مماثلة عبر وسائل التواصل الاجتماعي واصفة صراحة استخدام كتبها «بالسرقة».
وقالت مين جين لي «لقد أمضيت ثلاثة عقود من حياتي في صياغة كتبي»، مضيفة «إن نماذج اللغات الكبيرة لم تستوعب أو تستخرج البيانات، لقد سرقت شركات الذكاء الاصطناعي عملي ووقتي وإبداعي، لقد سرقوا قصصي لقد سرقوا جزءاً مني»، بينما وصفت نورا روبرتس القائمة بأنها اشتملت على «كل الأخطاء الممكنة».
وتوغل الذكاء الاصطناعي حالياً إلى جميع المجالات بدءاً من مهام الكتابة إلى المذكرات القانونية كما تحولت التقنية في أيدي الشركات الكبرى إلى مصدر قلق كبير للعديد من الكُتاب.
وكانت نقابة الكُتاب الأميركيين قد أضربت جزئياً هذا الصيف للمطالبة بفرض قيود على استخدام الذكاء الاصطناعي في كتابة الأفلام والبرامج التلفزيونية.
وكان عدد من اللاعبين الكبار بقطاع الأخبار والإعلام مثل نيويورك تايمز وبلومبيرغ و(إيه بي سي) و(إي أس بي إن) و ديزني قد حظروا إحدى أدوات الذكاء الاصطناعي من «تشات جي بي تي» من فحص المحتوى الذي تبثه عبر منصاتها، خاصة أن تلك المؤسسات تعتبر الأرشيف الخاص بها -إضافة إلى حقوق الملكية الفكرية- ذا قيمة كبيرة في مجال تزويد المستخدمين بمعلومات دقيقة.
(ليا أسميلاش-CNN)
Source link