تكنولوجيا

“أوبن ايه آي” تعرض أداة جديدة لاستنساخ الصوت قائمة على الذكاء الاصطناعي

وكالات – شريف صفوت 

أعلنت شركة أوبن إيه آي أنها أجرت مؤخرًا معاينة على نطاق صغير لأداة جديدة تسمى محرك الصوت، وهي تقنية استنساخ صوتي يمكنها تقليد أي مكبر صوت من خلال تحليل عينة صوتية مدتها 15 ثانية، وتقول الشركة أنها تنتج “كلامًا طبيعيًا” بأصوات عاطفية وواقعية.

وتعتمد هذه التقنية على واجهة برمجة تطبيقات تحويل النص إلى كلام الموجودة مسبقًا للشركة، وهي قيد العمل منذ عام 2022، وتستخدم أوبن إيه آي بالفعل إصدارًا من مجموعة الأدوات لتشغيل الأصوات المعدة مسبقًا المتوفرة حاليا في تحويل النص إلى كلام، مثل واجهة برمجة التطبيقات وميزة القراءة بصوت عالٍ.

وهناك مجموعة من العينات على المدونة الرسمية للشركة وهي تبدو قريبة بشكل مخيف من الشيء الحقيقي.

ويقول المسئولون في أوبن إيه آي أنهم يرون أن هذه التكنولوجيا مفيدة للمساعدة في القراءة وترجمة اللغات ومساعدة أولئك الذين يعانون من حالات النطق المفاجئة أو التنكسية.

وطرحت الشركة برنامجًا تجريبيًا لجامعة براون ساعد مريضًا يعاني من مشكلات ضعف النطق عن طريق إنشاء محرك صوتي مستنسخ مأخوذ من الصوت المسجل لمشروع مدرسي.

وعلى الرغم من الفوائد المحتملة، فمن المؤكد أن الجهات الفاعلة السيئة ستسيء استخدام هذه التكنولوجيا للانخراط في بعض عمليات التزييف العميق الخطيرة، والتي تمثل مشكلة بالفعل، ومع أخذ هذا في الاعتبار، فإن محرك الصوت ليس جاهزًا تمامًا للاستخدام في أوقات الذروة، نظرًا لوجود مخاوف خطيرة تتعلق بالخصوصية يجب تلبيتها قبل الإطلاق الكامل.

وتعترف شركة أوبن إيه آي بأن هذه التقنية تنطوي على “مخاطر جسيمة، والتي تتصدر قائمة أولوياتنا بشكل خاص في عام الانتخابات”.

وتقول الشركة أنها تدمج التعليقات الواردة من “الشركاء الأمريكيين والدوليين من مختلف أنحاء الحكومة ووسائل الإعلام والترفيه والتعليم والمجتمع المدني وخارجه” لضمان إطلاق المنتج بأقل قدر من المخاطر.

ووافق جميع مختبري المعاينة على سياسات استخدام أوبن إيه آي، التي تحظر انتحال شخصية فرد آخر دون موافقة أو حق قانوني.

بالإضافة إلى ذلك، سيتعين على أي شخص يستخدم التكنولوجيا أن يكشف لجمهوره أن الأصوات يتم إنشاؤها بواسطة الذكاء الاصطناعي، و نفذت أوبن إيه آي تدابير السلامة، مثل العلامة المائية لتتبع أصل أي صوت و”مراقبة استباقية” لكيفية استخدام النظام.

وعندما يتم طرح المنتج رسميًا، ستكون هناك “قائمة صوتية محظورة” تكتشف وتمنع مكبرات الصوت التي تم إنشاؤها بواسطة الذكاء الاصطناعي والتي تشبه الشخصيات البارزة.

أما بالنسبة للوقت الذي سيتم فيه هذا الطرح، فإن أوبن إيه آي تظل متحفظة، وكشفت تك كرانش عن بعض بيانات التسعير المحتملة، ويمكن أن يكلف المحرك الصوتي 15 دولارًا لكل مليون حرف، وهو ما يعادل حوالي 162.500 كلمة، و تشير المواد التسويقية أيضًا إلى إصدار “اتش دي” يكلف ضعف السعر، لكن الشركة لم توضح بالتفصيل كيفية عمل ذلك.

وقامت أوبن إيه آي باتخاذ خطوات كبيرة هذا الأسبوع، وقد أعلنت للتو عن شراكة آخرى مع أفضل صديق لها مايكروسوفت لبناء حاسوب عملاق قائم على الذكاء الاصطناعي يسمى “ستارجيت”، وبحسب ما ورد سيكلف المشروع 100 مليار دولار، وفقًا للمعلومات.

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى