في عالم تتسابق فيه نماذج الذكاء الاصطناعي لتقديم قدرات استثنائية، من تحليل الفحوصات الطبية إلى توليد الصور ومقاطع الفيديو بناءً على وصف المستخدم، برز مؤخراً نموذج جديد يُتوقع أن يُحدث نقلة نوعية في مجال التفاعل الصوتي بين الإنسان والآلة.

ففي أواخر العام الماضي، أعلنت شركة Kyutai، وهي شركة فرنسية ناشئة في مجال الذكاء الاصطناعي، عن إطلاق نموذج صوتي جديد يحمل اسم موشي (Moshe)، وهو نموذج يتميز بقدرته على التحدث بسرعة قريبة جداً من سرعة البشر، ما يفتح الباب أمام تفاعلات أكثر واقعية وانسيابية مع الآلات.
موشي الذكاء الاصطناعي الذي “يتحدث كالبشر”
قال باتريك بيريز (Patrick Perez)، مدير الأبحاث في مختبر Kyutai، واصفاً العمل الذي توج بتطوير موشي:
“لقد كانت جهود الفريق بطولية، وتمثل موشي خطوة مهمة نحو جعل المحادثات مع الأنظمة الاصطناعية أكثر طبيعية وسلاسة.”
المميز في موشي أنه يتفاعل في الزمن الحقيقي، حيث يمكن للمستخدم الحديث إليه كما لو كان يتحدث إلى إنسان فعلي، دون التأخير المعتاد الذي يرافق المحادثات مع روبوتات الدردشة الصوتية.
🕒 زمن الاستجابة: 0.2 ثانية فقط (200 مللي ثانية)، وهو ما يُعد إنجازًا تقنيًا مذهلًا في عالم المعالجة الصوتية.
ما التقنية التي يعتمد عليها موشي؟
يعتمد موشي على نموذج لغوي داخلي يدعى Helium، وهو أيضًا من تطوير مختبر Kyutai. وقد تم تدريب النموذج على كمية ضخمة من البيانات المتوفرة عبر الإنترنت، بالإضافة إلى سلاسل صوتية محاكيه للمحادثات البشرية، مما منحه القدرة على محاكاة نبرة الصوت والتفاعل العاطفي.
هل يمكن أن ينافس أليكسا وسيري؟
رغم أن موشي لا يزال في مراحله التجريبية الأولى، إلا أن سرعة استجابته وجودة صوته يجعلان منه منافسًا محتملاً لأنظمة شهيرة مثل:
-
Siri من Apple
-
Google Assistant
-
Amazon Alexa
لكن ما يميّزه هو واقعيته المذهلة في التفاعل الصوتي اللحظي، ما قد يمنحه الأفضلية مستقبلاً.
لمحة عن شركة Kyutai
شركة Kyutai هي مختبر ذكاء اصطناعي فرنسي غير ربحي، تأسس بهدف تطوير تقنيات الذكاء الاصطناعي مفتوحة المصدر، بمشاركة باحثين من خلفيات أكاديمية وشركات تقنية عالمية. وهي مدعومة من عدة جهات أوروبية بارزة، وتسعى إلى أن تكون مركزاً أوروبياً مستقلاً للابتكار في مجال الذكاء الاصطناعي.