كشفت شركة ميسترال الفرنسية الناشئة عن “فوإكسترال” (Voxtral)، أول نموذج ذكاء اصطناعي مفتوح المصدر قادر على معالجة وتوليف الصوت بدقة عالية، في خطوة قد تعيد رسم خريطة المنافسة في سوق النماذج الصوتية.
النموذج الجديد يدعم 8 لغات ويتميز بقدرته على فهم السياق العاطفي في المحادثات، مع إمكانية تحويل النص إلى كلام طبيعي بلهجات مختلفة، مما يجعله منافساً قوياً لنماذج مثل OpenAI’s Voice Engine وElevenLabs.
ما يميز فوإكسترال هو تصميمه الذي يجمع بين تقنيات تحويل الصوت إلى نص (ASR) والنص إلى صوت (TTS) في نموذج واحد متكامل، مع دقة تصل إلى 98% في التعرف على الكلام المنطوق، حسب اختبارات الشركة.
النموذج متاح للجمهور بموجب ترخيص مفتوح يسمح للتطوير التجاري، مع إمكانية تشغيله محلياً على أجهزة ذات مواصفات متوسطة دون الحاجة إلى اتصال بالإنترنت، وهي ميزة حيوية للشركات التي تبحث عن حلول تحافظ على خصوصية البيانات.
يأتي الإطلاق في وقت تشهد فيه سوق النماذج الصوتية نمواً متسارعاً، متوقعاً أن تصل قيمتها إلى 15 مليار دولار بحلول 2026.
ميسترال، التي حصلت مؤخراً على تمويل بقيمة 600 مليون دولار، تهدف إلى تعزيز مكانتها كبديل أوروبي للعاملين الأمريكيين في مجال الذكاء الاصطناعي، مع التركيز على الشفافية والتحكم المحلي في التكنولوجيا.


اترك تعليقاً