أعلنت شركة علي بابا الصينية عن إطلاق مجموعة نماذج ذكاء اصطناعي جديدة تحمل اسم Qwen2.5-VL، والتي تتميز بقدرات متقدمة في تحليل النصوص والصور، بما في ذلك:
- فهم مقاطع الفيديو الطويلة.
- تحليل المستندات والرسوم البيانية والجداول.
- التعامل مع بيانات من الفواتير والنماذج الممسوحة ضوئيًا.
- التعرف على الشخصيات والأعمال الفنية من الأفلام والمسلسلات.
تفوق على النماذج العالمية
وفقًا لاختبارات الأداء التي أجراها فريق Qwen، أظهر النموذج الرئيسي Qwen2.5-VL-72B تفوقًا على نماذج عالمية رائدة مثل:
- GPT-4o من OpenAI.
- Claude 3.5 Sonnet من Anthropic.
- Gemini 2.0 Flash من Google.
يتمثل هذا التفوق في مهام تتعلق بفهم الفيديو، العمليات الحسابية، وتحليل البيانات من المستندات.
إتاحة النماذج والتراخيص
- يمكن للمطورين تجربة النماذج عبر تطبيق Qwen Chat من علي بابا.
- تتوفر أيضًا للتنزيل على منصة Hugging Face، مما يسهل اختبارها في مشاريع التطوير.
- تتضمن السلسلة أحجامًا مختلفة، مثل Qwen2.5-VL-3B و Qwen2.5-VL-7B بترخيص متساهل.
- يخضع النموذج الأكبر Qwen2.5-VL-72B لترخيص خاص يلزم الشركات الكبرى (100 مليون مستخدم نشط شهريًا) بالحصول على موافقة خاصة لاستخدامه تجاريًا.
مزايا التحكم الذكي في الأجهزة
يُعد التحكم في التطبيقات والأجهزة من بين أكثر المزايا المبتكرة للنموذج، وقد استعرض خبراء تجربة عملية يظهر فيها النموذج وهو يقوم بحجز رحلة طيران إلى بكين عبر تطبيق “بوكينج”.
ورغم هذه الإمكانيات، أشارت اختبارات الأداء إلى تحديات في التعامل مع بيئات حاسوبية معقدة، حيث حصل النموذج على نتائج منخفضة في اختبارات OSWorld.
علي بابا في سباق الذكاء الاصطناعي
مع إطلاق هذه السلسلة المتقدمة من نماذج الذكاء الاصطناعي، تواصل علي بابا تعزيز مكانتها كمنافس رئيسي في السباق العالمي للذكاء الاصطناعي، مع تركيزها على تقديم حلول مبتكرة تخدم المستخدمين والمطورين، إلى جانب منافسة أسماء كبرى مثل OpenAI وGoogle.