كشف الملياردير الأمريكي إيلون ماسك، مؤسس شركة الذكاء الاصطناعي XAI، الستار عن ميزة جديدة لبرنامج Grok، حيث أصبح برنامج المحادثة بالذكاء الاصطناعي الداخلي الآن قادرًا على فهم الصور ما يسمح له بمعالجة وتحليل المحتوى في الصورة.
الميزة الجديدة لبرنامج Grok
ومن المتوقع أن تسمح هذا الميزة أيضًا بتحميل صورة وطرح أسئلة على الذكاء الاصطناعي بناءً عليها، جاء ذلك بعدما أصدرت xAI نموذج الذكاء الاصطناعي Grok-2 في أغسطس، والذى سيدعم قريبًا طرقًا مختلفة.
وقال “ماسك”، أن الميزة الجديدة في برنامج Grok تملك القدرة الجديدة على فهم الصور لبرنامج المحادثة بالذكاء الاصطناعي، بما يسمح فهم الصور، المعروف أيضًا باسم الرؤية الحاسوبية، لنظام الذكاء الاصطناعي برؤية ومعالجة البيانات المرئية داخل صورة أو مقطع فيديو، فقد أصبحت هذه القدرة متاحة فقط للصور الثابتة.
تحليل أعمق للصورة
ومن المقرر أن تعطي هذه الميزة القدرة لبرنامج المحادثة بالذكاء الاصطناعي من إجراء تحليل أعمق للصورة وحتى شرح معنى نكتة بصرية، فقد شارك الملياردير مثالاً، وطلب من Grok شرح نكتة في صورة، ونجح الذكاء الاصطناعي في شرح مقدمة النكتة، والمزحة البصرية فيها.
وبالرغم من ذلك فإن الرؤية الحاسوبية ليست قدرة جديدة لأنظمة الذكاء الاصطناعي، وتوفر كل نماذج الذكاء الاصطناعي الرئيسية هذه الميزة تقريبًا بما في ذلك Gemini وChatGPT وCopilot وClaude ، مما يكشف أن هناك العديد من الميزات الأساسية التي لا تزال مفقودة في Grok.
تجدر الإشارة إلى أن شركة XAI التابعة لإيلون ماسك أصدرت في وقت سابق نموذج Grok AI كواجهة برمجة تطبيقات، على ان يتم إطلاق نموذج Grok-2 AI الشهر المقبل، وفي أغسطس، أصدرت شركة xAI نموذجي Grok-2 و Grok-2 Mini AI، كترقية للإصدار التجريبي من نموذج اللغة الكبيرة (LLM).