هل هذا هو الفصل التالي من الذكاء الاصطناعي؟ تفتح Google الأبواب أمام إجابتها على ChatGPT من OpenAI - ستكون فترة رائعة لمشاهدة هذين العملاقين التكنولوجيين يبتكران ضد بعضهما البعض.
الدماغ الرقمي
أعلنت Google اليوم عن إطلاق نموذج الذكاء الاصطناعي الجديد متعدد الوسائط المسمى Gemini ، المصمم لفهم النصوص والصور والفيديو والصوت والتعليمات البرمجية والتعرف عليها.
كتب الرئيس التنفيذي والمؤسس المشارك لشركة Google DeepMind Demis Hassabis في منشور المدونة الرسمي: "Gemini هو نتيجة لجهود تعاونية واسعة النطاق بذلتها فرق عبر Google، بما في ذلك زملائنا في Google Research".
كتب هاسابيس: "لقد تم بناؤه من الألف إلى الياء ليكون متعدد الوسائط، مما يعني أنه يمكنه التعميم والفهم بسلاسة والعمل عبر ودمج أنواع مختلفة من المعلومات بما في ذلك النص والرمز والصوت والصورة والفيديو".
جوجل تعلن عن برج الجوزاء
اقرأ المزيد: يمثل Gemini AI من Google تهديدًا خطيرًا لـ ChatGPT - وإليك السبب
هناك ثلاثة إصدارات مؤكدة من النموذج: Gemini Ultra، وGemini Pro، وGemini Nano، وجميعها فريدة من نوعها. يعد Gemini Ultra هو الأكبر، في حين تم تصميم Gemini Pro للتوسع عبر مجموعة من المهام، وGemini Nano هو النموذج الأكثر كفاءة للمهام الموجودة على الجهاز (مما يجعله مثاليًا للاستخدام على الأجهزة المحمولة).
الجوزاء - ثلاثة أنواع
اعتبارًا من اليوم، تمت إضافة Gemini إلى برنامج Bard chatbot الخاص بشركة Google، وستتم إضافة Gemini Nano إلى Pixel 8 Pro لتشغيل إمكانيات التلخيص والرد الذكي في ديسمبر.
ستتم إضافة نماذج Gemini في النهاية إلى منتجات أخرى مثل البحث والإعلانات و Chrome .
إذن، ما مدى جودة Google Gemini؟
ويأتي هذا الإصدار بعد شهر واحد فقط من إعلان OpenAI عن إطلاق GPT-4 Turbo ونموذجها المتعدد الوسائط، GPT-4v، الذي يمكنه فهم مدخلات الصور.
في حين أنه من السابق لأوانه استنتاج أن Gemini قد تفوقت على OpenAI وGPT-4، فمن المؤكد أن الأمر يبدو كذلك. في مقابلة مع The Verge ، أكد هاسيبيس أن Google اختبرت Gemini ضد GPT-4 عبر 32 معيارًا ووجدت أن Gemini كان "متقدمًا بشكل كبير" في 30 منها.
أحد إنجازات Gemini البارزة حتى الآن هو أنه أصبح النموذج الأول الذي يتفوق على الخبراء البشريين في فهم اللغة متعدد المهام (MMLU)، محققًا درجة 90.0%.
وفي الوقت نفسه، سجلت Gemini Ultra نقاطًا أعلى بقليل من GPT-4 في مجموعة من المعايير، بما في ذلك:
مقاعد البدلاء الكبيرة (83.6% مقابل 83.1%)،
الانخفاض (82.4% مقابل 80.9%)
GSM8K (94.4% مقابل 92.0%)،
الرياضيات (53.2% مقابل 52.9%)،
HumanEval (74.4% مقابل 67.0%).
يشير هذا إلى أن Gemini Ultra يتمتع بتفوق طفيف على GPT-4 في التفكير متعدد الخطوات، وفهم القراءة، والتلاعب الحسابي الأساسي، وتوليد كود بايثون .
اقرأ ايضا:معضلة الذكاء الاصطناعي الأخلاقية: تحقيق التوازن بين التقدم والمسؤولية من هنا
معايير الجوزاء
بالإضافة إلى ذلك، تدعي Google أن Gemini Ultra يتفوق أيضًا على GPT-4 في الأداء متعدد الوسائط، وفهم الصور الطبيعية، والتعرف الضوئي على الحروف للصور الطبيعية، وفهم المستندات، وفهم الرسوم البيانية، والتفكير الرياضي في السياقات المرئية.
كما حققت Gemini درجة متقدمة في معيار MMMU، الذي يقيس الأداء في المهام متعددة الوسائط.
ولتحقيق هذا الأداء، تم تدريب Gemini مسبقًا على طرائق مختلفة ثم تم ضبطها بدقة لزيادة قدرة النموذج على الفهم والتفكير بشأن أنواع مختلفة من المدخلات بشكل أفضل من أي ماجستير في إدارة الأعمال حتى الآن.
الخاتمه
مع فتح الأبواب الآن، سنستكشف برج الجوزاء خلال الأسابيع المقبلة ونرى كيف تتعارض الادعاءات مع الواقع.
الأمر المثير هو كيفية توصيل Gemini بمجموعة خدمات Google - هل سيكون Google Home أسهل في الاستخدام (باستثناء الهلوسة الغريبة) عندما يكون بإمكانك إجراء المزيد من المحادثات غير الرسمية مع "منزلك"؟ هل ستكون صفحات محرك البحث مختلفة جذريًا؟ هل ستكون الخدمات مثل Gmail وخرائط Google مختلفة تمامًا، مع وجود الذكاء الاصطناعي بينك وبين المنتج؟
عند النظر في أداء Gemini في هذه المعايير جنبًا إلى جنب مع خطط دمج LLM مع المنتجات الشائعة مثل Chrome وSearch على الطريق نحو تجربة إنشاء البحث، فمن الواضح أن OpenAI لديها منافس جدي يجب مواجهته.
مرحبا بكم في جريدة وموقع كلام فور يو