إن تقديم Google Gemini، وهو عبارة عن مجموعة من نماذج اللغات الكبيرة (LLMs) التي تتضمن تقنيات مستوحاة من AlphaGo، يمثل استجابة Google الإستراتيجية لـ ChatGPT. بفضل إمكانات الوسائط المتعددة وإمكانية الوصول إلى بيانات التدريب الشاملة الخاصة بشركة Google من مختلف الخدمات، تهدف Gemini إلى تحدي هيمنة ChatGPT في مجال الذكاء الاصطناعي التوليدي. وتؤكد هذه الخطوة التزام جوجل بابتكار الذكاء الاصطناعي والمنافسة في سوق الذكاء الاصطناعي التوليدي سريع النمو، والذي من المتوقع أن تصل قيمته إلى 1.3 تريليون دولار بحلول عام 2032.
الذكاء الاصطناعي في مكان العمل
أدى إطلاق ChatGPT في نوفمبر 2023 إلى هز شركة Google من أسسها. شكل برنامج الدردشة الآلي الشهير تهديدًا كبيرًا لأعمال الشركة لدرجة أنه اضطر إلى إعلان الرمز الأحمر وبدأ الاستثمار في اللحاق بعربة الذكاء الاصطناعي التوليدية .
لم يؤد هذا الجهد إلى إصدار Google Bard فحسب ، بل أدى أيضًا إلى إصدار Google Gemini .
تم إطلاق Gemini يوم الأربعاء 6 ديسمبر 2023 ، ومع مرور الأشهر، سنتابع رحلتهم - هناك فرصة جدية لأن تتمكن Google من الاستيلاء على تاج الذكاء الاصطناعي الشهير من ChatGPT.
ما هو جوجل الجوزاء؟
Gemini عبارة عن مجموعة من النماذج اللغوية الكبيرة (LLMs) التي تستفيد من تقنيات التدريب المأخوذة من AlphaGo ، بما في ذلك التعلم المعزز والبحث الشجري، والتي لديها القدرة على إزاحة ChatGPT كحل الذكاء الاصطناعي المولد الأكثر هيمنة على هذا الكوكب.
يأتي ذلك بعد أشهر من دمج Google لمختبري Brain وDeepMind AI لإنشاء فريق بحث جديد يسمى Google DeepMind ، وبعد إطلاق Bard والجيل التالي من PaLM 2 LLM.
ومع توقع الباحثين أن قيمة سوق الذكاء الاصطناعي التوليدي ستبلغ 1.3 تريليون دولار بحلول عام 2032، فمن الواضح أن جوجل تبذل قصارى جهدها للاستثمار في الفضاء للحفاظ على مكانتها كشركة رائدة في تطوير الذكاء الاصطناعي.
كل ما نعرفه حتى الآن عن برج الجوزاء
في شهر مايو، أصدر ساندر بيتشاي، الرئيس التنفيذي لشركة Google وAlphabet، تدوينة تتضمن نظرة رفيعة المستوى على LLM ، موضحًا:
"تم إنشاء Gemini من الألف إلى الياء ليكون متعدد الوسائط، وذو كفاءة عالية في تكامل الأدوات وواجهة برمجة التطبيقات (API) وتم تصميمه لتمكين الابتكارات المستقبلية، مثل الذاكرة والتخطيط."
وأشار بيتشاي أيضًا إلى أنه "على الرغم من أننا لا نزال في وقت مبكر، إلا أننا نشهد بالفعل قدرات رائعة متعددة الوسائط لم نشهدها في النماذج السابقة.
"بمجرد ضبطها واختبارها بدقة من أجل السلامة، ستكون Gemini متاحة بأحجام وقدرات مختلفة، تمامًا مثل PaLM 2."
أشارت مقابلة الرئيس التنفيذي لشركة Google DeepMind Demis Hassabis مع Wired إلى أن Gemini "ستجمع بعض نقاط القوة في أنظمة نوع AlphaGo مع القدرات اللغوية المذهلة للنماذج الكبيرة ."
هل سيأخذ الجوزاء التاج من ChatGPT؟
واحدة من أكبر المحادثات حول إصدار Gemini هي ما إذا كان نموذج اللغة لديه ما يلزم لإزاحة ChatGPT، والذي وصل هذا العام إلى أكثر من 100 مليون مستخدم نشط شهريًا .
في البداية، كانت Google تستخدم قدرة Gemini على إنشاء نصوص وصور لتمييزها عن GPT4، ولكن في 25 سبتمبر 2023، أعلنت OpenAI أن المستخدمين سيكونون قادرين على إدخال استعلامات الصوت والصورة في ChatGPT.
الآن، بعد أن قامت OpenAI بتجربة نهج نموذج متعدد الوسائط وربطت ChatGPT بالإنترنت، ربما يكون التمييز الأكثر تهديدًا بين الاثنين هو مجموعة Google الواسعة من بيانات التدريب الخاصة. يستطيع Google Gemini معالجة البيانات المأخوذة عبر الخدمات، بما في ذلك بحث Google وYouTube وكتب Google والباحث العلمي من Google.
يمكن أن يؤدي استخدام هذه البيانات الخاصة في تدريب نماذج جيميني إلى ميزة مميزة في تعقيد الرؤى والاستدلالات التي يمكن أن تأخذها من مجموعة البيانات. وهذا صحيح بشكل خاص إذا كانت التقارير المبكرة التي تفيد بأن Gemini تم تدريبه على ضعف عدد الرموز المميزة لـ GPT4 صحيحة.
بالإضافة إلى ذلك، لا يمكن الاستهانة بالشراكة بين فريقي Google DeepMind وBrain هذا العام، حيث إنها تضع OpenAI وجهاً لوجه مع فريق من الباحثين العالميين في مجال الذكاء الاصطناعي، بما في ذلك المؤسس المشارك لشركة Google سيرجي برين وكبار مسؤولي الذكاء الاصطناعي في DeepMind. العالم وخبير التعلم الآلي بول بارهام.
هذا فريق من ذوي الخبرة ولديه فهم عميق لكيفية تطبيق تقنيات مثل التعلم المعزز والبحث الشجري لإنشاء برامج ذكاء اصطناعي يمكنها جمع التعليقات وتحسين حل المشكلات بمرور الوقت، والتي استخدمها فريق DeepMind لتعليم AlphaGo للتغلب على Go. بطل العالم 2016.
اقرا ايضا:Google Gemini AI: كل ما نعرفه حتى الآن من هنا
سباق التسلح بالذكاء الاصطناعي
إن مزيج Gemini من القدرات متعددة الوسائط، واستخدام التعلم المعزز، وإمكانيات إنشاء النصوص والصور، والبيانات المملوكة لشركة Google، كلها مكونات يحتاجها Gemini للتفوق على GPT-4.
تعد بيانات التدريب هي العامل الرئيسي الذي يميزه، ففي نهاية المطاف، سيتم تحديد المؤسسة التي تفوز بسباق التسلح في LLM إلى حد كبير بناءً على من يقوم بتدريب نماذجها على أكبر وأغنى مجموعة بيانات.
ومع ذلك، مع التقارير التي تفيد بأن OpenAI تعمل على جيل جديد من LLM متعدد الوسائط يسمى Gobi، لا يمكننا شطب عملاق الذكاء الاصطناعي التوليدي حتى الآن. والسؤال الآن هو: من الذي ينفذ الذكاء الاصطناعي متعدد الوسائط بشكل أفضل؟
مرحبا بكم في جريدة وموقع كلام فور يو