Elon Musk AI-cége nagy ugrást tett - veszélyben az OpenAI dominanciája?!

Általános hírek Hírek PC PC hírek Tech Tech Hírek 2024. augusztus 16. péntek

0 401 Views

TECH HÍREK – Elon Musk az OpenAI hegemóniáját vette célba a legújabb Grok 2 AI modell kiadásával.

Elon Musk AI cége, az xAI végre kiadta legújabb generációs AI modelljét, a Grok 2-t. Az xAI, valamint az alapító Tesla és X tulajdonosi részesedése lehetővé tette a vállalat számára, hogy keresletet generáljon termékei iránt, és felhasználja a mesterséges intelligencia modellek betanításához szükséges drága számítástechnikai erőforrásokat. A mai bejelentés Musk év eleji megjegyzéseit követi, amelyekben a modell frissítését ígérte hamarosan.

A Grok mellett az Amazon által támogatott Anthropic Claude, a Microsoft által támogatott OpenAI ChatGPT, a Facebook-tulajdonos Meta Llama és a Google Gemini is a világ vezető AI-szoftvertermékei közé tartozik. Ezek mindegyike kínál AI funkciókat általános fogyasztói és vállalati felhasználási esetekre, és a Grok 2 kiadása mindkét szempontot lefedik.

Elon Musk Grok 2 és a Grok 2 Mini modellje jelentős előnnyel bír az OpenAI GPT 4 és az Amazon Claude előtt?!

Az xAI legújabb Grok kiadása a Grok 2 korai előzetesét és egy mini Grok 2 modellt tartalmaz. Mindkettő elérhető lesz a felhasználók számára Musk X közösségi médiaplatformján. A Grok 2-t a UC Berkley’s Large Model Systems Organization (LMSYS) AI benchmarkján tesztelték, és kiderült, hogy majdnem elérte az OpenAI GPT-4o teljesítményét.

Az LMSYS szerint a Grok 2 a 2. legjobb helyezést érte el matematikában és kódolásban, valamint a harmadik helyen végzett a kemény felszólításokra való reagálás képességében, ami az összesített ranglistán a harmadik helyet eredményezte. A Grok 2 előtt a ChatGPT 4.0 és a Google Gemini 1.5 Pro áll.

Az xAI saját adatai szerint a Grok 2 megelőzi a GPT 4 Turbo-t, és kis mértékben lemarad a GPT 4o-tól.

Az OpenAI ChatGPT 4o azonban még az xAI adatai alapján is az AI teljesítményének királya. Köszönhetően az 1,314-es LMSYS ELO-értékelésének. Az xAI korai Grok 2 verziója viszont 1,281-es értékelést kapott, míg a Gemini 1.5 Pro 1,297-es átlagpontszámmal rendelkezik.

Ami a chatbot teljesítményét illeti, a Grok 2 lemarad a Gemini 1.5 Pro-tól a „nyerési arány” tekintetében, amely a jobbra értékelt válaszok százalékos arányát méri. A Google termékével szembeni aránya 48%, és az xAI adatai nem mutatnak hasonló adatokat az OpenAI ChatGPT 4o modelljére vonatkozóan, amely lehetővé teszi a felhasználók számára, hogy képeket töltsenek fel, és megkérjék az AI-t, hogy azok alapján válaszokat generáljon.

Mi a helyzet a tényszerűséggel?

A tényszerűség javítása a másik kulcsfontosságú terület, ahol az xAI azt állítja, hogy javította a Grok 2 teljesítményét. A korai AI-modelleket bírálták a tényszerűség helytelensége miatt, és a cég belső „AI Tutorai” 62,9%-os és 59,6%-os tényszerűségi arányt adtak a Grok 2 és Grok 2 mini modelleknek – ami jelentős javulást jelent az előző iteráció 50%-os arányához képest.

A Grok 2 fejlett képességekkel rendelkezik mind a szöveg-, mind a látásmegértés terén – állítja az xAI, hozzátéve, hogy a modell az X-en elérhető adatokat használja. Más AI-termékekhez hasonlóan a Grok 2 mini is az általános fogyasztói felhasználásra irányul. Olyan funkciókat támogat, mint az írás, a kódolás vagy a szöveges válaszok generálása.

Az xAI megosztja, hogy a Grok 2 és a Grok 2 mini e hónap végére lesz elérhető a fejlesztők számára a termékeinek vállalati felhasználási eseteihez. Az API „több régióra kiterjedő következtetési telepítéseket kínál az alacsony késleltetésű hozzáféréshez az egész világon”, valamint kötelező többfaktoros hitelesítést, adatelemzést a számlázáshoz, forgalomelemzést és a házon belüli üzleti rendszerekkel való integrációt.

Forrás: X

Woah, another exciting update from Chatbot Arena❤️‍🔥

The results for @xAI’s sus-column-r (Grok 2 early version) are now public**!

With over 12,000 community votes, sus-column-r has secured the #3 spot on the overall leaderboard, even matching GPT-4o! It excels in Coding (#2),… https://t.co/gqSWSwYN0z pic.twitter.com/j9UYDBYNt4

— lmsys.org (@lmsysorg) August 14, 2024