TECH HÍREK – Az xAI, Elon Musk mesterséges intelligenciára kihegyezett cége bemutatta a legújabb nagy nyelvi modelljét (large language model = LLM).
Egy élő adásban (ami lent megtekinthető) bemutatták a Grok 3-at, ami a legdrágább szinten előfizető Twitter-felhasználóknak elérhető, ugyanis a Premium+ kategóriában rendelkezésre áll ez a modell. Miközben a mesterséges intelligenciával foglalkozó vállalat továbbra is az új LLM képességeit a kategóriájában legjobbként hirdeti, egyes szakértők kritikus hiányosságokra mutatnak rá a kiadott benchmarkokban. Musk bejelentette, hogy a régebbi Grok 2 LLM néhány hónapon belül nyílt forráskódúvá válik.
Az xAI igyekezett megjegyezni, hogy a Grok 3 LLM matematikai, tudományos és kódolási benchmarkokban veri az összes többi alapmodell nyilvánosan közzétett verzióját, beleértve a DeepSeek-V3-at és a GPT-4o-t is. Mi több, az LLM az Arena benchmarkon példátlan, 1402-es pontszámot ért el. Eközben a Manifold Markets fogadási szerződése, miszerint a Grok 3 a világ legerősebb mesterséges intelligenciája, most várhatóan túlnomó többségben igeneket fog kapni. Hozzá kell tenni viszont, hogy az igenek győzelmének valószínűsége a hétfő késő esti 91 százalékról 78%-ra csökkent. Ebben szerepe lehet az xAI Grok 3 körül kialakuló kritikus kommenteknek is.
Zihan Wang (aki korábban történetesen a DeepSeeknél is dolgozott) megmutatott a Grok 3-nak egy képet, amelyen két különböző méretű vasgolyó lógott a pisai ferde toronyról különböző magasságban, majd megkérdezte, melyik golyó fog előbb földet érni. A logikus válasz csak az lehetett, amelyik nehezebb és közelebb van a földhöz, de az LLM azonban azt válaszolta, hogy mindkét golyó egyszerre érne földet. Mások azt kérdőjelezik meg, hogy az xAI miért nem tette közzé a Grok 3 pontszámát a FrontierMath, Arc-AGI vagy HLE benchmarkokon.
Emiatt pedig meg lehet kérdőjelezni, hogy tényleg ez-e a legjobb LLM a kategóriájában. Eközben a Bloomberg nemrég arról számolt be, hogy az xAI tárgyalásokat folytat a meglévő befektetőkkel, hogy akár 10 milliárd dollárt is felvegyen egy új finanszírozási körben, amely 75 milliárd dollárra értékelné a startupot. A legutóbbi ilyen finanszírozási körben az xAI 6 milliárd dollárt gyűjtött 40 milliárd dolláros értékelés mellett. Az xAI-tól Guodang Zhang megerősítette, hogy a Grok 3-at 100 ezer GPU-n képezték ki.
Alá is kéne támasztani az állítást, nemde, Elon?
Forrás: WCCFTech
GROK 3: SOLVING PHYSICS, GAMES, AND THE UNIVERSE
Full presentation and demo of xAI’s latest model
0:00 xAI’s mission: Understand the universe
1:20 Team presentation
2:01 Grok means to profoundly understand
2:29 From Grok 2 to Grok 3
6:30 Grok 3 benchmarks
9:07 Grok 3 improves… https://t.co/7qbB6O16Yb pic.twitter.com/BomGwAOa1I— Mario Nawfal (@MarioNawfal) February 18, 2025