Grok 3: valóban a világ legokosabb mesterséges intelligencia-modellje? [VIDEO]

Általános hírek Hírek Tech Tech Hírek 2025. február 19. szerda

0 535 Views

TECH HÍREK – Az xAI, Elon Musk mesterséges intelligenciára kihegyezett cége bemutatta a legújabb nagy nyelvi modelljét (large language model = LLM).

Egy élő adásban (ami lent megtekinthető) bemutatták a Grok 3-at, ami a legdrágább szinten előfizető Twitter-felhasználóknak elérhető, ugyanis a Premium+ kategóriában rendelkezésre áll ez a modell. Miközben a mesterséges intelligenciával foglalkozó vállalat továbbra is az új LLM képességeit a kategóriájában legjobbként hirdeti, egyes szakértők kritikus hiányosságokra mutatnak rá a kiadott benchmarkokban. Musk bejelentette, hogy a régebbi Grok 2 LLM néhány hónapon belül nyílt forráskódúvá válik.

Az xAI igyekezett megjegyezni, hogy a Grok 3 LLM matematikai, tudományos és kódolási benchmarkokban veri az összes többi alapmodell nyilvánosan közzétett verzióját, beleértve a DeepSeek-V3-at és a GPT-4o-t is. Mi több, az LLM az Arena benchmarkon példátlan, 1402-es pontszámot ért el. Eközben a Manifold Markets fogadási szerződése, miszerint a Grok 3 a világ legerősebb mesterséges intelligenciája, most várhatóan túlnomó többségben igeneket fog kapni. Hozzá kell tenni viszont, hogy az igenek győzelmének valószínűsége a hétfő késő esti 91 százalékról 78%-ra csökkent. Ebben szerepe lehet az xAI Grok 3 körül kialakuló kritikus kommenteknek is.

Zihan Wang (aki korábban történetesen a DeepSeeknél is dolgozott) megmutatott a Grok 3-nak egy képet, amelyen két különböző méretű vasgolyó lógott a pisai ferde toronyról különböző magasságban, majd megkérdezte, melyik golyó fog előbb földet érni. A logikus válasz csak az lehetett, amelyik nehezebb és közelebb van a földhöz, de az LLM azonban azt válaszolta, hogy mindkét golyó egyszerre érne földet. Mások azt kérdőjelezik meg, hogy az xAI miért nem tette közzé a Grok 3 pontszámát a FrontierMath, Arc-AGI vagy HLE benchmarkokon.

Emiatt pedig meg lehet kérdőjelezni, hogy tényleg ez-e a legjobb LLM a kategóriájában. Eközben a Bloomberg nemrég arról számolt be, hogy az xAI tárgyalásokat folytat a meglévő befektetőkkel, hogy akár 10 milliárd dollárt is felvegyen egy új finanszírozási körben, amely 75 milliárd dollárra értékelné a startupot. A legutóbbi ilyen finanszírozási körben az xAI 6 milliárd dollárt gyűjtött 40 milliárd dolláros értékelés mellett. Az xAI-tól Guodang Zhang megerősítette, hogy a Grok 3-at 100 ezer GPU-n képezték ki.

Alá is kéne támasztani az állítást, nemde, Elon?

Forrás: WCCFTech

GROK 3: SOLVING PHYSICS, GAMES, AND THE UNIVERSE

Full presentation and demo of xAI’s latest model

0:00 xAI’s mission: Understand the universe
1:20 Team presentation
2:01 Grok means to profoundly understand
2:29 From Grok 2 to Grok 3
6:30 Grok 3 benchmarks
9:07 Grok 3 improves… https://t.co/7qbB6O16Yb pic.twitter.com/BomGwAOa1I

— Mario Nawfal (@MarioNawfal) February 18, 2025

Spread the love

Angyal Anikó

Anikó, our news editor and communication manager, is more interested in the business side of the gaming industry. She worked at banks, and she has a vast knowledge of business life. Still, she likes puzzle and story-oriented games, like Sherlock Holmes: Crimes & Punishments, which is her favourite title. She also played The Sims 3, but after accidentally killing a whole sim family, swore not to play it again. (For our office address, email and phone number check out our IMPRESSUM)