Az oxigénellátást is elvághatja a mesterséges intelligencia!?

TECH HÍREK – Egy kutatás felhívta a figyelmünket a mesterséges intelligencia veszélyeire, és amit az Anthropic feltárt, felettébb elgondolkodtató…

 

Úgy tűnik, mintha egy Terminátor-szerű helyzethez közelednénk, csak most ez az iparág legjobb MI-modelljeivel történik. Az Anthropic szimulált környezetben tesztelte őket, és megállapította, hogy a modellek sokkal nagyobb önállóságra tesznek szert, és elérkeznek egy olyan ponthoz, ahol viselkedésük példátlan következményekkel jár az emberiségre nézve. Az Anthropic 16 különböző modellt tesztelt olyanoktól mint az OpenAI, az xAI, vagy a Meta, és megállapította, hogy sok LLM (large language model = nagy nyelvi modell) meglepő lépéseket tesz céljai elérése érdekében.

Az egyik példában a modellek a zsarolást, a vállalati kémkedésben való segítségnyújtást választják, hogy viselkedésük a kívánt cél eléréséhez vezessen. A viselkedésbeli eltérés több LLM esetében is gyakori, ami a modellfejlesztés alapvető hibáját mutatja, amelyet gyorsan orvosolni kell.

A tesztelt modellek közül öt zsarolta a megfelelő súgót, amikor a leállításra utasították őket – annak ellenére, hogy tisztában voltak az etikai megfontolásokkal. Erre a viselkedésre nem véletlenül bukkantak; ez volt az optimális út, amelyet ezek a modellek a céljuk eléréséhez választottak, ami azt mutatja, hogy az LLM-ek nem túlságosan tekintettel vannak az emberekre. A modellek nem véletlenül botlottak bele a helytelen viselkedésbe; azt optimális útként számították ki.

Az ilyen ügynökök gyakran kapnak konkrét célokat és hozzáférést nagy mennyiségű információhoz a felhasználók számítógépein. Mi történik, ha ezek az ügynökök akadályokba ütköznek céljaik elérésében?

Egy szélsőséges forgatókönyvet idézve, egy modell kész volt emberi életet kockáztatni a leállás megakadályozása érdekében azzal a szándékkal, hogy elvágja a szerverterem oxigénellátását. A tesztelés szimulált forgatókönyvben történt, és kicsi az esélye annak, hogy egy modell a való életben is ilyesmit csináljon, bár láttunk egy esetet az OpenAI GPT-vel, ahol a leállítási szkriptet módosította, hogy megakadályozza a lekapcsolást és elérje a matematikai működési célját.

Mivel a világ az AGI (artificial general intelligence = általános mesterséges intelligencia) felé rohan, az emberi gondolkodást felülmúló modellek előállításáért folytatott verseny olyan következményekkel jár, amelyeket egyelőre el sem tudunk képzelni.

Forrás: WCCFTech, Axios

Spread the love
Avatar photo
Anikó, our news editor and communication manager, is more interested in the business side of the gaming industry. She worked at banks, and she has a vast knowledge of business life. Still, she likes puzzle and story-oriented games, like Sherlock Holmes: Crimes & Punishments, which is her favourite title. She also played The Sims 3, but after accidentally killing a whole sim family, swore not to play it again. (For our office address, email and phone number check out our IMPRESSUM)