Megérkezett DarkBERT, a ChatGPT dark weben képzett gonosz ikertestvére!?

TECH HÍREK – DarkBERT szinte pontosan ugyanolyan, mint bármelyik másik „friendly neighborhood AI”, de a nukleáris indítókódokat azért nem kellene rábízni.

 

 

Ha aggódtál volna, hogy a generatív mesterséges intelligenciák jelenlegi iterációja túl kedves és empatikus, akkor DarkBERT éppen neked való. Ezt az új nyelvi modellt ugyanis az internet legrosszabb részén, a „sötét weben” (Dark Web) képeztek ki.

Az eddigi talán legviccesebb nevet kapott DarkBERT egy olyan generatív AI, amelyet kizárólag a Dark Web-en képeztek ki, hogy összehasonlítsák egy hagyományos megfelelőjével. A mögötte álló csapat – amely eredményeiről egy előzetesen megjelent, de még szakértői értékelésre váró tanulmányban számol be – azt szerette volna megérteni, hogy a sötét web adathalmazként való felhasználása jobb kontextust ad-e az AI-nak az ott használt nyelvről, és ezáltal értékesebbé teszi-e azt azok számára, akik a sötét webet kutatás céljából vagy a kiberbűnözés elleni bűnüldöző szervek számára szeretnék átfésülni.

Emellett egy olyan helyet is alaposan átfésült, ahová a legtöbb ember nem igazán akar eljutni, és indexelte a különböző tartományokat, amiért mindenképp jár a DarkBERT csapatának a köszönet.

A Dark Web az internetnek egy olyan területe, amelyet a Google és más keresőmotorok figyelmen kívül hagynak. Így az emberek nagy többsége nem látogat el oda. Csak a Tor (vagy hasonló) nevű speciális szoftver segítségével érhető el. Mint ilyen, elég jó hírnevet szerzett az ott zajló eseményeknek. A városi legendák kínzókamrákról, bérgyilkosokról és mindenféle szörnyű bűncselekményekről szólnak. Ám az igazság az, hogy a legtöbbjük csak átverés és egyéb módok az adatlopásra a böngésző biztonsága nélkül, amit mindannyian nagyon természetesnek veszünk. Mégis, a Dark Webet állítólag a kiberbűnözési hálózatok használják névtelenül beszélgetésre. Ezért rendkívül fontos célpontot jelent a bűnüldöző szervek számára.

Egy dél-koreai csapat egy nyelvi modellt kapcsolt be, hogy a Tor segítségével átfésülje a Dark Webet. Ezután a talált nyers adatokat visszaadja, létrehozva egy olyan modellt, amely jobban értelmezni tudja az ott használt nyelvet. Miután elkészült, összehasonlították, hogyan teljesített a meglévő modellekkel, amelyeket a kutatók korábban létrehoztak. Köztük a RoBERTa és a BERT modellekkel.

A preprintben bemutatott eredmények azt mutatták, hogy a DarkBERT minden adathalmazban felülmúlta a többieket, de közel állt hozzájuk.

Mivel az összes mesterséges intelligencia hasonló keretrendszerből származott, várható volt, hogy hasonló teljesítményt nyújtanak, de a DarkBERT kifejezetten a sötét weben jeleskedett.

Mire fogják használni a DarkBERT-et? Remélhetőleg nem kapja meg a nukleáris indítókódokat. Ám a csapat arra számít, hogy hatékony eszköz lesz a Dark Web kiberbiztonsági fenyegetések utáni átvizsgálásában. Valamint a fórumok figyelésében a tiltott tevékenységek azonosítása érdekében. Reméljük, hogy ez nem ad ötleteket az OpenAI-nak.

Forrás: arXiv, Tom’s Hardware

Spread the love
Avatar photo
"Historian by profession, gamer since historical times."

Kiemelt partnerünk: www.konzolkirály.hu