TECH HÍREK – A mesterséges intelligencia-modellek edzésére könyveket is alkalmazott Mark Zuckerberg cége, de nem éppen legális formában fért hozzá a Meta a tartalmakhoz…
Egy szerzői jogi eljárás zajlik a Meta ellen, amely a szerzők munkáinak a nagy nyelvi modellek (large language model = LLM) képzéséhez való felhasználása miatt indult. Több tucatnyi, állítólag a Meta alkalmazottai közötti emailben arról van szó, hogy a vállalat MI-modelleinek edzése érdekében hatalmas mennyiségben kalózkodtak, majd a letöltött torrentek továbbítva lettek (seedelés). Januárban bírósági dokumentumokból derült ki, hogy a Meta egy nagy fájlmegosztó adatbázisból, a LibGenből szerezte be az MI-tanulási adatokat. Itt a fizetős fal mögé tett hírektől és tudományos cikkektől kezdve a könyvekig eléggé sok dolgot lehetett megtalálni.
A vád szerint a Meta több mint 80 terabájtnyi adatot töltött le a LibGenből és egy másik, Z-Library nevű „árnyékkönyvtárból”. 80 TB adat majdnem 80 ezer (!) gigabájt! Ez rengeteg. Ez akkora méretű kalózkodás, amire eddig talán soha nem volt példa. A céges emailek írásban rögzítették a Meta azon döntését, hogy engedély nélkül átveszi és felhasználja a szerzői joggal védett műveket, amelyekről a cég tudta, hogy kalózok, az egyértelmű etikai aggályok ellenére. Az egyik emailben, amit bizonyítékként használnak, egy állítólagos Meta-alkalmazott hiábavalóan azt tanácsolja, hogy a kalózkodott anyagok használata túl kellene, hogy lépje az etikai küszöbüket, majd hozzátette, hogy a LibGen és az ehhez hasonló adatbázisok alapvetően olyanok, mint a PirateBay vagy valami ehhez hasonló, olyan tartalmakat terjesztenek, amelyek szerzői jogvédelem alatt állnak, és megsértik azokat.
Sokszor megemlítik az emailek, hogy a LibGen használata aggályos. A Meta egyik kutatója VPN-használatot javasolt, hogy csak így férjenek hozzá ahhoz, és azzal is poénkodott, hogy nem tűnik elfogadhatónak, hogy egy vállalati laptopról torrentezzenek. A Meta emiatt lopakodó üzemmódra váltott, elrejtve a tevékenységet azzal, hogy a torrenteket csak a Facebook hivatalos szerverein kívül töltené le és seedelné azokat. Az ügyészség szerint ezek a levelezések arra utalnak, hogy a Meta vezetői Mark Zuckerbergig bezárólag tudtak arról, hogy a vállalatnál kalózkodott anyagokat használtak az MI-modellek képzéséhez, illetve kiderült, hogy a Meta alkalmazottai szerint az OpenAI is a LibGent használta a saját modelljeihez, és egyfajta fegyverkezési versenynek állították be azt, hogy végül ők is ehhez folyamodtak.
Ha bűnösnek ítélik a Metát, mekkora bírságot kell majd fizetniük? És az Internet Archive (archive.org) ezek után miért nem engedélyezett könyvek kölcsönzésére digitális könyvtárként?
Forrás: PCGamer, Ars Technica, Wired, Court Listener