{"id":144834,"date":"2025-02-08T23:31:25","date_gmt":"2025-02-08T22:31:25","guid":{"rendered":"https:\/\/thegeek.hu\/?p=144834"},"modified":"2025-02-08T23:31:25","modified_gmt":"2025-02-08T22:31:25","slug":"tobb-terabajtnyi-konyvet-warezolt-le-a-meta","status":"publish","type":"post","link":"https:\/\/thegeek.hu\/2025\/02\/08\/tobb-terabajtnyi-konyvet-warezolt-le-a-meta\/","title":{"rendered":"T\u00f6bb terab\u00e1jtnyi k\u00f6nyvet warezolt le a Meta?!"},"content":{"rendered":"
<\/p>\n
Egy szerz\u0151i jogi elj\u00e1r\u00e1s zajlik a Meta ellen, amely a szerz\u0151k munk\u00e1inak a nagy nyelvi modellek (large language model = LLM) k\u00e9pz\u00e9s\u00e9hez val\u00f3 felhaszn\u00e1l\u00e1sa miatt indult. T\u00f6bb tucatnyi, \u00e1ll\u00edt\u00f3lag a Meta alkalmazottai k\u00f6z\u00f6tti emailben arr\u00f3l van sz\u00f3, hogy a v\u00e1llalat MI-modelleinek edz\u00e9se \u00e9rdek\u00e9ben hatalmas mennyis\u00e9gben kal\u00f3zkodtak, majd a let\u00f6lt\u00f6tt torrentek tov\u00e1bb\u00edtva lettek (seedel\u00e9s). Janu\u00e1rban b\u00edr\u00f3s\u00e1gi dokumentumokb\u00f3l der\u00fclt ki, hogy a Meta egy nagy f\u00e1jlmegoszt\u00f3 adatb\u00e1zisb\u00f3l, a LibGenb\u0151l szerezte be az MI-tanul\u00e1si adatokat. Itt a fizet\u0151s fal m\u00f6g\u00e9 tett h\u00edrekt\u0151l \u00e9s tudom\u00e1nyos cikkekt\u0151l kezdve a k\u00f6nyvekig el\u00e9gg\u00e9 sok dolgot lehetett megtal\u00e1lni.<\/p>\n
A v\u00e1d szerint a Meta t\u00f6bb mint 80 terab\u00e1jtnyi adatot t\u00f6lt\u00f6tt le a LibGenb\u0151l \u00e9s egy m\u00e1sik, Z-Library nev\u0171 \u201e\u00e1rny\u00e9kk\u00f6nyvt\u00e1rb\u00f3l\u201d. 80 TB adat majdnem 80 ezer (!) gigab\u00e1jt! Ez rengeteg. Ez akkora m\u00e9ret\u0171 kal\u00f3zkod\u00e1s, amire eddig tal\u00e1n soha nem volt p\u00e9lda. A c\u00e9ges emailek \u00edr\u00e1sban r\u00f6gz\u00edtett\u00e9k a Meta azon d\u00f6nt\u00e9s\u00e9t, hogy enged\u00e9ly n\u00e9lk\u00fcl \u00e1tveszi \u00e9s felhaszn\u00e1lja a szerz\u0151i joggal v\u00e9dett m\u0171veket, amelyekr\u0151l a c\u00e9g tudta, hogy kal\u00f3zok, az egy\u00e9rtelm\u0171 etikai agg\u00e1lyok ellen\u00e9re. Az egyik emailben, amit bizony\u00edt\u00e9kk\u00e9nt haszn\u00e1lnak, egy \u00e1ll\u00edt\u00f3lagos Meta-alkalmazott hi\u00e1baval\u00f3an azt tan\u00e1csolja, hogy a kal\u00f3zkodott anyagok haszn\u00e1lata t\u00fal kellene, hogy l\u00e9pje az etikai k\u00fcsz\u00f6b\u00fcket, majd hozz\u00e1tette, hogy a LibGen \u00e9s az ehhez hasonl\u00f3 adatb\u00e1zisok alapvet\u0151en olyanok, mint a PirateBay vagy valami ehhez hasonl\u00f3, olyan tartalmakat terjesztenek, amelyek szerz\u0151i jogv\u00e9delem alatt \u00e1llnak, \u00e9s megs\u00e9rtik azokat.<\/p>\n
Sokszor megeml\u00edtik az emailek, hogy a LibGen haszn\u00e1lata agg\u00e1lyos. A Meta egyik kutat\u00f3ja VPN-haszn\u00e1latot javasolt, hogy csak \u00edgy f\u00e9rjenek hozz\u00e1 ahhoz, \u00e9s azzal is po\u00e9nkodott, hogy nem t\u0171nik elfogadhat\u00f3nak, hogy egy v\u00e1llalati laptopr\u00f3l torrentezzenek. A Meta emiatt lopakod\u00f3 \u00fczemm\u00f3dra v\u00e1ltott, elrejtve a tev\u00e9kenys\u00e9get azzal, hogy a torrenteket csak a Facebook hivatalos szerverein k\u00edv\u00fcl t\u00f6lten\u00e9 le \u00e9s seedeln\u00e9 azokat. Az \u00fcgy\u00e9szs\u00e9g szerint ezek a levelez\u00e9sek arra utalnak, hogy a Meta vezet\u0151i Mark Zuckerbergig bez\u00e1r\u00f3lag tudtak arr\u00f3l, hogy a v\u00e1llalatn\u00e1l kal\u00f3zkodott anyagokat haszn\u00e1ltak az MI-modellek k\u00e9pz\u00e9s\u00e9hez, illetve kider\u00fclt, hogy a Meta alkalmazottai szerint az OpenAI is a LibGent haszn\u00e1lta a saj\u00e1t modelljeihez, \u00e9s egyfajta fegyverkez\u00e9si versenynek \u00e1ll\u00edtott\u00e1k be azt, hogy v\u00e9g\u00fcl \u0151k is ehhez folyamodtak.<\/p>\n
Ha b\u0171n\u00f6snek \u00edt\u00e9lik a Met\u00e1t, mekkora b\u00edrs\u00e1got kell majd fizetni\u00fck? \u00c9s az Internet Archive (archive.org) ezek ut\u00e1n mi\u00e9rt nem enged\u00e9lyezett k\u00f6nyvek k\u00f6lcs\u00f6nz\u00e9s\u00e9re digit\u00e1lis k\u00f6nyvt\u00e1rk\u00e9nt?<\/p>\n
Forr\u00e1s: PCGamer<\/a><\/strong><\/span>, Ars Technica<\/a><\/strong><\/span>, Wired<\/a><\/strong><\/span>, Court Listener<\/a><\/strong><\/span><\/p>\n","protected":false},"excerpt":{"rendered":" TECH H\u00cdREK – A mesters\u00e9ges intelligencia-modellek edz\u00e9s\u00e9re k\u00f6nyveket is alkalmazott Mark Zuckerberg c\u00e9ge, de nem \u00e9ppen leg\u00e1lis form\u00e1ban f\u00e9rt hozz\u00e1 a Meta a tartalmakhoz… Egy szerz\u0151i jogi elj\u00e1r\u00e1s zajlik a Meta ellen, amely a szerz\u0151k munk\u00e1inak a nagy nyelvi modellek (large language model = LLM) k\u00e9pz\u00e9s\u00e9hez val\u00f3 felhaszn\u00e1l\u00e1sa miatt indult. T\u00f6bb tucatnyi, \u00e1ll\u00edt\u00f3lag a Meta alkalmazottai k\u00f6z\u00f6tti emailben arr\u00f3l van sz\u00f3, hogy a v\u00e1llalat MI-modelleinek edz\u00e9se \u00e9rdek\u00e9ben hatalmas mennyis\u00e9gben kal\u00f3zkodtak, majd a let\u00f6lt\u00f6tt torrentek tov\u00e1bb\u00edtva lettek (seedel\u00e9s). Janu\u00e1rban b\u00edr\u00f3s\u00e1gi dokumentumokb\u00f3l der\u00fclt ki, hogy a Meta egy nagy f\u00e1jlmegoszt\u00f3 adatb\u00e1zisb\u00f3l, a LibGenb\u0151l szerezte be az MI-tanul\u00e1si adatokat. Itt a fizet\u0151s fal m\u00f6g\u00e9 tett h\u00edrekt\u0151l \u00e9s tudom\u00e1nyos cikkekt\u0151l kezdve a k\u00f6nyvekig el\u00e9gg\u00e9 sok dolgot lehetett megtal\u00e1lni. A v\u00e1d szerint a Meta t\u00f6bb mint 80 terab\u00e1jtnyi adatot…<\/p>\n