A Reddit óriási pere figyelmezteti az AI óriásokat a sportkedvelők adatainak szedésére
A Reddit jogi lépéseket indít az Anthropic ellen, mert állítólag több millió felhasználói bejegyzést – köztük sportkedvelők tartalmát – gyűjtöttek össze AI modellek képzésére.
- 100M+ Potenciálisan érintett Reddit napi aktív felhasználó
- 22M+ Tag a Reddit legnagyobb sportsubredditjében, az r/sportsban
- $6.4B A Reddit IPO értékelése 2024-ben
- 100,000+ Az Anthropic robotok által állítólagos bejegyzésgyűjtések esetei 2024 júliusa után
A Reddit jogi viharba került az AI óriás Anthropic ellen, állítva, hogy a cég törvénytelenül bányászott hatalmas mennyiségű Reddit tartalmat – köztük néhány internet leglelkesebb sportkedvelőinek bejegyzéseit. A kaliforniai szerdai bejegyzés felborítja a folyamatban lévő vitát arról, hogy ki birtokolja az online adatokat és hogyan használják azokat a mesterséges intelligencia cégek.
Ez a jogi csata nem csupán egy nagy tech harc; a magánéletről, a tulajdonjogról és azokról a valós emberekről szól, akik mögött állnak, akik hozzájárulnak a mai legnagyobb AI motorok működéséhez.
Mi a tét a Reddit kontra Anthropic perben?
A Reddit keresete azt állítja, hogy az Anthropic AI webcrawlerje, a ClaudeBot, megszegte a szabályokat azzal, hogy mindent összeszedett az alapos sportkommentároktól kezdve a vírusosan terjedő szavazásokig és a rajongói reakciókig. A Reddit érvelése szerint ez a tartalom “meghökkentette” az Anthropic üzletét – segítve az AI céget egy milliárd dolláros értékeléshez anélkül, hogy visszaadna a felhasználóknak vagy a platformnak, amely eredetileg létrehozta a tartalmat.
A Reddit jogi csapatát vezető John B. Quinn, a Quinn Emanuel Urquhart & Sullivan ügyvédje azt mondta, hogy az Anthropic figyelmen kívül hagyta a felhasználói magánéletet és megsértette a megállapodásokat, különösen, mivel sok sportkedvelő a platform legtermékenyebb és legmegbízhatóbb posztolója közé tartozik.
Az Anthropic ezzel szemben ragaszkodik ahhoz, hogy “hevesen védi magát”, megalapozva egy technológiai összecsapást, amely óriási következményekkel járhat 2025-ben és azon túl.
Hogyan működik az AI adatgyűjtése – és miért hívja fel a figyelmet a Reddit?
A webcrawler-ek, mint a ClaudeBot, automatizálják a folyamatot, amely során hatalmas adathalmazokat gyűjtenek össze online tartalom átvizsgálásával, lemásolásával és kinyerésével. Az AI cégek számára, mint az Anthropic, ez az adat aranybánya – ez segíti nagyszabású nyelvi modelljeiket okosabbá és árnyaltabbá tenni.
A Reddit panaszában a felhasználói magánéletre koncentrál, érvelve, hogy a sportkedvelők és mások, akik megosztották, törölték, vagy szavaztak a bejegyzésekre, soha nem járultak hozzá ahhoz, hogy a szavaikat külső algoritmusok képzésére használják. A kereset szíve abban áll, hogy a Reddit felhasználói nem tudták, hogy az AI botok egész beszélgetéseket gyűjtenek össze, amelyek sok esetben személyesek vagy érzékenyek voltak.
További információkat találhatsz az AI-ról és az internetes magánéletről a Reddit oldalán, valamint a mainstream híreket a NY Times oldalon.
Miért annyira fontosak a sport subreddit-ek az AI képzésében?
A Reddit hatalmas sportközösségei, az r/sports-tól (22M fan) kezdve, a konkrét csapatokig, mint a Miami Dolphins (r/miamidolphins) vagy a legendás Dallas Cowboys (r/cowboys), egyedi, valós idejű, és gyakran szakszerű kommentárokat kínálnak. Ezek a subreddit-ek eredeti észrevételeket, vitákat, és szórakozást állítanak elő, amelyekre az AI modelleknek szükségük van ahhoz, hogy jobban megértsék a természetes nyelvet és a kulturális árnyalatokat.
Az upvote/downvote funkció, az aktív moderálás és a zaklatás ellenes szabályok a Reddit tartalmát magas színvonalúvá és dinamikussá teszik – pontosan olyan adatok, amelyeket az AI cégek szívesen összegyűjtenek.
További részletek az internetes közösségekről a Reddit oldalon, vagy nézd meg a legfrissebb technológiai és AI híreket a CNN oldalán.
Mi a különbség az Anthropic és az OpenAI, valamint a Google között?
A Reddit rámutat arra, hogy míg más AI óriásokkal – nevezetesen az OpenAI-val és a Google-lal ellentétben – az Anthropic állítólag nem sikerült formális, a magánszemélyek jogait tiszteletben tartó partnerségeket létrehozni. Míg az OpenAI és a Google arról számoltak be, hogy olyan megállapodásokat kötöttek, amelyek védik a Reddit felhasználóinak érdekeit, az Anthropicot azzal vádolják, hogy ügyeskedett, titokban folytatta a Reddit szedését, még azután is, hogy azt ígérte, hogy 2024 júliusában abbahagyja.
Az audit naplók szerint a hónapok során, Anthropic nyilvános nyilatkozata után, tízezernél is több bot látogatásról számoltak be.
Mit jelent mindez az internetfelhasználók számára 2025-ben?
Ez a kereset sokkal többről szól, mint a sport subreddit-ek jövőjéről. Ahogyan az AI egyre okosabbá válik és a webes adatgyűjtés egyre gyakoribbá válik, minden internetfelhasználónak meg kell értenie, hogy a nyilvános bejegyzéseik hogyan használhatók fel újra, néha anélkül, hogy tudomásuk lenne róla vagy bármilyen hasznot húznának belőle.
A Reddit harca az Anthropic ellen precedenst teremthet az adatbirtoklás és a magánélet védelmét illetően, ahogyan a technológia folytatja a közösségek átalakítását online.
Figyelj és tudd, hogy mik a jogaid – itt van, amit most tehetsz:
- Folytasd és frissítsd a Reddit magánéleti és adatmegosztási beállításaidat
- Válassz tudatosan a nyilvánosan megosztott tartalmaiddal
- Figyeld a technológiai híreket a bírósági döntésről és a jövőbeli politikai változásokról
- Támogass olyan platformokat, amelyek átlátható adatpartnerségeket tartanak fenn
Ne engedd, hogy a szavaid AI-t működtessenek a beleegyezésed nélkül – maradj tájékozott, maradj védett, és válaszd meg, hova kerülnek az adataid legközelebb.