Kompanija Reddit podnela je tužbu protiv startapa Perplexity, optužujući ga da koristi njen zaštićeni sadržaj kako bi trenirao svoj AI sistem.
Tužba je podneta i protiv još tri firme koje se bave masovnim prikupljanjem podataka — SerpApi, Oxylabs i AWMProxy. Reddit ih naziva „pljačkašima banaka“ koji ne mogu da otvore sef, pa zato presreću blindirane kamione.
U dokumentima iz tužbe navodi se da je Reddit još u maju 2024. poslao cease-and-desist pismo Perplexity-ju, zahtevajući da prestane sa pristupom njihovim podacima. Iako je Perplexity tada tvrdio da poštuje pravila, količina Reddit sadržaja koji se pojavljivao kod njih nastavila je da raste.
Reddit je čak napravio test objavu koju je mogla da pronađe samo Google pretraga, ali su njen sadržaj ubrzo izneli i odgovori koje generiše Perplexity. Kompanija tvrdi da je to dokaz da se podaci pokreću iz skrivenih izvora, mimo dogovora.
Vredan resurs u eri veštačke inteligencije
Podaci sa Reddita, puni ljudskog mišljenja, pitanja i komentara, veoma su vredni za treniranje AI modela. Upravo zato je kompanija prošle godine uvela promene u pristupu svom API-ju, što je izazvalo proteste zajednice na platformi.
Reddit je dosad postigao dogovore sa velikim igračima kao što su OpenAI i Google, ali kako navode, Perplexity nije želeo da ide istim putem, već koristi zaobilazne tehnike preko trećih strana.
Redditov pravni direktor Ben Lee izjavio je da AI kompanije učestvuju u „trci za što kvalitetniji sadržaj“ i da se time podstiče „industrija pranja podataka“. On dodaje da je Reddit posebno privlačna meta jer predstavlja jednu od najživljih zbirki ljudske komunikacije na internetu.
Perplexity još nije formalno primio tužbu, ali je u izjavi za The Verge njihov tim istakao da će „uvek braniti pravo korisnika da pristupaju javno dostupnim informacijama“ i da zauzima „odgovoran i principijelan pristup“ u razvoju odgovora na bazi veštačke inteligencije.




