Perplexity Risponde alla Causa di Reddit sul Accesso ai Dati
## Perplexity Risponde alla Causa di Reddit sulla Rete di Accesso ai Dati ### Introduzione Negli ultimi tempi, la relazione tra le piattaforme di intelligenza artificiale e i contenuti online ha suscitato un acceso dibattito legale. Reddit ha citato in giudizio Perplexity e tre aziende di scraping dati in un tribunale federale di New York. […]
## Perplexity Risponde alla Causa di Reddit sulla Rete di Accesso ai Dati
### Introduzione
Negli ultimi tempi, la relazione tra le piattaforme di intelligenza artificiale e i contenuti online ha suscitato un acceso dibattito legale. Reddit ha citato in giudizio Perplexity e tre aziende di scraping dati in un tribunale federale di New York. L’accusa? Aver eluso i controlli di accesso per ottenere contenuti da Reddit su larga scala, incluso il scraping dei risultati di ricerca di Google.
### La Risposta di Perplexity
Perplexity ha pubblicato una risposta pubblica in merito alle accuse, sottolineando che la sua operazione consiste nel riassumere le discussioni su Reddit con opportune citazioni, senza tuttavia addestrare i propri modelli di AI sui contenuti di Reddit. Questa posizione è coerente con le dichiarazioni precedenti dell’azienda, anche se rimane da vedere se affronti specificamente le accuse contenute nella denuncia di Reddit.
### Le Accuse Contro Perplexity
La denuncia non menziona solo Perplexity, ma anche le aziende Oxylabs UAB, AWMProxy e SerpApi come intermediari. Reddit sostiene che Perplexity è un cliente di SerpApi, acquistando e/o utilizzando i servizi di quest’ultima per eludere i controlli e copiare i dati di Reddit.
### Evidenze nella Denuncia
L’argomentazione di Perplexity si basa su una distinzione tecnica. L’azienda afferma di riassumere e citare le discussioni piuttosto che utilizzare i post di Reddit per addestrare modelli. In una dichiarazione, Perplexity ha affermato: “Riassumiamo le discussioni su Reddit e citiamo i thread, proprio come le persone fanno spesso qui”.
Tuttavia, la denuncia presenta affermazioni tecniche che mettono in discussione questo quadro. A tal proposito, Reddit ha creato un post di prova accessibile solo tramite il motore di ricerca di Google, non visibile in nessun altro modo su Internet. Nel giro di poche ore, quel contenuto nascosto è apparso nei risultati di Perplexity.
### Accuse Simili da Parte di Altri Editori
Recentemente, Forbes ha accusato Perplexity di ripubblicare contenuti esclusivi e ha minacciato azioni legali. Wired ha riportato che Perplexity ha utilizzato IP non dichiarati e stringhe user-agent contraffatte per aggirare il file robots.txt. Cloudflare ha successivamente dichiarato che Perplexity ha impiegato “crawler furtivi e non dichiarati” che hanno ignorato le direttive di non crawlo.
### La Reazione di Perplexity
Nei precedenti contenziosi, Perplexity ha dichiarato che le problematiche erano dovute a imprecisioni nei nuovi prodotti e ha promesso un’attribuzione più chiara. L’azienda ha anche sostenuto che alcune organizzazioni mediatiche cercano di controllare i “fatti pubblicamente riportati”. In questa risposta, Perplexity inquadra la causa di Reddit come un tentativo di esercitare pressione in negoziazioni più ampie sui dati di addestramento, affermando: “Riassumiamo le discussioni di Reddit… Non ci lasceremo estorcere, né aiuteremo Reddit a estorcere Google”.
### Perché È Importante
Questo tema è cruciale poiché riguarda l’uso dei contenuti delle forum da parte degli assistenti AI, capaci di influenzare l’informazione che il pubblico legge e a cui gli editori si riferiscono frequentemente. Le questioni legali vanno oltre il semplice addestramento di modelli. I tribunali potrebbero esaminare se i controlli tecnici siano stati elusi, se il riassunto viola espressioni protette e se l’uso di scraper di terze parti possa comportare responsabilità legali per i prodotti downstream.
Se i tribunali accettassero l’argomento di Reddit contro l’aggiramento dei controlli, potrebbero nascere cambiamenti nel modo in cui gli assistenti citano o collegano i thread di Reddit. D’altro canto, se i tribunali concordassero con il punto di vista di Perplexity, gli assistenti potrebbero iniziare a dipendere maggiormente da discussioni in forum meno soggetti a restrizioni di licenza.
### Cosa Non Sappiamo Ancora
La denuncia sostiene che Perplexity ha ottenuto dati tramite almeno un’azienda di scraping, ma il documento ufficiale non specifica quale fornitore ha fornito quali dati né include dettagli sulle transazioni.
### Conclusione
Mentre la battaglia legale si svolge, il caso di Perplexity contro Reddit mette in luce la complessità dell’accesso ai contenuti online e le implicazioni legali nell’uso delle informazioni provenienti da forum e social media. Il risultato potrebbe avere ripercussioni significative sul futuro della raccolta e dell’uso dei dati nell’era digitale.
admin