Internet14 apr. 2026
Publicațiile de știri blochează Wayback Machine să arhiveze paginile lor - 23 de publicații temute de abuzurile companiilor AI asupra utilizării corecte a datelor
Blocarea Wayback Machine de către publicații riscă să subțieze „memoria” internetului , într-un moment în care accesul la versiuni vechi ale articolelor contează inclusiv pentru verificarea informațiilor. Potrivit Tom's Hardware , mai multe site-uri de știri împiedică Internet Archive să le arhiveze paginile, de teama că firmele de inteligență artificială ar putea folosi „utilizarea corectă” (fair use) pentru a antrena modele pe copii ale articolelor mai vechi. Miza este practică, nu doar de principiu: dacă paginile nu mai pot fi „înghețate” în timp prin capturi (snapshots), scade accesul public la istoricul știrilor și la alte informații care pot fi relevante ulterior, inclusiv într-un context în care dezinformarea este răspândită, iar modelele lingvistice mari (LLM) pot genera răspunsuri convingătoare, dar greșite. Cine blochează și ce anume este blocat Conform Wired , 23 de publicații importante blochează în prezent „ia-archiverbot”, robotul de indexare folosit frecvent de Internet Archive pentru a salva pagini în Wayback Machine; între exemplele menționate se află USA Today și The New York Times. În același timp, Wired remarcă faptul că unele dintre aceste publicații folosesc Wayback Machine în propria documentare și raportare. De ce contează pentru piața media și pentru public Tom's Hardware pune fenomenul în contextul tranziției de la presa tipărită la cea online: bibliotecile și redacțiile aveau, tradițional, colecții de volume arhivate, însă odată cu migrarea către digital aceste arhive nu mai sunt actualizate, iar rolul de „registru” al trecutului ajunge să fie preluat de servicii online precum Wayback Machine. Publicația argumentează că, deși redacțiile și-ar putea gestiona singure arhivarea, există un interes public ca păstrarea evidențelor să fie făcută de o parte terță neutră. Motivul: articolele online pot fi modificate, iar o arhivă independentă ajută la urmărirea schimbărilor, fie că actualizările sunt făcute transparent sau nu. În plus, astfel de servicii pot păstra conținutul unor publicații care au dispărut și care altfel s-ar pierde. Disputa „utilizării corecte”: arhivare versus antrenarea AI Există opoziție din partea unor publicații față de arhivare, însă Tom's Hardware notează că sistemul juridic a stabilit că activitatea Internet Archive este legală și intră sub incidența „utilizării corecte”. Electronic Frontier Foundation (EFF) susține că instanțele au recunoscut de mult timp că realizarea unui index căutabil poate necesita copii ale materialului de bază și că această copiere are un scop „transformator” — adică servește descoperirii, cercetării și obținerii de noi perspective asupra operelor creative. „Instanțele au recunoscut de mult timp că este adesea imposibil să construiești un index căutabil fără a face copii ale materialului de bază”, a transmis Electronic Frontier Foundation. „Copierea a servit un scop transformator: a permis descoperirea, cercetarea și noi perspective asupra operelor creative.” Tom's Hardware admite că îngrijorarea privind folosirea „utilizării corecte” pentru antrenarea modelelor AI este una validă pentru companiile media și pentru alte platforme cu volume mari de date, dar susține că blocarea serviciilor de arhivare ar produce, per total, mai mult rău decât bine pentru societate. Ce urmează Potrivit articolului, directorul Wayback Machine, Mark Graham, ar fi în discuții cu mai multe publicații pentru a permite din nou accesul robotului de arhivare. În paralel, o coaliție de jurnaliști și alți actori ar fi semnat o scrisoare de susținere pentru Internet Archive și misiunea sa de a oferi acces universal la cunoaștere. [...]