Sisteme de inteligenta artificiala precum ChatGPT ar putea epuiza toate informatiile publice disponibile pe internet in urmatorii 2-7 ani, conform unui studiu recent publicat pe serverul de preprinturi arXiv. Acest lucru ar pune presiune pe companiile din domeniu sa se indrepte catre surse de date de calitate inferioara sau chiar spre acapararea de informatii private pentru antrenarea viitoarelor modele de IA.
Rezerva de Date Pentru Antrenarea IA Se Va Epuiza Intre 2026-2032
Modelele de inteligenta artificiala se antreneaza cu trilioane de cuvinte extrase din carti, articole, Wikipedia si alte surse online. Insa studiul estimeaza ca aceste rezerve de date de inalta calitate vor fi epuizate aproximativ intre 2026 si 2032.
ChatGPT de la OpenAI a fost antrenat pe aproximativ 570 GB de date, echivalentul a 300 de miliarde de cuvinte. Iar motorul de cautare cu IA al Google, Gemini, a folosit si informatii mai putin verificate precum forumurile Reddit sau site-ul satiric The Onion, ceea ce a dus la unele rezultate discutabile.
Eficienta Modelelor vs. Limite Etice Și Legale

Cercetatorii au numarat circa 250 de miliarde de pagini web pe internet, cu o medie de 7 KB de text per pagina. Analizand traficul IP si activitatea pe web, ei au concluzionat ca datele de incredere se vor termina cel tarziu in 2032, iar cele de calitate scazuta intre 2030 si 2050.
Ramane de vazut daca eficienta modelelor de IA va putea fi imbunatatita pentru a compensa lipsa datelor proaspete sau daca progresul va stagna din aceasta cauza. Iar utilizarea de date private sau de proprietate intelectuala fara permisiune va ridica inevitabil probleme etice si juridice.
Companiile tech vor trebui sa gaseasca un echilibru intre nevoia de date masive pentru antrenarea IA si respectarea drepturilor si intimitatii utilizatorilor. O posibila solutie ar fi remunerarea autorilor de continut pentru folosirea textelor lor. Altfel, litigii precum cele intentate deja de creatori impotriva Microsoft si OpenAI pentru utilizarea neautorizata a operelor s-ar putea inmulti.
In acelasi timp, cerintele energetice si de infrastructura tot mai mari pentru IA ar putea deveni o provocare la fel de presanta, conform studiului. Ramane de vazut cum vor evolua aceste tehnologii fascinante, dar si complexe din punct de vedere etic si practic, in anii urmatori. Ce parere aveti despre aceste previziuni? Distribuiti articolul si lasati un comentariu mai jos!
Sursa imaginii: Shutterstock.
Subiecte abordate in articol: inteligenta artificiala, date, etica, tehnologie
Sursa: Studiu publicat pe serverul arXiv de cercetatorii de la Centrul Epoch AI din SUA.