
Google are acces la de peste trei ori mai multe pagini web decât OpenAI, iar acest decalaj de date ar putea influența decisiv competiția din domeniul inteligenței artificiale, susține Matthew Prince, CEO-ul Cloudflare, într-un interviu recent pentru podcastul TBPN. Potrivit acestuia, datele interne colectate de Cloudflare în rețeaua sa arată că, pentru fiecare pagină accesată de OpenAI, Google parcurge 3,2, ceea ce îi oferă un avantaj major în antrenarea modelelor de AI.
Disparitate semnificativă între giganții tech
Conform lui Prince, diferențele de acoperire nu se limitează la OpenAI. Google are acces la:
- 3,2 ori mai multe pagini decât OpenAI (GPTBot),
- 4,8 ori mai multe decât Microsoft,
- iar Anthropic se află la același nivel cu Microsoft.
Această superioritate este explicată prin statutul privilegiat deținut de Google în ecosistemul online, câștigat de-a lungul anilor prin dominația în căutările web. Mulți administratori de site-uri permit Googlebot să acceseze zone protejate, inclusiv conținut aflat în spatele paywall-urilor, din dorința de a apărea în rezultatele căutărilor.
„Toată lumea i-a lăsat să treacă de paywall. Le-au permis accesul la părți ale internetului pe care nimeni altcineva nu le vede”, afirmă Prince, citat de Times of India.
Googlebot – între căutare și AI
Un alt element-cheie îl reprezintă rolul dual al Googlebot, care este folosit atât pentru indexarea căutărilor, cât și pentru colectarea de date în scopul antrenării modelelor AI. Asta îl face greu de blocat de către editorii web fără a-și compromite vizibilitatea în Google Search. Fişierele robots.txt, prin care website-urile limitează accesul crawlerelor, sunt adesea configurate special pentru a permite accesul Google, nu și altor crawlere AI.
Potrivit raportului Cloudflare Year in Review, publicat în decembrie 2025 și citat de Search Engine Journal, în lunile octombrie și noiembrie:
- Googlebot a accesat 11,6% din totalul paginilor web unice,
- în timp ce GPTBot de la OpenAI a ajuns doar la 3,6% – un raport de peste 3 la 1.
Avantajul datelor, cheia supremației în AI?
Prince susține că volumul de date la care are acces un model este chiar mai important decât resursele hardware sau resursa umană. În acest context, dominanța Google în web crawling poate deveni un obstacol serios pentru rivali. CEO-ul Cloudflare solicită intervenția autorităților de reglementare, fie pentru a limita utilizarea datelor web de către Google în scopuri AI, fie pentru a impune un acces egal la conținutul online pentru toți actorii din industrie.
„Cine are cele mai multe date, câștigă în era AI”, a declarat Prince, conform Intellectia.
Contextul: Gemini câștigă teren
Declarațiile vin în momentul în care Gemini, asistentul AI de la Google, câștigă cotă de piață în fața ChatGPT. Potrivit Similarweb, în ianuarie 2026:
- Gemini a atins 21,5% din traficul AI generativ online, față de doar 5,7% în urmă cu un an,
- în timp ce ChatGPT a scăzut de la 86,7% la 64,5%.
Acest context amplifică preocupările privind monopolul datelor în AI și ridică întrebări despre cât de sustenabilă este competiția într-un ecosistem în care accesul la informație nu este echitabil.
