Um em cada três novos sites é feito por IA, revela estudo

Resumo

Estudo revela que 35% das páginas criadas desde 2022 utilizam modelos de linguagem.
O levantamento foi conduzido por pesquisadores da Universidade de Stanford, do Imperial College London e do Internet Archive.
Eles analisaram amostras de sites arquivados pela Wayback Machine e identificaram padrões de texto automatizado.

Um em cada três sites criados desde 2022 já conta com algum nível de produção por inteligência artificial. É o que mostra um estudo conduzido por pesquisadores da Universidade de Stanford, do Imperial College London e do Internet Archive.

Segundo o levantamento, até meados de 2025 cerca de 35% das novas páginas publicadas na internet foram classificadas como geradas ou assistidas por IA. Antes do lançamento do ChatGPT, no fim de 2022, esse número era praticamente inexistente.

Para chegar a esses dados, os pesquisadores analisaram amostras de sites arquivados pela Wayback Machine entre agosto de 2022 e maio de 2025. O grupo utilizou o software Pandram v3 para identificar padrões de texto automatizado e medir a presença de conteúdo gerado por modelos de linguagem.

Ao 404 Media, Jonáš Doležal, pesquisador de Stanford e coautor do estudo, diz que a velocidade dessa mudança chama atenção. Segundo ele, em poucos anos a IA passou a ocupar uma fatia relevante de um ambientes que levou décadas para ser construído por humanos.

Uma internet mais “uniforme”

Os autores também buscaram entender como o avanço afeta a forma como o conteúdo é produzido. Inspirados por debates como o da chamada Teoria da Internet Morta — a ideia de que grande parte da rede é composta por robôs interagindo entre si —, eles testaram diferentes hipóteses sobre o impacto da IA na web.

Duas delas, relacionadas ao estilo textual, foram confirmadas. De acordo com o estudo, conteúdos gerados por IA tendem a ser mais “alegres” e menos prolixos.

Ao mesmo tempo, há sinais de perda de diversidade estilística e de vocabulário, levando a uma espécie de “monocultura” digital, em que um padrão de escrita domina e substitui diferentes tons de voz. Falamos sobre esse impacto da IA na internet no Tecnocast 355 — A Teoria da Internet Morta.

O que o estudo não encontrou

Apesar do impacto textual, surpreedentemente o estudo não identificou crescimento de informações comprovadamente falsas nem queda relevante no uso de fontes.

O resultado chama atenção porque contraria a percepção de que a IA teria alavancado informações falsas ou enganosas. O argumento é usado, inclusive, pela imprensa brasileira no inquérito contra algumas das tecnologias do Google, como os Resumos de IA.

Em paralelo, o levantamento também comparou esses resultados com a percepção de usuários. Embora parte do público associe o avanço da IA a uma piora na qualidade da informação, esse efeito não apareceu de forma clara nos dados analisados.

Uma das explicações levantadas pelos autores é que a própria internet já opera, historicamente, com diferentes níveis de rigor na verificação de informações.

De acordo com o 404 Media, os pesquisadores pretendem aprofundar a análise para entender quais tipos de sites e idiomas estão mais sujeitos ao uso de IA.

A ideia é transformar o estudo em uma ferramenta de monitoramento contínuo, em parceria com o Internet Archive, capaz de acompanhar em tempo real a evolução da presença de conteúdo gerado por IA na web.