Home / IA / Pesquisa aponta que o conteúdo gerado por IA já domina a internet: 39% em 2023 e prevalência em 2024, dados da Five Percent e testes com GPT-4o

Pesquisa aponta que o conteúdo gerado por IA já domina a internet: 39% em 2023 e prevalência em 2024, dados da Five Percent e testes com GPT-4o

Relatório da Five Percent indica que o conteúdo gerado por IA supera o humano, com identificação de 99,4% e taxa de erro de 4,2%

Um novo relatório da Five Percent revela que o conteúdo gerado por IA já ultrapassou o escrito por humanos na web, segundo a pesquisa. Em novembro de 2023, os artigos produzidos por inteligência artificial representavam quase 39% de todos os publicados, e, a partir de novembro de 2024, a IA prevaleceu em relação ao conteúdo humano. Esses números foram obtidos por meio de uma análise ampla, que combinou geração de textos com modelos avançados e ferramentas de detecção.

Como os pesquisadores levantaram os dados

Para construir a base do estudo, os autores primeiramente geraram conteúdos usando o modelo GPT-4o da OpenAI. O time produziu 6.009 artigos confirmados como escritos por IA para calibrar a avaliação. Em seguida, utilizaram a ferramenta gratuita de detecção Surfer para analisar grandes volumes de texto disponíveis na internet.

No total, os pesquisadores classificaram cerca de 65 mil artigos com o objetivo de estimar a participação do conteúdo gerado por IA no universo de publicações online. Para reduzir falsos positivos, eles testaram a ferramenta com um conjunto de 15.894 artigos publicados entre 2020 e 2022, que eram provavelmente escritos por humanos. Nessa checagem, a ferramenta sinalizou como IA 4,2% desses textos, sugerindo uma taxa de erros de 4,2% no conjunto de controle.

Precisão e limitações da detecção

Segundo o relatório, a ferramenta de detecção identificou corretamente 99,4% dos artigos na amostra de comparação. Em outra avaliação, a taxa de falsos negativos — ou seja, casos em que textos gerados por IA não foram reconhecidos — foi de 0,6% para o GPT-4o. Esses indicadores dão suporte à conclusão dos pesquisadores sobre a escalada do conteúdo gerado por IA, mas também revelam limites metodológicos: a detecção automática não é infalível e depende da qualidade dos modelos e das técnicas de análise.

Qualidade, visibilidade e impacto nas buscas

Apesar do avanço em volume, nem todo conteúdo produzido por IA tem o mesmo desempenho em alcance orgânico. Um estudo separado citado no relatório aponta que esses artigos “não têm um bom desempenho nas buscas” no Google e no ChatGPT, indicando que já existe algum filtro que penaliza ou reduz a visibilidade de conteúdos artificiais de baixa qualidade. Por isso, os autores observam que tais textos provavelmente não são visualizados na mesma proporção por usuários reais, e, “Por isso, eles não consideraram na pesquisa”, quando o filtro de baixa visibilidade é aplicado.

Ao mesmo tempo, outras pesquisas oferecem perspectivas diferentes sobre qualidade. Um estudo do MIT já afirmou que o conteúdo gerado por IA pode ser tão bom ou melhor do que o escrito por humanos. Por outro lado, relatórios de empresas do setor, como a Originality AI, indicam que “muitas vezes, as pessoas dificilmente o conteúdo que a IA criou“, o que sugere dificuldades em identificar autoria automática apenas pela leitura.

Conteúdo de IA vai além do texto

O relatório também lembra que o conteúdo gerado por IA não se limita a texto. Recentemente, uma banda de rock criada por IA ultrapassou os 500 mil ouvintes no Spotify. Além disso, filmes gerados por IA agora são uma realidade, com atores de mentira. Esses exemplos mostram que a automação já abrange áudio, imagem e vídeo, ampliando o debate sobre autenticidade, direitos autorais e moderação.

O que os leitores e produtores de conteúdo devem considerar

Para editores, profissionais de SEO e criadores de conteúdo, os dados indicam duas mensagens principais. A primeira é que o conteúdo gerado por IA já ocupa uma fatia grande do ecossistema online, o que exige estratégias novas de diferenciação, verificação e qualidade. A segunda é que volume não equivale a visibilidade, pois mecanismos de busca e plataformas têm filtros que penalizam conteúdo artificial de baixa qualidade, o que reforça a importância de investir em valor editorial e experiência do usuário.

Em suma, o estudo da Five Percent mostra que vivemos uma transição em que o conteúdo gerado por IA deixou de ser apenas uma ferramenta emergente, para se tornar uma presença massiva na web. Ao mesmo tempo, a qualidade percebida e o desempenho nas buscas continuam a separar produções relevantes daquelas que passam despercebidas, abrindo espaço para normas, melhores práticas e ferramentas de detecção mais refinadas.

Marcado: