Mundo Tech

Estudo revela que IA erra em 80% dos diagnósticos iniciais

Pesquisa americana testou 21 modelos, incluindo ChatGPT e Gemini, em casos clínicos reais

Agência O Globo - 14/04/2026
Estudo revela que IA erra em 80% dos diagnósticos iniciais
robô - Foto: Depositphotos Foto: https://depositphotos.com/

A inteligência artificial ainda não está pronta para atender pacientes sozinha. Essa é a conclusão de um estudo publicado nesta segunda-feira (13) no JAMA Network Open.

A pesquisa analisou a performance de 21 modelos de IA generativa, incluindo ChatGPT, Deep Seek, Gemini e Claude, em 29 casos clínicos reais utilizados para treinamento de médicos. Os casos envolviam sintomas, resultados de exames e histórico médico.

Os modelos foram avaliados em etapas semelhantes às aplicadas a estudantes de medicina: primeiro, apresentaram uma lista de hipóteses diagnósticas; depois, indicaram exames, chegaram ao diagnóstico final e, por fim, sugeriram tratamentos.

O resultado mostrou que, na fase inicial do diagnóstico, a taxa de erro das IAs foi superior a 80%. Alguns modelos chegaram a errar em 90% e até 100% dos casos. Já na etapa final, quando todos os exames e informações estavam disponíveis, a taxa de erro caiu para menos de 40%, com alguns modelos errando apenas 9% dos diagnósticos.

Mesmo o melhor desempenho, registrado pelo Grok 4, da xAI (empresa de Elon Musk), ficou 22% abaixo do ideal. O pior resultado foi do Gemini 1.5 Flash, com desempenho 36% inferior ao esperado.

Segundo os cientistas, os resultados indicam que, apesar das promessas das empresas de IA, esses sistemas ainda enfrentam grandes limitações na fase inicial do atendimento, quando o médico precisa considerar múltiplas hipóteses. Erros nesse estágio podem ter consequências graves para o paciente.