A inteligência artificial que pode “raciocinar” é agora capaz de diagnosticar cenários médicos da vida real tão bem ou melhor que os médicos, de acordo com os resultados de um estudo publicado quinta-feira na Science.
Os pesquisadores usaram casos clínicos até então desconhecidos para testar o modelo de raciocínio o1 da OpenAI em relação ao modelo mais antigo da empresa, GPT-4, bem como médicos e residentes médicos em treinamento.
Em uma série de experimentos, o modelo o1 muitas vezes melhorou significativamente a capacidade de diagnóstico do GPT-4 e também superou os médicos. Quando testado com os registros eletrônicos de saúde de casos aleatórios do departamento de emergência de um hospital de Boston, o modelo o1 foi diagnóstico preciso em mais de dois terços das vezes na triagem inicial. Dois médicos assistentes especialistas tiveram diagnósticos corretos em aproximadamente metade das vezes.
VEJA TAMBÉM:
O que a IA pode dizer sobre seu exame de sangue
Robert Wachter, professor e presidente do Departamento de Medicina da Universidade da Califórnia, em São Francisco, descreveu as descobertas do estudo como “importantes” e sugeriu que agora é “indiscutível” que a IA moderna superará os modelos de linguagem grandes e os médicos mais antigos quando solicitados a identificar o diagnóstico correto e o próximo passo. Ele não estava envolvido no estudo.
No entanto, Wachter, autor de “A Giant Leap: How AI is Transforming Healthcare and What That Means for Our Future”, acrescentou que são necessárias mais pesquisas antes que a IA seja totalmente implementada na prática clínica.
Velocidade da luz mashável
“A questão é até que ponto isso replica a vida real, e a resposta é moderadamente boa, mas não perfeita”, escreveu Wachter por e-mail.
Como reconhecem os autores do estudo, os experimentos limitaram-se apenas à entrada de texto e não incluíram as pistas visuais e auditivas nas quais os médicos muitas vezes confiam para o diagnóstico. Isso pode incluir o nível de sofrimento do paciente e imagens médicas.
“A GenAI provavelmente pode começar a integrar essas informações, mas, por enquanto, um teste de um cenário de caso clínico escrito, e muitas vezes artificialmente ‘limpo’, não é o mesmo que entrar em um pronto-socorro e lidar com o caos”, disse Wachter. “Basta assistir The Pitt.”
VEJA TAMBÉM:
Quando será lançada a terceira temporada de ‘The Pitt’?
Com base nas suas descobertas, os autores do estudo destacaram uma necessidade “urgente” de mais estudos e ensaios clínicos prospectivos para determinar como os sistemas de IA podem melhorar a prática clínica e os resultados dos pacientes.
“O rápido ritmo de melhoria nos LLMs tem implicações substanciais para a ciência e a prática da medicina clínica”, escreveram os autores, muitos dos quais trabalham no Beth Israel Deaconess Medical Center de Boston, onde o estudo foi realizado.
Um artigo anexo, também publicado na Science e escrito por dois especialistas do Flinders Health and Medical Research Institute em Adelaide, Austrália, que não estiveram envolvidos no estudo, concordou com as suas implicações urgentes. Eles também consideraram não substituir os médicos pela IA, prevendo, em vez disso, um estilo de colaboração que fornecesse supervisão, julgamento contextual e responsabilidade.
“Sem eficácia, equidade e segurança robustas e demonstradas, muitos sistemas de IA permanecerão insuficientes para uso clínico”, escreveram os especialistas.



