A Microsoft revelou detalhes de um sistema de inteligência artificial que tem um desempenho melhor do que os médicos humanos em diagnósticos complexos de saúde, criando um “caminho para a super inteligência médica”.
A unidade de IA da empresa, liderada pelo pioneiro técnico britânico Mustafa Suleyman, desenvolveu um sistema que imita um painel de especialistas que abordam casos “diagnóstico complexos e intelectualmente exigentes”.
A Microsoft disse que, em combinação com o modelo avançado de O3 AI do OpenAI, sua abordagem mais de oito dos 10 estudos de caso “resolvidos”, especialmente escolhidos para sua pesquisa. Quando esses estudos de caso foram julgados em praticar médicos – que não tinham acesso a colegas, livros didáticos ou chatbots – a porcentagem de precisão era de dois em 10.
A Microsoft disse que também era uma opção mais barata do que o uso de médicos humanos, porque era mais eficiente na solicitação de testes.
Apesar de enfatizar a potencial economia de custos de sua pesquisa, a Microsoft desempenhou as implicações do trabalho e disse que acreditava que a IA complementaria os papéis dos médicos em vez de substituí -los.
“Seus papéis clínicos são muito mais amplos do que apenas fazer um diagnóstico. Eles devem navegar por ambiguidade e construir confiança nos pacientes e em suas famílias de uma maneira que a IA não criou”, escreveu a empresa em um post no qual a pesquisa foi anunciada, que é enviada para revisão por pares.
O uso do slogan “Path to Medical Super Intelligence”, no entanto, aumenta a perspectiva de mudança radical no mercado de saúde. Embora a inteligência geral artificial (AGI) se refere a sistemas que correspondem às habilidades cognitivas humanas com todas as tarefas em particular, a Superintelligência é um termo igualmente teórico que se refere a um sistema que excede o desempenho intelectual humano em geral.
A Microsoft explicou o motivo por trás da investigação e declarou a dúvida sobre a capacidade da IA de marcar excepcionalmente bem na investigação de licenças médicas dos Estados Unidos, um teste importante para obter uma licença médica nos EUA. Ele disse que os testes de múltipla escolha preferiram lembrar as respostas acima de uma profunda compreensão de um assunto, o que poderia ajudar a “exagerar” a competência de um modelo de IA.
A Microsoft disse que desenvolveu um sistema que, como um médico da prática, são necessárias medidas passo a passo como fazendo perguntas específicas e solicitando que testes de diagnóstico cheguem a um diagnóstico definitivo. Por exemplo, um paciente com sintomas de tosse e febre pode exigir exames de sangue e uma raio X da mama antes que o médico chegue durante um diagnóstico de pneumonia.
A nova abordagem da Microsoft usa estudos de caso complexos do New England Journal of Medicine (NEJM).
A equipe de Suleyman transformou mais de 300 desses estudos em “desafios de casos interativos” que o usaram para testar sua abordagem. A abordagem da Microsoft usou os modelos de IA existentes, incluindo os produzidos pelo desenvolvedor do ChatGPT, Openai, Meta, Anthrópico, Anthrópico, Grok de Elon Musk e Gemini’s Gemini.
A Microsoft usou um sistema de IA personalizado e do tipo agente chamado “orquestrador de diagnóstico” para trabalhar com um determinado modelo em quais testes encomendar e qual poderia ser o diagnóstico. O orquestrador imita um painel de médicos, que vem com o diagnóstico.
A Microsoft disse que, em combinação com o Modelo O3 Avançado do OpenAI, mais de oito em cada 10 Casestudos de Nejm ‘resolvidos’ -comparados a dois dos 10 da taxa de sucesso para os médicos humanos.
A Microsoft disse que a abordagem foi capaz de usar uma “largura e profundidade de especialização” que foram além dos médicos individuais porque poderia incluir várias disciplinas médicas.
Ele acrescentou: “Escalar esse raciocínio e além pode reformar os cuidados de saúde. A IA pode permitir que os pacientes façam aspectos rotineiros de cuidados e equipar os médicos com apoio avançado à decisão para casos complexos”.
A Microsoft reconheceu que seu trabalho não está pronto para uso clínico. É necessário mais testes em seu “orquestrador” para avaliar seu desempenho em sintomas mais usuais, por exemplo.