Un estudio desarrollado por el sistema de salud Cedars-Sinai, con sede en Estados Unidos, concluyó que las recomendaciones de tratamiento generadas por inteligencia artificial (IA) durante visitas médicas virtuales obtuvieron mejores calificaciones que las decisiones clínicas finales tomadas por médicos. La investigación fue presentada en la Reunión de Medicina Interna del Colegio Americano de Médicos y publicada de forma simultánea en la revista Annals of Internal Medicine.
La investigación comparó las recomendaciones iniciales proporcionadas por un modelo de IA con las decisiones finales de los médicos que atendieron a los pacientes. Si bien los profesionales de la salud tuvieron acceso a las sugerencias de la IA, no se pudo establecer con certeza si las utilizaron como base para su toma de decisiones.
El análisis fue realizado sobre la base de 461 consultas médicas virtuales que tuvieron lugar entre el 12 de junio y el 14 de julio de 2024, a través de la plataforma Cedars-Sinai Connect. Este programa de atención médica remota, lanzado en 2023, permite a los pacientes en California acceder a servicios médicos agudos, crónicos y preventivos mediante una aplicación móvil.
En cada consulta, los pacientes iniciaron el proceso completando una entrevista médica automatizada gestionada por un modelo de IA. Esta herramienta recolectó información sobre síntomas, antecedentes médicos y detalles demográficos. Según los datos del estudio, los pacientes respondieron un promedio de 25 preguntas en un lapso estimado de cinco minutos.
Una vez finalizada la entrevista, el sistema presentó un conjunto de posibles diagnósticos junto con recomendaciones clínicas iniciales, incluyendo sugerencias de pruebas diagnósticas, prescripciones o derivaciones. Posteriormente, los pacientes tuvieron una videoconsulta con un médico de Cedars-Sinai Connect, quien tenía la opción de revisar las sugerencias generadas por la IA.
Las recomendaciones de inteligencia artificial superan en calificación a las decisiones médicas en consultas virtuales
Los investigadores encontraron que las recomendaciones iniciales generadas por IA fueron calificadas con una puntuación promedio más alta en comparación con las decisiones finales tomadas por los médicos. Según explicó el doctor Joshua Pevnick, codirector de la División de Informática del Cedars-Sinai y coautor principal del estudio, “las recomendaciones iniciales de IA para dolencias comunes en un entorno de atención urgente obtuvieron una calificación más alta que las recomendaciones finales del médico”.
Una de las fortalezas identificadas en el uso de la IA fue su capacidad para detectar posibles infecciones urinarias causadas por bacterias resistentes a los antibióticos. En estos casos, el sistema recomendaba solicitar un cultivo antes de prescribir medicación, lo que sugiere un enfoque orientado a la prevención de errores en la prescripción y la resistencia antimicrobiana.
No obstante, los autores también destacaron los límites del sistema automatizado. Según Pevnick, los médicos humanos demostraron ser más eficaces en la recolección de antecedentes clínicos completos y en la adaptación de sus recomendaciones al contexto particular de cada paciente.
La evaluación de las recomendaciones se realizó mediante un análisis retrospectivo, en el cual un equipo clínico examinó la calidad de las decisiones tanto de la IA como de los médicos. El estudio no pudo determinar en qué medida los profesionales de la salud revisaron o integraron las recomendaciones de la IA en sus decisiones finales. Este punto fue subrayado por la doctora Caroline Goldzweig, directora médica de Cedars-Sinai Medical Network y también coautora del estudio, quien señaló que “la principal incertidumbre radica en si los médicos consultaron las sugerencias generadas por la IA”.
Goldzweig también destacó que, pese a esa incertidumbre, el hecho de que las recomendaciones de la IA fueran calificadas con mayor calidad sugiere que, si se implementan adecuadamente en el punto de atención, estas herramientas pueden contribuir a optimizar la toma de decisiones clínicas en escenarios comunes y de baja complejidad.
Funcionamiento del sistema IA
El modelo de IA utilizado por Cedars-Sinai se basa en una combinación de entrevistas estructuradas y análisis del historial clínico electrónico del paciente. A partir de esta información, el sistema presenta posibles diagnósticos y sugiere acciones clínicas. Durante el período de evaluación, las recomendaciones generadas por el sistema no eran exhibidas de manera prominente en la interfaz, y requerían que los médicos se desplazaran para poder visualizarlas, lo que podría haber influido en el nivel de uso efectivo de estas sugerencias.
El sistema fue entrenado a partir de notas clínicas anónimas y ajustado en función del uso diario que hacen los proveedores de salud, lo que le permitió mejorar su precisión mediante un mecanismo de aprendizaje continuo. Los autores del estudio plantean que este enfoque puede llevar a alcanzar niveles de precisión comparables con los de médicos humanos en determinadas condiciones clínicas.
El equipo de Cedars-Sinai remarcó que la incorporación de la inteligencia artificial en la atención médica virtual aún se encuentra en una etapa de desarrollo. El estudio aporta evidencia sobre el potencial de estas herramientas para mejorar la calidad del diagnóstico y la precisión en el manejo de afecciones frecuentes. Sin embargo, también subraya la necesidad de establecer protocolos que garanticen una integración efectiva entre las sugerencias automatizadas y la experiencia clínica de los profesionales.
Los autores indicaron que futuras investigaciones deberían enfocarse en determinar con mayor precisión cuándo y cómo los médicos utilizan las recomendaciones generadas por IA, así como evaluar el impacto clínico de su implementación en distintas especialidades médicas.