La IA (inteligencia artificial) es un término general para sistemas de aprendizaje automático que imitan la inteligencia humana. El aprendizaje profundo (DL) es un subconjunto de la IA que utiliza redes neuronales multicapa para extraer características avanzadas y realizar juicios complejos1).
La oftalmología es uno de los campos médicos donde la IA más ha avanzado. Las fotos de fondo de ojo, la OCT (tomografía de coherencia óptica), las pruebas de campo visual y otros datos de imagen están estandarizados, por lo que es más fácil asegurar grandes cantidades de datos de entrenamiento. Los principales usos de la IA son los siguientes 3 puntos.
Mejorar la eficiencia del cribado (reducir la carga de lectura de los especialistas en oftalmología)
Mejorar el acceso en zonas con escasez de especialistas
Homogeneizar la precisión diagnóstica (reducir las diferencias entre centros)
En 2018, la FDA aprobó el primer sistema de diagnóstico con IA totalmente autónomo (IDx-DR), lo que aceleró la aplicación práctica del diagnóstico oftalmológico con IA2). IDx-DR puede ser operado por personal no oftalmólogo en entornos de medicina interna y atención primaria, y determina automáticamente si es necesaria la derivación a un especialista en oftalmología2).
Los sistemas de aprendizaje profundo han mostrado una precisión comparable a la de los especialistas en la detección de retinopatía diabética, glaucoma y AMD, y se ha demostrado el potencial del diagnóstico con IA usando fotografías de fondo de ojo8).
Q¿Cómo se utiliza la IA en oftalmología?
A
La IA analiza automáticamente imágenes de fotografías de fondo de ojo y de OCT para detectar enfermedades como retinopatía diabética, glaucoma y degeneración macular asociada a la edad. La IA de cribado (totalmente autónoma) puede ser operada por personas no oftalmólogas y se utiliza para el cribado primario en regiones con escasez de especialistas. También se investiga el uso de chatbots de IA (como GPT-4) para evaluar los conocimientos de oftalmología y para la educación de los pacientes3). Se la considera una herramienta de apoyo, y el diagnóstico final lo realiza un especialista en oftalmología.
La IA en oftalmología se divide, en términos generales, en los siguientes tres tipos según su función y nivel de autonomía.
IA de cribado (totalmente autónoma)
Analiza automáticamente fotografías de fondo de ojo y determina si no hace falta derivación o si se necesita. Puede funcionar incluso donde no hay especialistas en oftalmología y se aplica a las siguientes enfermedades2).
Es un sistema que ayuda al médico en la lectura de imágenes. Se utiliza para la clasificación del tipo de AMD mediante la segmentación automática de las estructuras en capas de la OCT, y para la evaluación de la gravedad del edema macular diabético (DME).
Chatbot de IA (multimodal)
Es una aplicación de un modelo de lenguaje grande que analiza al mismo tiempo texto (información de la anamnesis) e imágenes (fotografías de fondo de ojo y OCT). Se han evaluado los conocimientos oftalmológicos y la capacidad de interpretación de imágenes de ChatGPT-4, y se está considerando su uso para la educación del paciente y la anamnesis remota3).
2) es el primer sistema de diagnóstico por IA totalmente autónomo aprobado por la FDA en 2018. El personal no oftalmólogo toma las imágenes con una cámara de fondo de ojo sin dilatación y la IA las analiza automáticamente y decide si derivar al paciente. Su uso se está extendiendo en centros de atención primaria.
Indicadores principales de rendimiento (ensayo pivotal de Abràmoff et al. 2018)2):
Sensibilidad: 87,2% (detección de retinopatía diabética de moderada o mayor gravedad)
Especificidad: 90,7%
Valor predictivo positivo: 49,7%, valor predictivo negativo: 98,5%
IDx-DR ha hecho posible el cribado autónomo de DR en centros de medicina interna y atención primaria, y permite seleccionar de forma eficiente los casos que necesitan derivación a un especialista en oftalmología2).
Interpretación de imágenes oftalmológicas por chatbot de IA (ChatGPT-4)
Se ha evaluado la tasa de acierto de GPT-4 en preguntas de opción múltiple de oftalmología3), y la precisión global es del 70%.
Precisión global: 70% (299/428 preguntas)
Clasificación de la precisión por especialidad:
Área
Precisión
Retina
77% (la más alta)3)
Tumores oculares
72%3)
Oftalmología pediátrica
68%3)
Uveítis
67%3)
Glaucoma
61%3)
Neurooftalmología
58% (la más baja)3)
Preguntas basadas en imágenes: 65%, preguntas no basadas en imágenes: 82% (diferencia del 17%, P < .001)3)
Esta diferencia muestra que la capacidad del chatbot para interpretar imágenes sigue siendo inferior a su comprensión del texto no basado en imágenes. Se señala que la integración adecuada de los chatbots multimodales en el entorno clínico es esencial3).
Característica: detección automática de enfermedad plus en la UCI neonatal5)
ChatGPT-4 (OpenAI)
Objeto: evaluación de conocimientos oftalmológicos e interpretación de imágenes
Precisión: tasa global de aciertos 70% (retina 77%, neuro-oftalmología 58%)
Característica: en fase de investigación para su uso en educación del paciente y consultas remotas3)
Q¿Qué tan precisa es la IA para diagnosticar enfermedades oculares?
A
La IA de cribado de retinopatía diabética (IDx-DR) mostró una sensibilidad del 87.2% y una especificidad del 90.7%, con una precisión comparable a la lectura de un especialista en oftalmología2). La IA para retinopatía del prematuro (ROP) (i-ROP DL) también alcanzó una sensibilidad del 91% y una especificidad del 91%5). En cambio, en la evaluación de conocimientos oftalmológicos del chatbot de IA (ChatGPT-4), la tasa global de aciertos fue del 70%, y en neuro-oftalmología fue más baja, del 58%3). En todos los casos, la IA es solo una herramienta de apoyo, y si se detecta alguna anomalía, se necesita un examen detallado por un especialista en oftalmología.
Se ha informado que el cribado autónomo con IA es el más coste-efectivo en comparación con la telemedicina, la oftalmoscopia y la IA asistida1). Con un umbral de disposición a pagar de $7, se consideró coste-efectivo frente al cribado asistido1).
Cribado de AMD (degeneración macular relacionada con la edad)
En una simulación de cohorte japonesa (500,000 personas de 40 años o más, prevalencia del 3.85%), el ICER del cribado con IA cada 3 años fue de $99,283/QALY ($92,890-$99,283)1). Esto supera el umbral de disposición a pagar de Japón (unos $47,286/QALY), por lo que por ahora sigue habiendo dudas sobre la coste-efectividad del cribado de AMD1). Sin embargo, con los avances en la tecnología de IA y la reducción de costes, podría mejorar en el futuro.
Sesgo de los datos de entrenamiento: en conjuntos de datos sesgados hacia determinadas razas o grupos de edad, la precisión disminuye en otros grupos1)
Dependencia de la calidad de imagen: la calidad de las fotografías de fondo de ojo (si hay dilatación pupilar, opacidades de los medios y condiciones de captura) afecta directamente la precisión de la IA
Dificultad para tratar enfermedades raras: cuando hay pocos datos de entrenamiento, no se puede obtener suficiente precisión
Problema de caja negra: la base de las decisiones de la IA es poco transparente, por lo que a los médicos les resulta difícil cumplir con la rendición de cuentas1)
Baja precisión en neurooftalmología: la tasa de acierto de ChatGPT-4 fue del 58% en neurooftalmología, la más baja, y muestra límites para interpretar trastornos complejos del nervio óptico3)
Se señalan los siguientes problemas éticos y legales de la IA en oftalmología1).
Privacidad del paciente y seguridad de los datos: establecimiento de normas para la gestión en la nube y el intercambio internacional de imágenes de fondo de ojo
Responsabilidad en caso de diagnóstico erróneo: si la IA se equivoca, si la responsabilidad recae en el médico o en el fabricante de la IA
Procesos regulatorios y de aprobación: sistemas adecuados de evaluación para dispositivos médicos con IA bajo la FDA (EE. UU.), la Ley de Productos Farmacéuticos y Dispositivos Médicos (Japón) y otros
Garantizar la explicabilidad: la importancia de presentar la base de las decisiones de la IA de forma que puedan entenderla los médicos y los pacientes
El costo inicial de implementación (hardware, software y capacitación del personal) puede ser elevado1)
La diferencia en la relación costo-efectividad entre los países de bajos y altos ingresos es grande1)
Los sistemas de reembolso por seguros se están desarrollando en cada país, y la implementación en Japón aún está en fase de desarrollo
Q¿Es segura la diagnosis ocular con IA?
A
Los sistemas aprobados por autoridades reguladoras como la FDA (como IDx-DR) han pasado por ensayos clínicos rigurosos y se ha confirmado un cierto nivel de seguridad2). Sin embargo, el diagnóstico por IA es una herramienta de apoyo, y el diagnóstico final y el plan de tratamiento deben ser determinados por un oftalmólogo. No se recomienda que el paciente se autodiagnostique solo con un chatbot de IA (como ChatGPT). La precisión de la IA puede disminuir con mala calidad de imagen, enfermedades raras y en el campo de la neurooftalmología3), por lo que, si se sospecha una anomalía, es importante acudir de inmediato al oftalmólogo.
6. Base técnica: cómo funciona el aprendizaje profundo
Imagen con un mapa de calor Grad-CAM superpuesto sobre una fotografía de fondo de ojo. Las áreas en las que la IA se centra se muestran con una escala de colores para tres categorías: ojo normal, sospecha de glaucoma y sospecha de retinopatía diabética
Arias-Serrano I, et al. Artificial intelligence based glaucoma and diabetic retinopathy detection using MATLAB — retrained AlexNet convolutional neural network. F1000Research. 2024;12:14. Figure 8. PMCID: PMC11143403. License: CC BY.
Figura comparativa que muestra mapas de calor Grad-CAM de AlexNet, ResNet50 y GoogLeNet superpuestos sobre fotografías de fondo de ojo (columna izquierda) de un ojo normal (Non_D), sospecha de glaucoma (Sus_G) y sospecha de retinopatía diabética (Sus_R). El rojo a amarillo indica mayor atención, y el azul una atención menor. En los casos de glaucoma se observa una fuerte activación alrededor de la papila del nervio óptico, mientras que en los casos de retinopatía diabética se observa una fuerte activación en la región de la mácula hasta el polo posterior. Esto corresponde a las técnicas de visualización de Grad-CAM y de redes neuronales convolucionales tratadas en la sección “Base técnica: cómo funciona el aprendizaje profundo” del texto.
La red neuronal convolucional (CNN: Convolutional Neural Network) es la tecnología central del diagnóstico oftalmológico con IA.
Extrae automáticamente características de forma jerárquica a partir de las imágenes de fondo de ojo y OCT de entrada
Las capas superficiales reconocen características de bajo nivel como contornos y color, mientras que las capas más profundas reconocen características abstractas como patrones vasculares, hemorragia, edema y la forma de la papila del nervio óptico
Aprender repetidamente con grandes cantidades de datos de entrenamiento (imágenes de referencia etiquetadas por especialistas)
Recopilación de datos: recopilación a gran escala de fotografías de fondo de ojo, OCT y datos de campos visuales
Anotación: los oftalmólogos asignan etiquetas de referencia (estadio y hallazgos) a cada imagen
Entrenamiento y optimización: ajuste repetido de los parámetros de la red para acercarlos a la respuesta correcta
Validación y ensayos clínicos: evaluación del rendimiento en cohortes externas y pruebas piloto en la práctica clínica real
Aprendizaje por transferencia (aplicar modelos preentrenados de otros dominios, como ImageNet, a imágenes oftalmológicas) se usa ampliamente como un método para lograr alta precisión incluso cuando los datos de entrenamiento son limitados.
También avanza la investigación en la generación de imágenes sintéticas mediante GAN (redes generativas antagónicas) para ampliar de forma artificial los datos de entrenamiento de enfermedades raras.
La IA multimodal que procesa al mismo tiempo texto (información de la entrevista clínica) e imágenes (fotografías de fondo de ojo y OCT) se está aplicando a la oftalmología junto con el avance de los modelos de lenguaje grande (como GPT-4)3). Aunque puede integrar información más diversa que una CNN de una sola modalidad, se ha demostrado que su capacidad para interpretar imágenes sigue siendo inferior a su comprensión del texto3).
7. Investigación más reciente y perspectivas futuras
El análisis de fotografías de fondo de ojo mediante aprendizaje profundo ha mostrado que podría ser posible predecir factores de riesgo sistémicos como la edad, el sexo, la presión arterial sistólica, el antecedente de tabaquismo y HbA1c solo a partir de las fotografías de fondo de ojo6). También se ha informado cierta precisión en la predicción del riesgo futuro de eventos cardiovasculares (infarto de miocardio e ictus), por lo que llama la atención la posibilidad de que las fotografías de fondo de ojo sirvan como una ventana al estado general de salud. Los modelos de IA para predecir demencia, enfermedad renal y anemia también se encuentran en fase de investigación6).
Integración con cámaras de fondo de ojo para smartphone
Mediante la toma de imágenes de fondo de ojo con una pequeña lente acoplada a un smartphone y el análisis con IA, se ha demostrado que el cribado de DR en pacientes con diabetes en la India es práctico7). Tanto la sensibilidad como la especificidad han sido comparables a las de cámaras de fondo de ojo especializadas, y el cribado con IA combinado con dispositivos de uso general de bajo costo podría contribuir a su difusión en países en desarrollo y zonas rurales.
Al combinar el cribado con IA y la telemedicina, se espera mejorar el acceso oftalmológico en zonas remotas y países en desarrollo. Incluso en centros sin oftalmólogo especialista, la IA puede realizar un cribado inicial y remitir solo los casos positivos para revisión remota por un especialista, lo que permite un uso más eficiente de los recursos médicos.
Se está investigando una IA que prediga por adelantado la respuesta al tratamiento con anti-VEGF (ranibizumab, aflibercept, faricimab, etc.) y proponga un plan de administración óptimo para cada paciente. Los modelos que predicen el efecto del tratamiento a partir de imágenes de OCT pueden contribuir a reducir el número de inyecciones y mejorar el pronóstico visual.
Aplicación de la IA generativa a la educación del paciente y al apoyo en la entrevista clínica
Los modelos de lenguaje de gran tamaño (como GPT-4) se están estudiando para usos como explicar enfermedades a los pacientes, preparar documentos de consentimiento informado y apoyar la entrevista clínica3). Sin embargo, siguen siendo retos la prevención de errores y sesgos en la información médica, así como el mantenimiento de la relación médico-paciente. No se recomienda que los pacientes tomen decisiones de autodiagnóstico o autotratamiento basándose solo en chatbots3).
Wu JH, Liu TYA, Hsu WT, et al. Performance and limitation of machine learning algorithms for diabetic retinopathy screening: meta-analysis. J Med Internet Res. 2021;23(11):e23863.
Abràmoff MD, Lavin PT, Birch M, Shah N, Folk JC. Pivotal trial of an autonomous AI-based diagnostic system for detection of diabetic retinopathy in primary care offices. NPJ digital medicine. 2018;1:39. doi:10.1038/s41746-018-0040-6. PMID:31304320; PMCID:PMC6550188.
Mihalache A, Popovic MM, Guo MZ, et al. Performance of an upgraded artificial intelligence chatbot for ophthalmic knowledge assessment. JAMA Ophthalmol. 2024;142(3):234-241.
Olvera-Barrios A, Heeren TF, Balaskas K, et al. Diagnostic accuracy of diabetic retinopathy grading by an artificial intelligence-enabled algorithm compared with a human standard reference. Diabetologia. 2023;66(5):857-866.
Brown JM, Campbell JP, Beers A, et al. Automated diagnosis of plus disease in retinopathy of prematurity using deep convolutional neural networks. JAMA Ophthalmol. 2018;136(7):803-810.
Poplin R, Varadarajan AV, Blumer K, Liu Y, McConnell MV, Corrado GS, et al. Prediction of cardiovascular risk factors from retinal fundus photographs via deep learning. Nature biomedical engineering. 2018;2(3):158-164. doi:10.1038/s41551-018-0195-0. PMID:31015713.
Rajalakshmi R, Subashini R, Anjana RM, et al. Automated diabetic retinopathy detection in smartphone-based fundus photography using artificial intelligence. Eye. 2018;32(6):1138-1144.
Ting DSW, Cheung CY, Lim G, Tan GSW, Quang ND, Gan A, et al. Development and Validation of a Deep Learning System for Diabetic Retinopathy and Related Eye Diseases Using Retinal Images From Multiethnic Populations With Diabetes. JAMA. 2017;318(22):2211-2223. doi:10.1001/jama.2017.18152. PMID:29234807; PMCID:PMC5820739.
Copia el texto del artículo y pégalo en el asistente de IA que prefieras.
Artículo copiado al portapapeles
Abre un asistente de IA abajo y pega el texto copiado en el chat.