El presente y el futuro del diagnóstico por IA en oftalmología (AI Diagnosis in Ophthalmology)

Puntos clave de un vistazo

La oftalmología es una de las áreas médicas donde más ha avanzado la aplicación de la IA (inteligencia artificial), y los datos de imagen estandarizados, como las fotos de fondo de ojo y la OCT, son adecuados para el aprendizaje de la IA.
En 2018, la FDA aprobó el primer sistema de diagnóstico de IA totalmente autónomo (IDx-DR), y la automatización del cribado de la retinopatía diabética pasó a una fase práctica²⁾.
En la evaluación de un chatbot de IA (ChatGPT-4) sobre conocimientos de oftalmología, la precisión global fue del 70%, con diferencias por área: retina 77% (la más alta) y neurooftalmología 58% (la más baja)³⁾.
El cribado con IA para la retinopatía diabética se consideró rentable en 11 de 15 estudios, y el NHS de Escocia informó un ahorro anual de unos 400.000 dólares¹⁾.
La precisión de la IA todavía presenta desafíos en la calidad de la imagen, el sesgo de los datos de entrenamiento y la atención de enfermedades raras¹⁾.
El diagnóstico con IA es una herramienta de apoyo, y el diagnóstico final y el plan de tratamiento los determina un especialista en oftalmología.
Avanza la investigación sobre IA que predice enfermedades sistémicas como el riesgo cardiovascular y la demencia a partir de fotografías de fondo de ojo⁶⁾.

1. ¿Qué es el diagnóstico oftalmológico con IA?

La IA (inteligencia artificial) es un término general para sistemas de aprendizaje automático que imitan la inteligencia humana. El aprendizaje profundo (DL) es un subconjunto de la IA que utiliza redes neuronales multicapa para extraer características avanzadas y realizar juicios complejos¹⁾.

La oftalmología es uno de los campos médicos donde la IA más ha avanzado. Las fotos de fondo de ojo, la OCT (tomografía de coherencia óptica), las pruebas de campo visual y otros datos de imagen están estandarizados, por lo que es más fácil asegurar grandes cantidades de datos de entrenamiento. Los principales usos de la IA son los siguientes 3 puntos.

Mejorar la eficiencia del cribado (reducir la carga de lectura de los especialistas en oftalmología)
Mejorar el acceso en zonas con escasez de especialistas
Homogeneizar la precisión diagnóstica (reducir las diferencias entre centros)

En 2018, la FDA aprobó el primer sistema de diagnóstico con IA totalmente autónomo (IDx-DR), lo que aceleró la aplicación práctica del diagnóstico oftalmológico con IA²⁾. IDx-DR puede ser operado por personal no oftalmólogo en entornos de medicina interna y atención primaria, y determina automáticamente si es necesaria la derivación a un especialista en oftalmología²⁾.

Los sistemas de aprendizaje profundo han mostrado una precisión comparable a la de los especialistas en la detección de retinopatía diabética, glaucoma y AMD, y se ha demostrado el potencial del diagnóstico con IA usando fotografías de fondo de ojo⁸⁾.

Q ¿Cómo se utiliza la IA en oftalmología?

La IA analiza automáticamente imágenes de fotografías de fondo de ojo y de OCT para detectar enfermedades como retinopatía diabética, glaucoma y degeneración macular asociada a la edad. La IA de cribado (totalmente autónoma) puede ser operada por personas no oftalmólogas y se utiliza para el cribado primario en regiones con escasez de especialistas. También se investiga el uso de chatbots de IA (como GPT-4) para evaluar los conocimientos de oftalmología y para la educación de los pacientes³⁾. Se la considera una herramienta de apoyo, y el diagnóstico final lo realiza un especialista en oftalmología.

2. Tipos de IA y enfermedades objetivo

La IA en oftalmología se divide, en términos generales, en los siguientes tres tipos según su función y nivel de autonomía.

IA de cribado (totalmente autónoma)

Analiza automáticamente fotografías de fondo de ojo y determina si no hace falta derivación o si se necesita. Puede funcionar incluso donde no hay especialistas en oftalmología y se aplica a las siguientes enfermedades²⁾.

Retinopatía diabética (RD): la más estudiada y la más implantada
Degeneración macular asociada a la edad (DMAE): detección de drusas y neovascularización
Glaucoma: análisis automático de la cabeza del nervio óptico y de la capa de fibras nerviosas
Retinopatía del prematuro (ROP): cribado neonatal en la UCI neonatal
Retinoblastoma: seguimiento del fondo de ojo en niños

IA de apoyo diagnóstico (semiautónoma)

Es un sistema que ayuda al médico en la lectura de imágenes. Se utiliza para la clasificación del tipo de AMD mediante la segmentación automática de las estructuras en capas de la OCT, y para la evaluación de la gravedad del edema macular diabético (DME).

Chatbot de IA (multimodal)

Es una aplicación de un modelo de lenguaje grande que analiza al mismo tiempo texto (información de la anamnesis) e imágenes (fotografías de fondo de ojo y OCT). Se han evaluado los conocimientos oftalmológicos y la capacidad de interpretación de imágenes de ChatGPT-4, y se está considerando su uso para la educación del paciente y la anamnesis remota³⁾.

Tipo de IA	Sistema representativo	Objetivo	Métrica de precisión
IA de cribado (autónoma)	IDx-DR²⁾	Retinopatía diabética	Sensibilidad 87.2%, especificidad 90.7%
IA de cribado (autónoma)	i-ROP DL⁵⁾	ROP	Sensibilidad del 91%, especificidad del 91%
IA de cribado (autónoma)	EyeArt⁴⁾	retinopatía diabética	Evaluada y en uso en el NHS del Reino Unido
chatbot de IA	ChatGPT-4³⁾	evaluación de conocimientos de oftalmología	precisión global del 70%

3. Principales sistemas de IA y precisión diagnóstica

IDx-DR (Digital Diagnostics)

²⁾ es el primer sistema de diagnóstico por IA totalmente autónomo aprobado por la FDA en 2018. El personal no oftalmólogo toma las imágenes con una cámara de fondo de ojo sin dilatación y la IA las analiza automáticamente y decide si derivar al paciente. Su uso se está extendiendo en centros de atención primaria.

Indicadores principales de rendimiento (ensayo pivotal de Abràmoff et al. 2018)²⁾:

Sensibilidad: 87,2% (detección de retinopatía diabética de moderada o mayor gravedad)
Especificidad: 90,7%
Valor predictivo positivo: 49,7%, valor predictivo negativo: 98,5%

IDx-DR ha hecho posible el cribado autónomo de DR en centros de medicina interna y atención primaria, y permite seleccionar de forma eficiente los casos que necesitan derivación a un especialista en oftalmología²⁾.

Interpretación de imágenes oftalmológicas por chatbot de IA (ChatGPT-4)

Se ha evaluado la tasa de acierto de GPT-4 en preguntas de opción múltiple de oftalmología³⁾, y la precisión global es del 70%.

Precisión global: 70% (299/428 preguntas)
Clasificación de la precisión por especialidad:

Área	Precisión
Retina	77% (la más alta)³⁾
Tumores oculares	72%³⁾
Oftalmología pediátrica	68%³⁾
Uveítis	67%³⁾
Glaucoma	61%³⁾
Neurooftalmología	58% (la más baja)³⁾

Preguntas basadas en imágenes: 65%, preguntas no basadas en imágenes: 82% (diferencia del 17%, P < .001)³⁾

Esta diferencia muestra que la capacidad del chatbot para interpretar imágenes sigue siendo inferior a su comprensión del texto no basado en imágenes. Se señala que la integración adecuada de los chatbots multimodales en el entorno clínico es esencial³⁾.

IDx-DR (aprobado por la FDA en 2018)

Enfermedad objetivo: retinopatía diabética

Precisión: sensibilidad 87,2 %, especificidad 90,7 %

Características: totalmente autónomo. Puede ser operado por personal no oftalmólogo. Uso en medicina interna y atención primaria²⁾

EyeArt (Eyenuk)

Enfermedad objetivo: retinopatía diabética

Precisión: evaluado e implementado en el NHS del Reino Unido

Características: integrado en programas de cribado⁴⁾

i-ROP DL (2018)

Enfermedad objetivo: retinopatía del prematuro (ROP)

Precisión: sensibilidad 91%, especificidad 91%

Característica: detección automática de enfermedad plus en la UCI neonatal⁵⁾

ChatGPT-4 (OpenAI)

Objeto: evaluación de conocimientos oftalmológicos e interpretación de imágenes

Precisión: tasa global de aciertos 70% (retina 77%, neuro-oftalmología 58%)

Característica: en fase de investigación para su uso en educación del paciente y consultas remotas³⁾

Q ¿Qué tan precisa es la IA para diagnosticar enfermedades oculares?

La IA de cribado de retinopatía diabética (IDx-DR) mostró una sensibilidad del 87.2% y una especificidad del 90.7%, con una precisión comparable a la lectura de un especialista en oftalmología²⁾. La IA para retinopatía del prematuro (ROP) (i-ROP DL) también alcanzó una sensibilidad del 91% y una especificidad del 91%⁵⁾. En cambio, en la evaluación de conocimientos oftalmológicos del chatbot de IA (ChatGPT-4), la tasa global de aciertos fue del 70%, y en neuro-oftalmología fue más baja, del 58%³⁾. En todos los casos, la IA es solo una herramienta de apoyo, y si se detecta alguna anomalía, se necesita un examen detallado por un especialista en oftalmología.

4. Rentabilidad y economía de la salud

La evidencia sobre la rentabilidad del cribado oftalmológico con IA se ha acumulado en varios estudios¹⁾.

Cribado de retinopatía diabética (DR)

En la revisión sistemática de Wu et al. (2021), 11 de 15 estudios que evaluaron la economía del cribado de DR con IA lo consideraron costo-efectivo¹⁾.

NHS de Escocia: ahorro anual de $403,200
Estados Unidos (IDx-DR/EyeArt): reducción de costos del 23.3% por paciente
China rural: el cribado con IA fue $34.86 más barato que los evaluadores humanos y mejoró el QALY en 0.04

Región/entorno	Evaluación de costo-efectividad	Fuente
NHS de Escocia	Ahorro anual de $403,200	Wu 2021¹⁾
Atención primaria de EE. UU.	Reducción de costos del 23.3% por paciente	Wu 2021¹⁾
zonas rurales de China	$34.86 más barato que los evaluadores humanos, +0.04 QALY	Wu 2021¹⁾
Japón (AMD, Tamura et al. 2022)	ICER $99,283/QALY (por encima del umbral)	Wu 2021¹⁾

Cribado de retinopatía del prematuro (ROP)

Se ha informado que el cribado autónomo con IA es el más coste-efectivo en comparación con la telemedicina, la oftalmoscopia y la IA asistida¹⁾. Con un umbral de disposición a pagar de $7, se consideró coste-efectivo frente al cribado asistido¹⁾.

Cribado de AMD (degeneración macular relacionada con la edad)

En una simulación de cohorte japonesa (500,000 personas de 40 años o más, prevalencia del 3.85%), el ICER del cribado con IA cada 3 años fue de $99,283/QALY ($92,890-$99,283)¹⁾. Esto supera el umbral de disposición a pagar de Japón (unos $47,286/QALY), por lo que por ahora sigue habiendo dudas sobre la coste-efectividad del cribado de AMD¹⁾. Sin embargo, con los avances en la tecnología de IA y la reducción de costes, podría mejorar en el futuro.

5. Desafíos y limitaciones

Desafíos técnicos

Sesgo de los datos de entrenamiento: en conjuntos de datos sesgados hacia determinadas razas o grupos de edad, la precisión disminuye en otros grupos¹⁾
Dependencia de la calidad de imagen: la calidad de las fotografías de fondo de ojo (si hay dilatación pupilar, opacidades de los medios y condiciones de captura) afecta directamente la precisión de la IA
Dificultad para tratar enfermedades raras: cuando hay pocos datos de entrenamiento, no se puede obtener suficiente precisión
Problema de caja negra: la base de las decisiones de la IA es poco transparente, por lo que a los médicos les resulta difícil cumplir con la rendición de cuentas¹⁾
Baja precisión en neurooftalmología: la tasa de acierto de ChatGPT-4 fue del 58% en neurooftalmología, la más baja, y muestra límites para interpretar trastornos complejos del nervio óptico³⁾

Desafíos éticos y regulatorios

Se señalan los siguientes problemas éticos y legales de la IA en oftalmología¹⁾.

Privacidad del paciente y seguridad de los datos: establecimiento de normas para la gestión en la nube y el intercambio internacional de imágenes de fondo de ojo
Responsabilidad en caso de diagnóstico erróneo: si la IA se equivoca, si la responsabilidad recae en el médico o en el fabricante de la IA
Procesos regulatorios y de aprobación: sistemas adecuados de evaluación para dispositivos médicos con IA bajo la FDA (EE. UU.), la Ley de Productos Farmacéuticos y Dispositivos Médicos (Japón) y otros
Garantizar la explicabilidad: la importancia de presentar la base de las decisiones de la IA de forma que puedan entenderla los médicos y los pacientes

Cuestiones de economía sanitaria

El costo inicial de implementación (hardware, software y capacitación del personal) puede ser elevado¹⁾
La diferencia en la relación costo-efectividad entre los países de bajos y altos ingresos es grande¹⁾
Los sistemas de reembolso por seguros se están desarrollando en cada país, y la implementación en Japón aún está en fase de desarrollo

Q ¿Es segura la diagnosis ocular con IA?

Los sistemas aprobados por autoridades reguladoras como la FDA (como IDx-DR) han pasado por ensayos clínicos rigurosos y se ha confirmado un cierto nivel de seguridad²⁾. Sin embargo, el diagnóstico por IA es una herramienta de apoyo, y el diagnóstico final y el plan de tratamiento deben ser determinados por un oftalmólogo. No se recomienda que el paciente se autodiagnostique solo con un chatbot de IA (como ChatGPT). La precisión de la IA puede disminuir con mala calidad de imagen, enfermedades raras y en el campo de la neurooftalmología³⁾, por lo que, si se sospecha una anomalía, es importante acudir de inmediato al oftalmólogo.

6. Base técnica: cómo funciona el aprendizaje profundo

Imagen con un mapa de calor Grad-CAM superpuesto sobre una fotografía de fondo de ojo. Las áreas en las que la IA se centra se muestran con una escala de colores para tres categorías: ojo normal, sospecha de glaucoma y sospecha de retinopatía diabética

Arias-Serrano I, et al. Artificial intelligence based glaucoma and diabetic retinopathy detection using MATLAB — retrained AlexNet convolutional neural network. F1000Research. 2024;12:14. Figure 8. PMCID: PMC11143403. License: CC BY.

Figura comparativa que muestra mapas de calor Grad-CAM de AlexNet, ResNet50 y GoogLeNet superpuestos sobre fotografías de fondo de ojo (columna izquierda) de un ojo normal (Non_D), sospecha de glaucoma (Sus_G) y sospecha de retinopatía diabética (Sus_R). El rojo a amarillo indica mayor atención, y el azul una atención menor. En los casos de glaucoma se observa una fuerte activación alrededor de la papila del nervio óptico, mientras que en los casos de retinopatía diabética se observa una fuerte activación en la región de la mácula hasta el polo posterior. Esto corresponde a las técnicas de visualización de Grad-CAM y de redes neuronales convolucionales tratadas en la sección “Base técnica: cómo funciona el aprendizaje profundo” del texto.

Red neuronal convolucional (CNN)

La red neuronal convolucional (CNN: Convolutional Neural Network) es la tecnología central del diagnóstico oftalmológico con IA.

Extrae automáticamente características de forma jerárquica a partir de las imágenes de fondo de ojo y OCT de entrada
Las capas superficiales reconocen características de bajo nivel como contornos y color, mientras que las capas más profundas reconocen características abstractas como patrones vasculares, hemorragia, edema y la forma de la papila del nervio óptico
Aprender repetidamente con grandes cantidades de datos de entrenamiento (imágenes de referencia etiquetadas por especialistas)

Proceso de aprendizaje de la IA

Recopilación de datos: recopilación a gran escala de fotografías de fondo de ojo, OCT y datos de campos visuales
Anotación: los oftalmólogos asignan etiquetas de referencia (estadio y hallazgos) a cada imagen
Entrenamiento y optimización: ajuste repetido de los parámetros de la red para acercarlos a la respuesta correcta
Validación y ensayos clínicos: evaluación del rendimiento en cohortes externas y pruebas piloto en la práctica clínica real

Aprendizaje por transferencia (aplicar modelos preentrenados de otros dominios, como ImageNet, a imágenes oftalmológicas) se usa ampliamente como un método para lograr alta precisión incluso cuando los datos de entrenamiento son limitados.

También avanza la investigación en la generación de imágenes sintéticas mediante GAN (redes generativas antagónicas) para ampliar de forma artificial los datos de entrenamiento de enfermedades raras.

IA multimodal

La IA multimodal que procesa al mismo tiempo texto (información de la entrevista clínica) e imágenes (fotografías de fondo de ojo y OCT) se está aplicando a la oftalmología junto con el avance de los modelos de lenguaje grande (como GPT-4)³⁾. Aunque puede integrar información más diversa que una CNN de una sola modalidad, se ha demostrado que su capacidad para interpretar imágenes sigue siendo inferior a su comprensión del texto³⁾.

7. Investigación más reciente y perspectivas futuras

Predicción de enfermedades sistémicas a partir de fotografías de fondo de ojo

El análisis de fotografías de fondo de ojo mediante aprendizaje profundo ha mostrado que podría ser posible predecir factores de riesgo sistémicos como la edad, el sexo, la presión arterial sistólica, el antecedente de tabaquismo y HbA1c solo a partir de las fotografías de fondo de ojo⁶⁾. También se ha informado cierta precisión en la predicción del riesgo futuro de eventos cardiovasculares (infarto de miocardio e ictus), por lo que llama la atención la posibilidad de que las fotografías de fondo de ojo sirvan como una ventana al estado general de salud. Los modelos de IA para predecir demencia, enfermedad renal y anemia también se encuentran en fase de investigación⁶⁾.

Integración con cámaras de fondo de ojo para smartphone

Mediante la toma de imágenes de fondo de ojo con una pequeña lente acoplada a un smartphone y el análisis con IA, se ha demostrado que el cribado de DR en pacientes con diabetes en la India es práctico⁷⁾. Tanto la sensibilidad como la especificidad han sido comparables a las de cámaras de fondo de ojo especializadas, y el cribado con IA combinado con dispositivos de uso general de bajo costo podría contribuir a su difusión en países en desarrollo y zonas rurales.

Integración de la IA y la telemedicina

Al combinar el cribado con IA y la telemedicina, se espera mejorar el acceso oftalmológico en zonas remotas y países en desarrollo. Incluso en centros sin oftalmólogo especialista, la IA puede realizar un cribado inicial y remitir solo los casos positivos para revisión remota por un especialista, lo que permite un uso más eficiente de los recursos médicos.

Aplicaciones en medicina personalizada

Se está investigando una IA que prediga por adelantado la respuesta al tratamiento con anti-VEGF (ranibizumab, aflibercept, faricimab, etc.) y proponga un plan de administración óptimo para cada paciente. Los modelos que predicen el efecto del tratamiento a partir de imágenes de OCT pueden contribuir a reducir el número de inyecciones y mejorar el pronóstico visual.

Aplicación de la IA generativa a la educación del paciente y al apoyo en la entrevista clínica

Los modelos de lenguaje de gran tamaño (como GPT-4) se están estudiando para usos como explicar enfermedades a los pacientes, preparar documentos de consentimiento informado y apoyar la entrevista clínica³⁾. Sin embargo, siguen siendo retos la prevención de errores y sesgos en la información médica, así como el mantenimiento de la relación médico-paciente. No se recomienda que los pacientes tomen decisiones de autodiagnóstico o autotratamiento basándose solo en chatbots³⁾.

8. Referencias

Wu JH, Liu TYA, Hsu WT, et al. Performance and limitation of machine learning algorithms for diabetic retinopathy screening: meta-analysis. J Med Internet Res. 2021;23(11):e23863.
Abràmoff MD, Lavin PT, Birch M, Shah N, Folk JC. Pivotal trial of an autonomous AI-based diagnostic system for detection of diabetic retinopathy in primary care offices. NPJ digital medicine. 2018;1:39. doi:10.1038/s41746-018-0040-6. PMID:31304320; PMCID:PMC6550188.
Mihalache A, Popovic MM, Guo MZ, et al. Performance of an upgraded artificial intelligence chatbot for ophthalmic knowledge assessment. JAMA Ophthalmol. 2024;142(3):234-241.
Olvera-Barrios A, Heeren TF, Balaskas K, et al. Diagnostic accuracy of diabetic retinopathy grading by an artificial intelligence-enabled algorithm compared with a human standard reference. Diabetologia. 2023;66(5):857-866.
Brown JM, Campbell JP, Beers A, et al. Automated diagnosis of plus disease in retinopathy of prematurity using deep convolutional neural networks. JAMA Ophthalmol. 2018;136(7):803-810.
Poplin R, Varadarajan AV, Blumer K, Liu Y, McConnell MV, Corrado GS, et al. Prediction of cardiovascular risk factors from retinal fundus photographs via deep learning. Nature biomedical engineering. 2018;2(3):158-164. doi:10.1038/s41551-018-0195-0. PMID:31015713.
Rajalakshmi R, Subashini R, Anjana RM, et al. Automated diabetic retinopathy detection in smartphone-based fundus photography using artificial intelligence. Eye. 2018;32(6):1138-1144.
Ting DSW, Cheung CY, Lim G, Tan GSW, Quang ND, Gan A, et al. Development and Validation of a Deep Learning System for Diabetic Retinopathy and Related Eye Diseases Using Retinal Images From Multiethnic Populations With Diabetes. JAMA. 2017;318(22):2211-2223. doi:10.1001/jama.2017.18152. PMID:29234807; PMCID:PMC5820739.