Masa kini dan masa depan diagnosis AI dalam oftalmologi (AI Diagnosis in Ophthalmology)

Poin penting sekilas

Oftalmologi adalah salah satu bidang medis yang paling maju dalam penerapan AI (kecerdasan buatan), dan data gambar yang terstandar seperti foto fundus dan OCT sangat cocok untuk pembelajaran AI.
Pada tahun 2018, FDA menyetujui sistem diagnosis AI pertama yang sepenuhnya otonom (IDx-DR), dan otomatisasi skrining retinopati diabetik mulai digunakan secara praktis²⁾.
Dalam evaluasi chatbot AI (ChatGPT-4) untuk pengetahuan oftalmologi, tingkat ketepatan keseluruhan adalah 70%, dengan perbedaan antarbidang: retina 77% (tertinggi) dan neurooftalmologi 58% (terendah)³⁾.
Skrining retinopati diabetik dengan AI dinilai cost-effective dalam 11 dari 15 studi, dan NHS Skotlandia melaporkan penghematan tahunan sekitar 400 ribu dolar¹⁾.
Akurasi AI masih memiliki tantangan pada kualitas gambar, bias data pelatihan, dan penanganan penyakit langka¹⁾.
Diagnosis AI adalah alat bantu, dan diagnosis akhir serta rencana pengobatan ditentukan oleh dokter spesialis mata.
Penelitian AI yang memprediksi penyakit sistemik seperti risiko kardiovaskular dan demensia dari foto fundus sedang berkembang⁶⁾.

1. Apa itu diagnosis AI di bidang oftalmologi

AI (kecerdasan buatan) adalah istilah umum untuk sistem pembelajaran mesin yang meniru kecerdasan manusia. Deep learning (DL) adalah subkelompok AI yang menggunakan jaringan saraf berlapis banyak untuk mengekstrak fitur tingkat lanjut dan membuat penilaian yang kompleks¹⁾.

Oftalmologi adalah salah satu bidang medis yang paling maju dalam penerapan AI. Foto fundus, OCT (optical coherence tomography), pemeriksaan lapang pandang, dan data gambar lainnya sudah terstandar, sehingga lebih mudah memperoleh data pelatihan dalam jumlah besar. Tujuan utama penerapan AI adalah tiga hal berikut.

Meningkatkan efisiensi skrining (mengurangi beban pembacaan dokter spesialis mata)
Meningkatkan akses di wilayah yang kekurangan dokter spesialis
Menyamakan akurasi diagnosis (mengurangi perbedaan antar fasilitas)

Pada tahun 2018, FDA menyetujui sistem diagnosis AI pertama yang sepenuhnya otonom (IDx-DR), sehingga mempercepat penerapan praktis diagnosis AI di oftalmologi²⁾. IDx-DR dapat dioperasikan oleh staf non-spesialis mata di layanan penyakit dalam dan perawatan primer, dan secara otomatis menentukan apakah perlu merujuk ke dokter spesialis mata²⁾.

Sistem deep learning telah menunjukkan akurasi yang sebanding dengan dokter spesialis dalam mendeteksi retinopati diabetik, glaukoma, dan AMD, dan potensi diagnosis AI menggunakan foto fundus telah ditunjukkan⁸⁾.

Q Bagaimana AI digunakan di oftalmologi?

AI secara otomatis menganalisis gambar dari foto fundus dan OCT untuk mendeteksi penyakit seperti retinopati diabetik, glaukoma, dan degenerasi makula terkait usia. AI skrining (sepenuhnya otonom) dapat dioperasikan oleh non-dokter mata dan digunakan untuk skrining awal di daerah yang kekurangan spesialis. Selain itu, penggunaan chatbot AI (seperti GPT-4) untuk menilai pengetahuan oftalmologi dan edukasi pasien juga sedang diteliti³⁾. Diagnosis akhir ditempatkan sebagai alat bantu yang digunakan oleh spesialis oftalmologi.

2. Jenis AI dan penyakit sasaran

AI oftalmologi secara garis besar dibagi menjadi tiga jenis berikut berdasarkan fungsi dan tingkat otonominya.

AI skrining (sepenuhnya otonom)

AI ini secara otomatis menganalisis foto fundus dan menentukan apakah rujukan tidak diperlukan atau diperlukan. AI ini dapat beroperasi bahkan tanpa spesialis oftalmologi, dan diterapkan pada penyakit berikut²⁾.

Retinopati diabetik (DR): yang paling banyak diteliti dan paling banyak diterapkan
Degenerasi makula terkait usia (AMD): deteksi drusen dan neovaskularisasi
Glaukoma: analisis otomatis diskus optik dan lapisan serabut saraf
Retinopati prematuritas (ROP): skrining bayi baru lahir di NICU
Retinoblastoma: pemantauan fundus pada anak-anak

AI pendukung diagnosis (semiotonom)

Merupakan sistem yang membantu dokter dalam interpretasi gambar. Sistem ini digunakan untuk klasifikasi tipe AMD melalui segmentasi otomatis struktur lapisan OCT, serta penilaian tingkat keparahan edema makula diabetik (DME).

Chatbot AI (multimodal)

Ini adalah penerapan model bahasa besar yang menganalisis teks (informasi anamnesis) dan gambar (foto fundus dan OCT) secara bersamaan. Kemampuan pengetahuan oftalmologi dan interpretasi gambar ChatGPT-4 telah dievaluasi, dan pemanfaatannya untuk edukasi pasien serta anamnesis jarak jauh sedang dipertimbangkan³⁾.

Jenis AI	Sistem perwakilan	Target	Metrik akurasi
AI skrining (otonom)	IDx-DR²⁾	Retinopati diabetik	Sensitivitas 87,2%, spesifisitas 90,7%
AI skrining (otonom)	i-ROP DL⁵⁾	ROP	Sensitivitas 91%, spesifisitas 91%
AI skrining (otonom)	EyeArt⁴⁾	retinopati diabetik	Dievaluasi dan digunakan di NHS Inggris
chatbot AI	ChatGPT-4³⁾	penilaian pengetahuan oftalmologi	akurasi keseluruhan 70%

3. Sistem AI utama dan akurasi diagnosis

IDx-DR (Digital Diagnostics)

²⁾ adalah sistem diagnosis AI sepenuhnya otonom pertama yang disetujui FDA pada tahun 2018. Petugas non-dokter mata mengambil gambar dengan kamera fundus tanpa dilatasi, lalu AI menganalisisnya secara otomatis dan menentukan apakah perlu rujukan. Sistem ini mulai diterapkan di fasilitas layanan primer.

Indikator kinerja utama (uji pivotal Abràmoff dkk. tahun 2018)²⁾:

Sensitivitas: 87,2% (deteksi retinopati diabetik derajat sedang atau lebih berat)
Spesifisitas: 90,7%
Nilai prediksi positif: 49,7%, nilai prediksi negatif: 98,5%

IDx-DR memungkinkan skrining DR secara otonom di fasilitas penyakit dalam dan layanan primer, sehingga kasus yang perlu dirujuk ke dokter spesialis mata dapat diseleksi dengan efisien²⁾.

Interpretasi gambar mata oleh chatbot AI (ChatGPT-4)

Akurasi GPT-4 pada soal pilihan ganda oftalmologi telah dievaluasi³⁾, dan akurasi keseluruhannya adalah 70%.

Akurasi keseluruhan: 70% (299/428 soal)
Peringkat akurasi menurut bidang:

Bidang	Tingkat akurasi
Retina	77% (tertinggi)³⁾
Tumor mata	72%³⁾
Oftalmologi anak	68%³⁾
Uveitis	67%³⁾
Glaukoma	61%³⁾
Neuro-oftalmologi	58% (terendah)³⁾

Pertanyaan berbasis gambar: 65%, pertanyaan nonberbasis gambar: 82% (selisih 17%, P < .001)³⁾

Perbedaan ini menunjukkan bahwa kemampuan chatbot dalam menafsirkan gambar masih lebih rendah daripada pemahaman teks yang tidak berbasis gambar. Telah dicatat bahwa integrasi chatbot multimodal yang tepat di lingkungan klinis sangat penting³⁾.

IDx-DR (disetujui FDA pada 2018)

Penyakit target: retinopati diabetik

Akurasi: sensitivitas 87,2%, spesifisitas 90,7%

Fitur: sepenuhnya otonom. Dapat dioperasikan oleh non-dokter mata. Digunakan di bidang penyakit dalam dan perawatan primer²⁾

EyeArt (Eyenuk)

Penyakit target: retinopati diabetik

Akurasi: telah dievaluasi dan digunakan secara praktis di NHS Inggris

Fitur: telah terintegrasi ke dalam program skrining⁴⁾

i-ROP DL (2018)

Penyakit target: retinopati prematuritas (ROP)

Akurasi: sensitivitas 91%, spesifisitas 91%

Fitur: deteksi otomatis penyakit plus di NICU⁵⁾

ChatGPT-4 (OpenAI)

Objek: penilaian pengetahuan oftalmologi dan interpretasi gambar

Akurasi: tingkat jawaban benar keseluruhan 70% (retina 77%, neuro-oftalmologi 58%)

Fitur: tahap penelitian untuk penerapan pada edukasi pasien dan konsultasi jarak jauh³⁾

Q Seberapa akurat AI dalam diagnosis penyakit mata?

AI skrining retinopati diabetik (IDx-DR) memiliki sensitivitas 87,2% dan spesifisitas 90,7%, dengan akurasi yang setara dengan pembacaan oleh dokter spesialis mata²⁾. AI untuk retinopati prematuritas (ROP) (i-ROP DL) juga mencapai sensitivitas 91% dan spesifisitas 91%⁵⁾. Sementara itu, pada evaluasi pengetahuan oftalmologi chatbot AI (ChatGPT-4), tingkat jawaban benar keseluruhan sebesar 70%, dan pada bidang neuro-oftalmologi lebih rendah, yaitu 58%³⁾. Dalam semua kasus, AI hanyalah alat bantu, dan bila ditemukan kelainan, diperlukan pemeriksaan detail oleh spesialis mata.

4. Efektivitas biaya dan ekonomi kesehatan

Bukti tentang efektivitas biaya skrining mata berbantuan AI telah terakumulasi dalam berbagai studi¹⁾.

Skrining retinopati diabetik (DR)

Dalam tinjauan sistematis Wu dkk. (2021), 11 dari 15 studi yang menilai ekonomi skrining DR berbasis AI menyatakan bahwa metode ini efektif dari sisi biaya¹⁾.

NHS Skotlandia: penghematan tahunan $403,200
Amerika Serikat (IDx-DR/EyeArt): pengurangan biaya 23.3% per pasien
Pedesaan Tiongkok: skrining AI lebih murah $34.86 dibanding penilai manusia dan meningkatkan QALY sebesar 0.04

Wilayah/setting	Penilaian efektivitas biaya	Sumber
NHS Skotlandia	Penghematan tahunan $403,200	Wu 2021¹⁾
Perawatan primer AS	Pengurangan biaya 23.3% per pasien	Wu 2021¹⁾
wilayah pedesaan Tiongkok	lebih murah $34.86 daripada penilai manusia, +0.04 QALY	Wu 2021¹⁾
Jepang (AMD, Tamura et al. 2022)	ICER $99,283/QALY (di atas ambang batas)	Wu 2021¹⁾

Skrining retinopati prematuritas (ROP)

Skrining AI otonom dilaporkan paling cost-effective dibandingkan telemedisin, pemeriksaan fundus, dan AI bantu¹⁾. Pada ambang kemauan membayar sebesar $7, metode ini dinilai cost-effective dibandingkan skrining berbantuan¹⁾.

Skrining AMD (degenerasi makula terkait usia)

Dalam simulasi kohort Jepang (500,000 orang berusia 40 tahun ke atas, prevalensi 3.85%), ICER untuk skrining AI setiap 3 tahun adalah $99,283/QALY ($92,890-$99,283)¹⁾. Angka ini melampaui ambang kemauan membayar Jepang (sekitar $47,286/QALY), sehingga saat ini cost-effectiveness skrining AMD masih diragukan¹⁾. Namun, perbaikan di masa depan mungkin terjadi seiring kemajuan teknologi AI dan penurunan biaya.

5. Tantangan dan keterbatasan

Tantangan teknis

Bias data pelatihan: pada data pelatihan yang condong ke ras atau kelompok usia tertentu, akurasi menurun pada kelompok lain¹⁾
Ketergantungan pada kualitas gambar: kualitas foto fundus (ada tidaknya dilatasi pupil, kekeruhan media, dan kondisi pemotretan) secara langsung memengaruhi akurasi AI
Kesulitan menangani penyakit langka: pada penyakit dengan data pelatihan yang sedikit, akurasi yang memadai tidak dapat dicapai
Masalah kotak hitam: dasar keputusan AI tidak transparan sehingga dokter sulit memenuhi akuntabilitas¹⁾
Akurasi rendah pada neurooftalmologi: tingkat jawaban benar ChatGPT-4 di neurooftalmologi hanya 58%, yang terendah, dan memiliki keterbatasan dalam menafsirkan gangguan saraf optik yang kompleks³⁾

Tantangan etika dan regulasi

Berikut adalah tantangan etis dan hukum AI di bidang oftalmologi¹⁾.

Privasi pasien dan keamanan data: penyusunan aturan untuk pengelolaan cloud dan berbagi internasional gambar fundus
Tanggung jawab saat salah diagnosis: jika AI salah mendiagnosis, apakah tanggung jawab ada pada dokter atau produsen AI
Proses regulasi dan persetujuan: sistem penilaian yang tepat untuk perangkat medis AI di bawah FDA (AS), Undang-Undang Produk Farmasi dan Alat Kesehatan (Jepang), dan lain-lain
Memastikan explainability: pentingnya menampilkan dasar keputusan AI dalam bentuk yang dapat dipahami oleh dokter dan pasien

Tantangan ekonomi kesehatan

Biaya implementasi awal (perangkat keras, perangkat lunak, dan pelatihan staf) dapat tinggi¹⁾
Perbedaan efektivitas biaya antara negara berpendapatan rendah dan berpendapatan tinggi sangat besar¹⁾
Sistem penggantian biaya oleh asuransi sedang dikembangkan di प्रत्येक negara, dan implementasi di Jepang masih dalam tahap berkembang

Q Apakah diagnosis mata dengan AI aman?

Sistem yang disetujui oleh lembaga regulasi seperti FDA (seperti IDx-DR) telah melalui uji klinis yang ketat dan tingkat keamanan tertentu telah dikonfirmasi²⁾. Namun, diagnosis AI adalah alat bantu, dan diagnosis akhir serta rencana pengobatan harus ditentukan oleh dokter spesialis mata. Pasien tidak disarankan melakukan diagnosis mandiri hanya dengan chatbot AI (seperti ChatGPT). Akurasi AI dapat menurun pada kualitas gambar yang buruk, penyakit langka, dan bidang neuro-oftalmologi³⁾, sehingga jika dicurigai ada kelainan, penting untuk segera memeriksakan diri ke dokter mata.

6. Dasar teknis: cara kerja deep learning

Gambar dengan peta panas Grad-CAM yang ditumpangkan pada foto fundus. Area yang menjadi perhatian AI ditunjukkan dengan skala warna untuk tiga kategori: mata normal, dugaan glaukoma, dan dugaan retinopati diabetik

Arias-Serrano I, et al. Artificial intelligence based glaucoma and diabetic retinopathy detection using MATLAB — retrained AlexNet convolutional neural network. F1000Research. 2024;12:14. Figure 8. PMCID: PMC11143403. License: CC BY.

Gambar perbandingan yang menampilkan peta panas Grad-CAM dari AlexNet, ResNet50, dan GoogLeNet yang ditumpangkan pada foto fundus (kolom kiri) dari mata normal (Non_D), dugaan glaukoma (Sus_G), dan dugaan retinopati diabetik (Sus_R). Merah hingga kuning menunjukkan perhatian yang lebih tinggi, dan biru menunjukkan perhatian yang lebih rendah. Pada kasus glaukoma, aktivasi kuat terlihat di sekitar papil saraf optik, sedangkan pada kasus retinopati diabetik, aktivasi kuat terlihat di area makula hingga kutub posterior. Ini sesuai dengan teknik visualisasi Grad-CAM dan jaringan saraf konvolusional yang dibahas pada bagian “Dasar teknis: cara kerja deep learning”.

Jaringan Saraf Konvolusional (CNN)

Jaringan saraf konvolusional (CNN: Convolutional Neural Network) adalah teknologi inti diagnosis AI di bidang oftalmologi.

Secara otomatis mengekstrak fitur secara bertingkat dari gambar fundus dan gambar OCT yang dimasukkan
Lapisan dangkal mengenali fitur tingkat rendah seperti kontur dan warna, sedangkan lapisan yang lebih dalam mengenali fitur abstrak seperti pola pembuluh darah, perdarahan, edema, dan bentuk papil saraf optik
Belajar berulang kali dengan data pelatihan dalam jumlah besar (gambar acuan yang diberi label oleh dokter spesialis)

Proses pembelajaran AI

Pengumpulan data: Pengumpulan besar-besaran foto fundus, OCT, dan data pemeriksaan lapang pandang
Anotasi: Dokter spesialis mata memberi label acuan (stadium dan temuan) pada setiap gambar
Pelatihan dan optimalisasi: Menyesuaikan parameter jaringan berulang kali agar mendekati jawaban yang benar
Validasi dan uji klinis: Evaluasi kinerja pada kohort eksternal dan uji percontohan di praktik klinis nyata

Transfer learning (menerapkan model yang telah dilatih dari domain lain seperti ImageNet ke gambar oftalmologi) banyak digunakan sebagai metode untuk mencapai akurasi tinggi bahkan saat data pelatihan terbatas.

Penelitian juga terus berkembang pada pembuatan gambar sintetis dengan GAN (jaringan adversarial generatif) untuk memperluas data pelatihan penyakit langka secara artifisial.

AI multimodal

AI multimodal yang memproses teks (informasi anamnesis) dan gambar (foto fundus dan OCT) secara bersamaan mulai diterapkan di bidang oftalmologi seiring berkembangnya model bahasa besar (seperti GPT-4)³⁾. Meskipun dapat menggabungkan informasi yang lebih beragam dibandingkan CNN satu moda, kemampuan menafsirkan gambarnya masih lebih lemah dibandingkan pemahaman teks³⁾.

7. Riset terkini dan prospek ke depan

Prediksi penyakit sistemik dari foto fundus

Analisis foto fundus dengan pembelajaran mendalam menunjukkan bahwa faktor risiko sistemik seperti usia, jenis kelamin, tekanan darah sistolik, riwayat merokok, dan HbA1c mungkin dapat diprediksi hanya dari foto fundus⁶⁾. Dalam prediksi risiko kejadian kardiovaskular di masa depan (infark miokard dan stroke) juga dilaporkan tingkat akurasi tertentu, sehingga kemungkinan bahwa foto fundus dapat menjadi jendela untuk melihat status kesehatan secara keseluruhan mendapat perhatian. AI untuk memprediksi demensia, penyakit ginjal, dan anemia juga masih dalam tahap penelitian⁶⁾.

Integrasi dengan kamera fundus smartphone

Dengan fotografi fundus menggunakan lensa kecil yang dipasang pada smartphone dan analisis AI, telah ditunjukkan bahwa skrining DR pada pasien diabetes di India dapat dilakukan secara praktis⁷⁾. Baik sensitivitas maupun spesifisitasnya setara dengan kamera fundus khusus, dan skrining AI yang dikombinasikan dengan perangkat serbaguna berbiaya rendah dapat membantu penyebarannya di negara berkembang dan daerah pedesaan.

Perpaduan AI dan telemedisin

Dengan mengintegrasikan skrining AI dan telemedisin, perbaikan akses oftalmologi di daerah terpencil dan negara berkembang diharapkan dapat tercapai. Bahkan di fasilitas tanpa dokter spesialis mata, AI dapat melakukan skrining awal dan hanya mengirim kasus positif untuk ditinjau jarak jauh oleh spesialis, sehingga sumber daya medis dapat digunakan lebih efisien.

Pemanfaatan dalam kedokteran personal

Penelitian sedang berkembang pada AI yang dapat memprediksi terlebih dahulu respons terapi anti-VEGF (ranibizumab, aflibercept, faricimab, dll.) dan mengusulkan rencana pemberian obat yang paling sesuai bagi masing-masing pasien. Model yang memprediksi efek terapi dari citra OCT dapat membantu mengurangi jumlah suntikan dan memperbaiki prognosis penglihatan.

Pemanfaatan AI generatif untuk edukasi pasien dan bantuan anamnesis

Model bahasa besar (seperti GPT-4) sedang diteliti untuk penggunaan seperti menjelaskan penyakit kepada pasien, menyiapkan dokumen persetujuan tindakan, dan membantu anamnesis³⁾. Namun, pencegahan kesalahan dan bias pada informasi medis serta menjaga hubungan dokter-pasien masih menjadi tantangan. Pasien tidak dianjurkan mengambil keputusan diagnosis diri atau pengobatan mandiri hanya berdasarkan chatbot³⁾.

8. Referensi

Wu JH, Liu TYA, Hsu WT, et al. Performance and limitation of machine learning algorithms for diabetic retinopathy screening: meta-analysis. J Med Internet Res. 2021;23(11):e23863.
Abràmoff MD, Lavin PT, Birch M, Shah N, Folk JC. Pivotal trial of an autonomous AI-based diagnostic system for detection of diabetic retinopathy in primary care offices. NPJ digital medicine. 2018;1:39. doi:10.1038/s41746-018-0040-6. PMID:31304320; PMCID:PMC6550188.
Mihalache A, Popovic MM, Guo MZ, et al. Performance of an upgraded artificial intelligence chatbot for ophthalmic knowledge assessment. JAMA Ophthalmol. 2024;142(3):234-241.
Olvera-Barrios A, Heeren TF, Balaskas K, et al. Diagnostic accuracy of diabetic retinopathy grading by an artificial intelligence-enabled algorithm compared with a human standard reference. Diabetologia. 2023;66(5):857-866.
Brown JM, Campbell JP, Beers A, et al. Automated diagnosis of plus disease in retinopathy of prematurity using deep convolutional neural networks. JAMA Ophthalmol. 2018;136(7):803-810.
Poplin R, Varadarajan AV, Blumer K, Liu Y, McConnell MV, Corrado GS, et al. Prediction of cardiovascular risk factors from retinal fundus photographs via deep learning. Nature biomedical engineering. 2018;2(3):158-164. doi:10.1038/s41551-018-0195-0. PMID:31015713.
Rajalakshmi R, Subashini R, Anjana RM, et al. Automated diabetic retinopathy detection in smartphone-based fundus photography using artificial intelligence. Eye. 2018;32(6):1138-1144.
Ting DSW, Cheung CY, Lim G, Tan GSW, Quang ND, Gan A, et al. Development and Validation of a Deep Learning System for Diabetic Retinopathy and Related Eye Diseases Using Retinal Images From Multiethnic Populations With Diabetes. JAMA. 2017;318(22):2211-2223. doi:10.1001/jama.2017.18152. PMID:29234807; PMCID:PMC5820739.