IDx-DR (disetujui FDA pada 2018)
Penyakit target: retinopati diabetik
Akurasi: sensitivitas 87,2%, spesifisitas 90,7%
Fitur: sepenuhnya otonom. Dapat dioperasikan oleh non-dokter mata. Digunakan di bidang penyakit dalam dan perawatan primer2)
AI (kecerdasan buatan) adalah istilah umum untuk sistem pembelajaran mesin yang meniru kecerdasan manusia. Deep learning (DL) adalah subkelompok AI yang menggunakan jaringan saraf berlapis banyak untuk mengekstrak fitur tingkat lanjut dan membuat penilaian yang kompleks1).
Oftalmologi adalah salah satu bidang medis yang paling maju dalam penerapan AI. Foto fundus, OCT (optical coherence tomography), pemeriksaan lapang pandang, dan data gambar lainnya sudah terstandar, sehingga lebih mudah memperoleh data pelatihan dalam jumlah besar. Tujuan utama penerapan AI adalah tiga hal berikut.
Pada tahun 2018, FDA menyetujui sistem diagnosis AI pertama yang sepenuhnya otonom (IDx-DR), sehingga mempercepat penerapan praktis diagnosis AI di oftalmologi2). IDx-DR dapat dioperasikan oleh staf non-spesialis mata di layanan penyakit dalam dan perawatan primer, dan secara otomatis menentukan apakah perlu merujuk ke dokter spesialis mata2).
Sistem deep learning telah menunjukkan akurasi yang sebanding dengan dokter spesialis dalam mendeteksi retinopati diabetik, glaukoma, dan AMD, dan potensi diagnosis AI menggunakan foto fundus telah ditunjukkan8).
AI secara otomatis menganalisis gambar dari foto fundus dan OCT untuk mendeteksi penyakit seperti retinopati diabetik, glaukoma, dan degenerasi makula terkait usia. AI skrining (sepenuhnya otonom) dapat dioperasikan oleh non-dokter mata dan digunakan untuk skrining awal di daerah yang kekurangan spesialis. Selain itu, penggunaan chatbot AI (seperti GPT-4) untuk menilai pengetahuan oftalmologi dan edukasi pasien juga sedang diteliti3). Diagnosis akhir ditempatkan sebagai alat bantu yang digunakan oleh spesialis oftalmologi.
AI oftalmologi secara garis besar dibagi menjadi tiga jenis berikut berdasarkan fungsi dan tingkat otonominya.
AI skrining (sepenuhnya otonom)
AI ini secara otomatis menganalisis foto fundus dan menentukan apakah rujukan tidak diperlukan atau diperlukan. AI ini dapat beroperasi bahkan tanpa spesialis oftalmologi, dan diterapkan pada penyakit berikut2).
AI pendukung diagnosis (semiotonom)
Merupakan sistem yang membantu dokter dalam interpretasi gambar. Sistem ini digunakan untuk klasifikasi tipe AMD melalui segmentasi otomatis struktur lapisan OCT, serta penilaian tingkat keparahan edema makula diabetik (DME).
Chatbot AI (multimodal)
Ini adalah penerapan model bahasa besar yang menganalisis teks (informasi anamnesis) dan gambar (foto fundus dan OCT) secara bersamaan. Kemampuan pengetahuan oftalmologi dan interpretasi gambar ChatGPT-4 telah dievaluasi, dan pemanfaatannya untuk edukasi pasien serta anamnesis jarak jauh sedang dipertimbangkan3).
| Jenis AI | Sistem perwakilan | Target | Metrik akurasi |
|---|---|---|---|
| AI skrining (otonom) | IDx-DR2) | Retinopati diabetik | Sensitivitas 87,2%, spesifisitas 90,7% |
| AI skrining (otonom) | i-ROP DL5) | ROP | Sensitivitas 91%, spesifisitas 91% |
| AI skrining (otonom) | EyeArt4) | retinopati diabetik | Dievaluasi dan digunakan di NHS Inggris |
| chatbot AI | ChatGPT-43) | penilaian pengetahuan oftalmologi | akurasi keseluruhan 70% |
2) adalah sistem diagnosis AI sepenuhnya otonom pertama yang disetujui FDA pada tahun 2018. Petugas non-dokter mata mengambil gambar dengan kamera fundus tanpa dilatasi, lalu AI menganalisisnya secara otomatis dan menentukan apakah perlu rujukan. Sistem ini mulai diterapkan di fasilitas layanan primer.
Indikator kinerja utama (uji pivotal Abràmoff dkk. tahun 2018)2):
IDx-DR memungkinkan skrining DR secara otonom di fasilitas penyakit dalam dan layanan primer, sehingga kasus yang perlu dirujuk ke dokter spesialis mata dapat diseleksi dengan efisien2).
Akurasi GPT-4 pada soal pilihan ganda oftalmologi telah dievaluasi3), dan akurasi keseluruhannya adalah 70%.
| Bidang | Tingkat akurasi |
|---|---|
| Retina | 77% (tertinggi)3) |
| Tumor mata | 72%3) |
| Oftalmologi anak | 68%3) |
| Uveitis | 67%3) |
| Glaukoma | 61%3) |
| Neuro-oftalmologi | 58% (terendah)3) |
Perbedaan ini menunjukkan bahwa kemampuan chatbot dalam menafsirkan gambar masih lebih rendah daripada pemahaman teks yang tidak berbasis gambar. Telah dicatat bahwa integrasi chatbot multimodal yang tepat di lingkungan klinis sangat penting3).
IDx-DR (disetujui FDA pada 2018)
Penyakit target: retinopati diabetik
Akurasi: sensitivitas 87,2%, spesifisitas 90,7%
Fitur: sepenuhnya otonom. Dapat dioperasikan oleh non-dokter mata. Digunakan di bidang penyakit dalam dan perawatan primer2)
EyeArt (Eyenuk)
Penyakit target: retinopati diabetik
Akurasi: telah dievaluasi dan digunakan secara praktis di NHS Inggris
Fitur: telah terintegrasi ke dalam program skrining4)
i-ROP DL (2018)
Penyakit target: retinopati prematuritas (ROP)
Akurasi: sensitivitas 91%, spesifisitas 91%
Fitur: deteksi otomatis penyakit plus di NICU5)
ChatGPT-4 (OpenAI)
Objek: penilaian pengetahuan oftalmologi dan interpretasi gambar
Akurasi: tingkat jawaban benar keseluruhan 70% (retina 77%, neuro-oftalmologi 58%)
Fitur: tahap penelitian untuk penerapan pada edukasi pasien dan konsultasi jarak jauh3)
AI skrining retinopati diabetik (IDx-DR) memiliki sensitivitas 87,2% dan spesifisitas 90,7%, dengan akurasi yang setara dengan pembacaan oleh dokter spesialis mata2). AI untuk retinopati prematuritas (ROP) (i-ROP DL) juga mencapai sensitivitas 91% dan spesifisitas 91%5). Sementara itu, pada evaluasi pengetahuan oftalmologi chatbot AI (ChatGPT-4), tingkat jawaban benar keseluruhan sebesar 70%, dan pada bidang neuro-oftalmologi lebih rendah, yaitu 58%3). Dalam semua kasus, AI hanyalah alat bantu, dan bila ditemukan kelainan, diperlukan pemeriksaan detail oleh spesialis mata.
Bukti tentang efektivitas biaya skrining mata berbantuan AI telah terakumulasi dalam berbagai studi1).
Dalam tinjauan sistematis Wu dkk. (2021), 11 dari 15 studi yang menilai ekonomi skrining DR berbasis AI menyatakan bahwa metode ini efektif dari sisi biaya1).
| Wilayah/setting | Penilaian efektivitas biaya | Sumber |
|---|---|---|
| NHS Skotlandia | Penghematan tahunan $403,200 | Wu 20211) |
| Perawatan primer AS | Pengurangan biaya 23.3% per pasien | Wu 20211) |
| wilayah pedesaan Tiongkok | lebih murah $34.86 daripada penilai manusia, +0.04 QALY | Wu 20211) |
| Jepang (AMD, Tamura et al. 2022) | ICER $99,283/QALY (di atas ambang batas) | Wu 20211) |
Skrining AI otonom dilaporkan paling cost-effective dibandingkan telemedisin, pemeriksaan fundus, dan AI bantu1). Pada ambang kemauan membayar sebesar $7, metode ini dinilai cost-effective dibandingkan skrining berbantuan1).
Dalam simulasi kohort Jepang (500,000 orang berusia 40 tahun ke atas, prevalensi 3.85%), ICER untuk skrining AI setiap 3 tahun adalah $99,283/QALY ($92,890-$99,283)1). Angka ini melampaui ambang kemauan membayar Jepang (sekitar $47,286/QALY), sehingga saat ini cost-effectiveness skrining AMD masih diragukan1). Namun, perbaikan di masa depan mungkin terjadi seiring kemajuan teknologi AI dan penurunan biaya.
Berikut adalah tantangan etis dan hukum AI di bidang oftalmologi1).
Sistem yang disetujui oleh lembaga regulasi seperti FDA (seperti IDx-DR) telah melalui uji klinis yang ketat dan tingkat keamanan tertentu telah dikonfirmasi2). Namun, diagnosis AI adalah alat bantu, dan diagnosis akhir serta rencana pengobatan harus ditentukan oleh dokter spesialis mata. Pasien tidak disarankan melakukan diagnosis mandiri hanya dengan chatbot AI (seperti ChatGPT). Akurasi AI dapat menurun pada kualitas gambar yang buruk, penyakit langka, dan bidang neuro-oftalmologi3), sehingga jika dicurigai ada kelainan, penting untuk segera memeriksakan diri ke dokter mata.

Jaringan saraf konvolusional (CNN: Convolutional Neural Network) adalah teknologi inti diagnosis AI di bidang oftalmologi.
Transfer learning (menerapkan model yang telah dilatih dari domain lain seperti ImageNet ke gambar oftalmologi) banyak digunakan sebagai metode untuk mencapai akurasi tinggi bahkan saat data pelatihan terbatas.
Penelitian juga terus berkembang pada pembuatan gambar sintetis dengan GAN (jaringan adversarial generatif) untuk memperluas data pelatihan penyakit langka secara artifisial.
AI multimodal yang memproses teks (informasi anamnesis) dan gambar (foto fundus dan OCT) secara bersamaan mulai diterapkan di bidang oftalmologi seiring berkembangnya model bahasa besar (seperti GPT-4)3). Meskipun dapat menggabungkan informasi yang lebih beragam dibandingkan CNN satu moda, kemampuan menafsirkan gambarnya masih lebih lemah dibandingkan pemahaman teks3).
Analisis foto fundus dengan pembelajaran mendalam menunjukkan bahwa faktor risiko sistemik seperti usia, jenis kelamin, tekanan darah sistolik, riwayat merokok, dan HbA1c mungkin dapat diprediksi hanya dari foto fundus6). Dalam prediksi risiko kejadian kardiovaskular di masa depan (infark miokard dan stroke) juga dilaporkan tingkat akurasi tertentu, sehingga kemungkinan bahwa foto fundus dapat menjadi jendela untuk melihat status kesehatan secara keseluruhan mendapat perhatian. AI untuk memprediksi demensia, penyakit ginjal, dan anemia juga masih dalam tahap penelitian6).
Dengan fotografi fundus menggunakan lensa kecil yang dipasang pada smartphone dan analisis AI, telah ditunjukkan bahwa skrining DR pada pasien diabetes di India dapat dilakukan secara praktis7). Baik sensitivitas maupun spesifisitasnya setara dengan kamera fundus khusus, dan skrining AI yang dikombinasikan dengan perangkat serbaguna berbiaya rendah dapat membantu penyebarannya di negara berkembang dan daerah pedesaan.
Dengan mengintegrasikan skrining AI dan telemedisin, perbaikan akses oftalmologi di daerah terpencil dan negara berkembang diharapkan dapat tercapai. Bahkan di fasilitas tanpa dokter spesialis mata, AI dapat melakukan skrining awal dan hanya mengirim kasus positif untuk ditinjau jarak jauh oleh spesialis, sehingga sumber daya medis dapat digunakan lebih efisien.
Penelitian sedang berkembang pada AI yang dapat memprediksi terlebih dahulu respons terapi anti-VEGF (ranibizumab, aflibercept, faricimab, dll.) dan mengusulkan rencana pemberian obat yang paling sesuai bagi masing-masing pasien. Model yang memprediksi efek terapi dari citra OCT dapat membantu mengurangi jumlah suntikan dan memperbaiki prognosis penglihatan.
Model bahasa besar (seperti GPT-4) sedang diteliti untuk penggunaan seperti menjelaskan penyakit kepada pasien, menyiapkan dokumen persetujuan tindakan, dan membantu anamnesis3). Namun, pencegahan kesalahan dan bias pada informasi medis serta menjaga hubungan dokter-pasien masih menjadi tantangan. Pasien tidak dianjurkan mengambil keputusan diagnosis diri atau pengobatan mandiri hanya berdasarkan chatbot3).
Wu JH, Liu TYA, Hsu WT, et al. Performance and limitation of machine learning algorithms for diabetic retinopathy screening: meta-analysis. J Med Internet Res. 2021;23(11):e23863.
Abràmoff MD, Lavin PT, Birch M, Shah N, Folk JC. Pivotal trial of an autonomous AI-based diagnostic system for detection of diabetic retinopathy in primary care offices. NPJ digital medicine. 2018;1:39. doi:10.1038/s41746-018-0040-6. PMID:31304320; PMCID:PMC6550188.
Mihalache A, Popovic MM, Guo MZ, et al. Performance of an upgraded artificial intelligence chatbot for ophthalmic knowledge assessment. JAMA Ophthalmol. 2024;142(3):234-241.
Olvera-Barrios A, Heeren TF, Balaskas K, et al. Diagnostic accuracy of diabetic retinopathy grading by an artificial intelligence-enabled algorithm compared with a human standard reference. Diabetologia. 2023;66(5):857-866.
Brown JM, Campbell JP, Beers A, et al. Automated diagnosis of plus disease in retinopathy of prematurity using deep convolutional neural networks. JAMA Ophthalmol. 2018;136(7):803-810.
Poplin R, Varadarajan AV, Blumer K, Liu Y, McConnell MV, Corrado GS, et al. Prediction of cardiovascular risk factors from retinal fundus photographs via deep learning. Nature biomedical engineering. 2018;2(3):158-164. doi:10.1038/s41551-018-0195-0. PMID:31015713.
Rajalakshmi R, Subashini R, Anjana RM, et al. Automated diabetic retinopathy detection in smartphone-based fundus photography using artificial intelligence. Eye. 2018;32(6):1138-1144.
Ting DSW, Cheung CY, Lim G, Tan GSW, Quang ND, Gan A, et al. Development and Validation of a Deep Learning System for Diabetic Retinopathy and Related Eye Diseases Using Retinal Images From Multiethnic Populations With Diabetes. JAMA. 2017;318(22):2211-2223. doi:10.1001/jama.2017.18152. PMID:29234807; PMCID:PMC5820739.