AI (trí tuệ nhân tạo) là thuật ngữ chung cho các hệ thống học máy mô phỏng trí tuệ con người. Học sâu (DL) là một nhánh của AI, sử dụng mạng nơ-ron nhiều lớp để trích xuất đặc trưng nâng cao và đưa ra các đánh giá phức tạp1).
Nhãn khoa là một trong những lĩnh vực y học ứng dụng AI tiến triển nhất. Ảnh đáy mắt, OCT (chụp cắt lớp kết hợp quang học), kiểm tra thị trường và các dữ liệu hình ảnh khác đều đã được chuẩn hóa, nên dễ thu thập lượng lớn dữ liệu huấn luyện. Mục đích ứng dụng chính của AI gồm 3 điểm sau.
Nâng cao hiệu quả sàng lọc (giảm gánh nặng đọc phim cho bác sĩ chuyên khoa mắt)
Cải thiện khả năng tiếp cận ở những khu vực thiếu bác sĩ chuyên khoa
Chuẩn hóa độ chính xác chẩn đoán (thu hẹp khác biệt giữa các cơ sở)
Năm 2018, FDA đã phê duyệt hệ thống chẩn đoán AI tự động hoàn toàn đầu tiên (IDx-DR), thúc đẩy việc ứng dụng thực tế chẩn đoán AI trong nhãn khoa2). IDx-DR có thể được vận hành bởi nhân viên không phải bác sĩ mắt trong nội khoa và chăm sóc ban đầu, và tự động xác định có cần chuyển đến bác sĩ chuyên khoa mắt hay không2).
Các hệ thống học sâu đã cho thấy độ chính xác tương đương với chuyên gia trong việc phát hiện bệnh võng mạc đái tháo đường, glôcôm và AMD, và tiềm năng chẩn đoán AI bằng ảnh đáy mắt đã được chứng minh8).
QAI được dùng như thế nào trong nhãn khoa?
A
AI tự động phân tích hình ảnh từ ảnh đáy mắt và OCT để phát hiện các bệnh như bệnh võng mạc đái tháo đường, glôcôm và thoái hóa điểm vàng do tuổi tác. AI sàng lọc (hoàn toàn tự chủ) có thể do người không phải bác sĩ nhãn khoa vận hành và được dùng để sàng lọc ban đầu ở những khu vực thiếu chuyên gia. Nghiên cứu cũng đang xem xét việc dùng chatbot AI (như GPT-4) để đánh giá kiến thức nhãn khoa và giáo dục bệnh nhân3). Chẩn đoán cuối cùng được xem là một công cụ hỗ trợ do bác sĩ nhãn khoa thực hiện.
AI nhãn khoa được chia rộng thành ba loại sau đây tùy theo chức năng và mức độ tự chủ.
AI sàng lọc (hoàn toàn tự chủ)
AI này tự động phân tích ảnh đáy mắt và quyết định xem có cần chuyển tuyến hay không. Nó có thể hoạt động ngay cả khi không có bác sĩ nhãn khoa và được áp dụng cho các bệnh sau đây2).
Bệnh võng mạc đái tháo đường (DR): được nghiên cứu và triển khai nhiều nhất
Thoái hóa điểm vàng do tuổi tác (AMD): phát hiện drusen và tân mạch
Glôcôm: phân tích tự động đĩa thị và lớp sợi thần kinh
Bệnh võng mạc ở trẻ sinh non (ROP): sàng lọc trẻ sơ sinh tại NICU
Đây là hệ thống hỗ trợ bác sĩ đọc ảnh. Hệ thống này được dùng để phân loại kiểu AMD thông qua phân đoạn tự động cấu trúc lớp của OCT, cũng như đánh giá mức độ nặng của phù hoàng điểm do đái tháo đường (DME).
Chatbot AI (đa phương thức)
Đây là ứng dụng của mô hình ngôn ngữ lớn có thể phân tích đồng thời văn bản (thông tin khai thác bệnh sử) và hình ảnh (ảnh đáy mắt và OCT). Khả năng kiến thức nhãn khoa và giải thích hình ảnh của ChatGPT-4 đã được đánh giá, và việc ứng dụng cho giáo dục bệnh nhân và khai thác bệnh sử từ xa đang được xem xét3).
2) là hệ thống chẩn đoán AI hoàn toàn tự động đầu tiên được FDA chấp thuận vào năm 2018. Nhân viên không phải bác sĩ nhãn khoa chụp ảnh bằng máy chụp đáy mắt không giãn đồng tử, và AI tự động phân tích rồi quyết định có cần chuyển khám hay không. Hệ thống này đang được triển khai tại các cơ sở chăm sóc ban đầu.
Các chỉ số hiệu năng chính (thử nghiệm then chốt của Abràmoff và cộng sự năm 2018)2):
Độ nhạy: 87,2% (phát hiện bệnh võng mạc đái tháo đường mức độ vừa trở lên)
Độ đặc hiệu: 90,7%
Giá trị dự đoán dương: 49,7%, giá trị dự đoán âm: 98,5%
IDx-DR đã giúp sàng lọc DR tự động tại các cơ sở nội khoa và chăm sóc ban đầu, đồng thời có thể chọn lọc hiệu quả các trường hợp cần chuyển đến bác sĩ chuyên khoa mắt2).
Diễn giải hình ảnh nhãn khoa bằng chatbot AI (ChatGPT-4)
Độ chính xác của GPT-4 trong các câu hỏi trắc nghiệm nhãn khoa đã được đánh giá3), với độ chính xác chung là 70%.
Độ chính xác chung: 70% (299/428 câu)
Xếp hạng độ chính xác theo lĩnh vực:
Lĩnh vực
Độ chính xác
võng mạc
77% (cao nhất)3)
U mắt
72%3)
Nhãn khoa nhi
68%3)
Viêm màng bồ đào
67%3)
Glôcôm
61%3)
Nhãn khoa thần kinh
58% (thấp nhất)3)
Câu hỏi dựa trên hình ảnh: 65%, câu hỏi không dựa trên hình ảnh: 82% (chênh lệch 17%, P < .001)3)
Sự khác biệt này cho thấy khả năng diễn giải hình ảnh của chatbot vẫn kém hơn khả năng hiểu văn bản không dựa trên hình ảnh. Người ta đã chỉ ra rằng việc tích hợp đúng cách các chatbot đa phương thức trong môi trường lâm sàng là rất quan trọng3).
IDx-DR (được FDA chấp thuận năm 2018)
Bệnh mục tiêu: bệnh võng mạc đái tháo đường
Độ chính xác: độ nhạy 87,2%, độ đặc hiệu 90,7%
Đặc điểm: hoàn toàn tự động. Người không phải bác sĩ nhãn khoa có thể vận hành. Được sử dụng trong nội khoa và chăm sóc ban đầu2)
EyeArt (Eyenuk)
Bệnh mục tiêu: bệnh võng mạc đái tháo đường
Độ chính xác: đã được đánh giá và đưa vào sử dụng thực tế trong NHS của Vương quốc Anh
Đặc điểm: đã được tích hợp vào các chương trình sàng lọc4)
Đối tượng: đánh giá kiến thức nhãn khoa và diễn giải hình ảnh
Độ chính xác: tỷ lệ trả lời đúng chung 70% (võng mạc 77%, thần kinh-nhãn khoa 58%)
Đặc điểm: đang ở giai đoạn nghiên cứu để ứng dụng vào giáo dục bệnh nhân và tư vấn từ xa3)
QAI chẩn đoán bệnh mắt chính xác đến mức nào?
A
AI sàng lọc bệnh võng mạc đái tháo đường (IDx-DR) có độ nhạy 87,2% và độ đặc hiệu 90,7%, với độ chính xác tương đương việc đọc kết quả của bác sĩ chuyên khoa mắt2). AI dành cho bệnh võng mạc trẻ sinh non (ROP) (i-ROP DL) cũng đạt độ nhạy 91% và độ đặc hiệu 91%5). Trong khi đó, ở đánh giá kiến thức nhãn khoa của chatbot AI (ChatGPT-4), tỷ lệ trả lời đúng chung là 70%, và thấp hơn ở lĩnh vực thần kinh-nhãn khoa, chỉ 58%3). Trong mọi trường hợp, AI chỉ là công cụ hỗ trợ, và nếu phát hiện bất thường, cần khám chuyên sâu bởi bác sĩ chuyên khoa mắt.
Trong tổng quan hệ thống của Wu và cộng sự (2021), 11 trong số 15 nghiên cứu đánh giá kinh tế của sàng lọc DR bằng AI cho thấy phương pháp này có hiệu quả chi phí1).
NHS Scotland: tiết kiệm hằng năm $403,200
Hoa Kỳ (IDx-DR/EyeArt): giảm chi phí 23.3% cho mỗi bệnh nhân
Nông thôn Trung Quốc: sàng lọc bằng AI rẻ hơn $34.86 so với người đọc thủ công và cải thiện QALY thêm 0.04
Khu vực/bối cảnh
Đánh giá hiệu quả chi phí
Nguồn
NHS Scotland
Tiết kiệm hằng năm $403,200
Wu 20211)
Chăm sóc ban đầu ở Hoa Kỳ
Giảm chi phí 23.3% cho mỗi bệnh nhân
Wu 20211)
nông thôn Trung Quốc
rẻ hơn $34.86 so với người chấm điểm thủ công, +0.04 QALY
Sàng lọc AI tự động được báo cáo là có hiệu quả chi phí cao nhất so với y tế từ xa, khám đáy mắt và AI hỗ trợ1). Ở ngưỡng sẵn sàng chi trả $7, phương pháp này được cho là có hiệu quả chi phí so với sàng lọc hỗ trợ1).
Trong mô phỏng đoàn hệ ở Nhật Bản (500,000 người từ 40 tuổi trở lên, tỷ lệ hiện mắc 3.85%), ICER của sàng lọc AI mỗi 3 năm là $99,283/QALY ($92,890-$99,283)1). Con số này vượt ngưỡng sẵn sàng chi trả của Nhật Bản (khoảng $47,286/QALY), nên hiện nay tính hiệu quả chi phí của sàng lọc AMD vẫn còn đáng ngờ1). Tuy nhiên, sự tiến bộ của công nghệ AI và chi phí giảm có thể giúp cải thiện trong tương lai.
Thiên lệch của dữ liệu huấn luyện: trong các bộ dữ liệu nghiêng về một số chủng tộc hoặc nhóm tuổi nhất định, độ chính xác giảm ở các nhóm khác1)
Phụ thuộc vào chất lượng hình ảnh: chất lượng ảnh đáy mắt (có giãn đồng tử hay không, đục môi trường và điều kiện chụp) ảnh hưởng trực tiếp đến độ chính xác của AI
Khó xử lý bệnh hiếm: với những bệnh có ít dữ liệu huấn luyện, không thể đạt được độ chính xác đủ cao
Vấn đề hộp đen: căn cứ quyết định của AI không minh bạch, khiến bác sĩ lâm sàng khó thực hiện trách nhiệm giải trình1)
Độ chính xác thấp trong nhãn khoa thần kinh: tỷ lệ trả lời đúng của ChatGPT-4 trong nhãn khoa thần kinh là 58%, thấp nhất, và có hạn chế trong việc diễn giải các bệnh lý phức tạp của dây thần kinh thị giác3)
Những vấn đề đạo đức và pháp lý của AI trong nhãn khoa được nêu dưới đây1).
Quyền riêng tư của bệnh nhân và bảo mật dữ liệu: xây dựng quy định về quản lý đám mây và chia sẻ quốc tế ảnh đáy mắt
Trách nhiệm khi chẩn đoán sai: trong trường hợp AI chẩn đoán sai, trách nhiệm thuộc về bác sĩ hay nhà sản xuất AI
Quy trình quản lý và phê duyệt: hệ thống đánh giá phù hợp cho thiết bị y tế AI theo FDA (Mỹ), Luật Dược phẩm và Thiết bị Y tế (Nhật Bản) và các quy định khác
Bảo đảm tính giải thích được (explainability): tầm quan trọng của việc trình bày căn cứ quyết định của AI theo cách bác sĩ lâm sàng và bệnh nhân có thể hiểu
Chi phí triển khai ban đầu (phần cứng, phần mềm và đào tạo nhân sự) có thể cao1)
Sự khác biệt về hiệu quả chi phí giữa các nước thu nhập thấp và thu nhập cao là rất lớn1)
Hệ thống chi trả bảo hiểm đang được xây dựng ở từng quốc gia, và việc triển khai tại Nhật Bản vẫn đang trong giai đoạn phát triển
QChẩn đoán mắt bằng AI có an toàn không?
A
Các hệ thống được cơ quan quản lý như FDA phê duyệt (như IDx-DR) đã trải qua các thử nghiệm lâm sàng nghiêm ngặt và đã xác nhận được mức độ an toàn nhất định2). Tuy nhiên, chẩn đoán bằng AI chỉ là công cụ hỗ trợ, và chẩn đoán cuối cùng cũng như kế hoạch điều trị phải do bác sĩ nhãn khoa quyết định. Không khuyến nghị người bệnh tự chẩn đoán chỉ bằng chatbot AI (như ChatGPT). Độ chính xác của AI có thể giảm khi chất lượng hình ảnh kém, bệnh hiếm gặp và trong lĩnh vực nhãn khoa thần kinh3), vì vậy nếu nghi ngờ có bất thường, điều quan trọng là đi khám mắt sớm.
Hình ảnh có bản đồ nhiệt Grad-CAM chồng lên ảnh đáy mắt. Các vùng mà AI tập trung được hiển thị bằng thang màu cho ba nhóm: mắt bình thường, nghi ngờ glaucoma và nghi ngờ bệnh võng mạc đái tháo đường
Arias-Serrano I, et al. Artificial intelligence based glaucoma and diabetic retinopathy detection using MATLAB — retrained AlexNet convolutional neural network. F1000Research. 2024;12:14. Figure 8. PMCID: PMC11143403. License: CC BY.
Hình so sánh cho thấy các bản đồ nhiệt Grad-CAM từ AlexNet, ResNet50 và GoogLeNet chồng lên ảnh đáy mắt (cột trái) của mắt bình thường (Non_D), nghi ngờ glaucoma (Sus_G) và nghi ngờ bệnh võng mạc đái tháo đường (Sus_R). Màu đỏ đến vàng cho thấy mức độ chú ý cao hơn, còn màu xanh cho thấy mức độ chú ý thấp hơn. Ở các trường hợp glaucoma, thấy hoạt hóa mạnh quanh gai thị, còn ở các trường hợp bệnh võng mạc đái tháo đường, thấy hoạt hóa mạnh ở vùng hoàng điểm đến cực sau. Điều này tương ứng với các kỹ thuật trực quan hóa Grad-CAM và mạng nơ-ron tích chập được đề cập trong phần “Nền tảng kỹ thuật: cách hoạt động của học sâu”.
Mạng nơ-ron tích chập (CNN: Convolutional Neural Network) là công nghệ cốt lõi của chẩn đoán nhãn khoa bằng AI.
Tự động trích xuất đặc trưng theo nhiều tầng từ ảnh đáy mắt và ảnh OCT đầu vào
Các lớp nông nhận biết các đặc trưng mức thấp như đường viền và màu sắc, còn các lớp sâu hơn nhận biết các đặc trưng trừu tượng như mẫu mạch máu, xuất huyết, phù nề và hình dạng gai thị
Học lặp đi lặp lại với lượng lớn dữ liệu huấn luyện (ảnh chuẩn do bác sĩ chuyên khoa gắn nhãn)
Thu thập dữ liệu: thu thập quy mô lớn ảnh đáy mắt, OCT và dữ liệu kiểm tra thị trường thị giác
Gán nhãn: bác sĩ chuyên khoa mắt gán nhãn chuẩn (giai đoạn và phát hiện) cho từng hình ảnh
Huấn luyện và tối ưu hóa: điều chỉnh lặp lại các tham số của mạng để tiến gần hơn đến đáp án đúng
Xác thực và thử nghiệm lâm sàng: đánh giá hiệu năng trên các đoàn hệ bên ngoài và thử nghiệm thí điểm trong thực hành lâm sàng thực tế
Học chuyển giao (áp dụng các mô hình đã huấn luyện sẵn từ các lĩnh vực khác như ImageNet cho ảnh nhãn khoa) được sử dụng rộng rãi như một cách đạt độ chính xác cao ngay cả khi dữ liệu huấn luyện còn hạn chế.
Nghiên cứu về tạo ảnh tổng hợp bằng GAN (mạng đối nghịch sinh) để mở rộng nhân tạo dữ liệu huấn luyện cho các bệnh hiếm cũng đang tiến triển.
AI đa phương thức xử lý đồng thời văn bản (thông tin khai thác bệnh sử) và hình ảnh (ảnh đáy mắt và OCT) đang được ứng dụng trong nhãn khoa cùng với sự phát triển của các mô hình ngôn ngữ lớn (như GPT-4)3). Mặc dù có thể tích hợp thông tin đa chiều hơn so với CNN đơn phương thức, khả năng diễn giải hình ảnh của nó vẫn được cho là kém hơn so với khả năng hiểu văn bản3).
Phân tích ảnh đáy mắt bằng học sâu đã cho thấy có thể dự đoán các yếu tố nguy cơ toàn thân như tuổi, giới, huyết áp tâm thu, tiền sử hút thuốc và HbA1c chỉ từ ảnh đáy mắt6). Việc dự đoán nguy cơ trong tương lai của các biến cố tim mạch (nhồi máu cơ tim và đột quỵ) cũng cho thấy một mức độ chính xác nhất định, khiến khả năng ảnh đáy mắt trở thành một “cửa sổ” nhìn vào tình trạng sức khỏe toàn thân được chú ý. Các AI dự đoán sa sút trí tuệ, bệnh thận và thiếu máu cũng đang ở giai đoạn nghiên cứu6).
Nhờ chụp ảnh đáy mắt bằng ống kính nhỏ gắn vào smartphone và phân tích bằng AI, việc sàng lọc DR ở bệnh nhân đái tháo đường tại Ấn Độ đã được chứng minh là khả thi trong thực tế7). Cả độ nhạy và độ đặc hiệu đều cho kết quả không kém các camera đáy mắt chuyên dụng, và sàng lọc bằng AI kết hợp với thiết bị đa dụng giá rẻ có thể góp phần phổ biến ở các nước đang phát triển và vùng nông thôn.
Việc tích hợp sàng lọc bằng AI với y tế từ xa được kỳ vọng sẽ cải thiện khả năng tiếp cận nhãn khoa ở vùng hẻo lánh và các nước đang phát triển. Ngay cả ở những cơ sở không có bác sĩ chuyên khoa mắt, AI vẫn có thể thực hiện sàng lọc ban đầu và chỉ chuyển các ca dương tính để bác sĩ chuyên khoa đọc đánh giá từ xa, giúp sử dụng nguồn lực y tế hiệu quả hơn.
Đang có những nghiên cứu về AI có thể dự đoán trước đáp ứng điều trị với liệu pháp anti-VEGF (ranibizumab, aflibercept, faricimab, v.v.) và đề xuất phác đồ dùng thuốc tối ưu cho từng bệnh nhân. Các mô hình dự đoán hiệu quả điều trị từ hình ảnh OCT có thể góp phần giảm số lần tiêm và cải thiện tiên lượng thị lực.
Ứng dụng của AI tạo sinh vào giáo dục bệnh nhân và hỗ trợ khai thác bệnh sử
Các mô hình ngôn ngữ lớn (như GPT-4) đang được nghiên cứu cho các mục đích như giải thích bệnh cho bệnh nhân, soạn tài liệu đồng ý điều trị và hỗ trợ khai thác bệnh sử3). Tuy nhiên, việc ngăn ngừa sai sót và thiên lệch trong thông tin y tế, cũng như duy trì mối quan hệ bác sĩ-bệnh nhân, vẫn là những thách thức. Không khuyến nghị bệnh nhân chỉ dựa vào chatbot để quyết định tự chẩn đoán hoặc tự điều trị3).
Wu JH, Liu TYA, Hsu WT, et al. Performance and limitation of machine learning algorithms for diabetic retinopathy screening: meta-analysis. J Med Internet Res. 2021;23(11):e23863.
Abràmoff MD, Lavin PT, Birch M, Shah N, Folk JC. Pivotal trial of an autonomous AI-based diagnostic system for detection of diabetic retinopathy in primary care offices. NPJ digital medicine. 2018;1:39. doi:10.1038/s41746-018-0040-6. PMID:31304320; PMCID:PMC6550188.
Mihalache A, Popovic MM, Guo MZ, et al. Performance of an upgraded artificial intelligence chatbot for ophthalmic knowledge assessment. JAMA Ophthalmol. 2024;142(3):234-241.
Olvera-Barrios A, Heeren TF, Balaskas K, et al. Diagnostic accuracy of diabetic retinopathy grading by an artificial intelligence-enabled algorithm compared with a human standard reference. Diabetologia. 2023;66(5):857-866.
Brown JM, Campbell JP, Beers A, et al. Automated diagnosis of plus disease in retinopathy of prematurity using deep convolutional neural networks. JAMA Ophthalmol. 2018;136(7):803-810.
Poplin R, Varadarajan AV, Blumer K, Liu Y, McConnell MV, Corrado GS, et al. Prediction of cardiovascular risk factors from retinal fundus photographs via deep learning. Nature biomedical engineering. 2018;2(3):158-164. doi:10.1038/s41551-018-0195-0. PMID:31015713.
Rajalakshmi R, Subashini R, Anjana RM, et al. Automated diabetic retinopathy detection in smartphone-based fundus photography using artificial intelligence. Eye. 2018;32(6):1138-1144.
Ting DSW, Cheung CY, Lim G, Tan GSW, Quang ND, Gan A, et al. Development and Validation of a Deep Learning System for Diabetic Retinopathy and Related Eye Diseases Using Retinal Images From Multiethnic Populations With Diabetes. JAMA. 2017;318(22):2211-2223. doi:10.1001/jama.2017.18152. PMID:29234807; PMCID:PMC5820739.
Sao chép toàn bộ bài viết và dán vào trợ lý AI bạn muốn dùng.
Đã sao chép bài viết vào clipboard
Mở một trợ lý AI bên dưới và dán nội dung đã sao chép vào ô chat.