Chuẩn đoán bệnh lý thông qua hình ảnh X-quang phổi sử dụng mô hình học sâu

Diagnosing Lung Pathologies Using Chest X-ray Images with Deep Learning

Trên thực tế, có thể thấy mức độ nghiêm trọng của bệnh phổi trong giai đoạn đại dịch Covid-19 bùng phát, một căn bệnh về phổi do virus gây ra với số lượng lớn biến thể phức tạp, tình trạng lây lan nhanh, khó kiểm soát và để lại hậu quả nghiêm trọng trên toàn cầu. Hiện trạng trên đặt ra thách thức lớn trong lĩnh vực y tế như: vấn đề chẩn đoán chính xác, kịp thời các bệnh lý phổi, phát hiện các dấu hiệu bất thường ở phổi, đồng thời đưa ra phương pháp điều trị phù hợp. Việc áp dụng các ứng dụng công nghệ, đặc biệt là trí tuệ nhân tạo (AI) và học sâu (Deep Learning), đang là tiềm năng có xu hướng phát triển mạnh mẽ trong lĩnh vực y khoa. Các mô hình học sâu tiềm năng như DenseNet121, có khả năng phân tích các hình ảnh y khoa với độ chính xác tương đối cao, giúp phát hiện các dấu hiệu bệnh lý từ những giai đoạn đầu tiên và đưa ra kết quả chính xác hơn so với các phương pháp truyền thống. Nắm bắt được những tiềm năng trên, chúng tôi thực hiện nghiên cứu và chuẩn đoán các bệnh về phổi dựa trên hình ảnh X-quang.

TÁC GIẢ

Võ Thị Hoài Thanh, Trương Thị Minh Quỳnh

GIẢNG VIÊN HƯỚNG DẪN

NGÀNH

Năm:

Tổng quan đồ án

Theo thống kê của một số tổ chức y tế, các bệnh liên quan đến phổi hiện đang dẫn đầu về số ca mắc bệnh và gây tử vong trên toàn thế giới. Bệnh phổi được biết đến với một số bệnh lý thường gặp như: bệnh phổi tắc nghẽn mạn tính (COPD), viêm phổi, lao phổi; hay một số bệnh lý ít gặp hơn như xơ phổi hay ung thư phổi. Theo WHO – Tổ chức Y tế Thế giới, các bệnh về phổi đã gây ra thiệt hại nghiêm trọng cho sức khoẻ người, hàng triệu trường hợp tử vong được ghi nhận mỗi năm có nguyên nhân từ bệnh phổi, và con số trên đang không ngừng gia tăng do các yếu tố khách quan đến từ môi trường cũng như con người, bao gồm: ô nhiễm không khí, khói thuốc lá, một số hoá chất độc hại, …

Trên thực tế, có thể thấy mức độ nghiêm trọng của bệnh phổi trong giai đoạn đại dịch Covid-19 bùng phát, một căn bệnh về phổi do virus gây ra với số lượng lớn biến thể phức tạp, tình trạng lây lan nhanh, khó kiểm soát và để lại hậu quả nghiêm trọng trên toàn cầu. Hiện trạng trên đặt ra thách thức lớn trong lĩnh vực y tế như: vấn đề chẩn đoán chính xác, kịp thời các bệnh lý phổi, phát hiện các dấu hiệu bất thường ở phổi, đồng thời đưa ra phương pháp điều trị phù hợp. Việc áp dụng các ứng dụng công nghệ, đặc biệt là trí tuệ nhân tạo (AI) và học sâu (Deep Learning), đang là tiềm năng có xu hướng phát triển mạnh mẽ trong lĩnh vực y khoa. Các mô hình học sâu tiềm năng như DenseNet121, có khả năng phân tích các hình ảnh y khoa với độ chính xác tương đối cao, giúp phát hiện các dấu hiệu bệnh lý từ những giai đoạn đầu tiên và đưa ra kết quả chính xác hơn so với các phương pháp truyền thống. Nắm bắt được những tiềm năng trên, chúng tôi thực hiện nghiên cứu và chuẩn đoán các bệnh về phổi dựa trên hình ảnh X-quang. Những đóng góp chính của nghiên cứu này bao gồm:

  • Áp dụng DenseNet121: Sử dụng mô hình học sâu DenseNet121 để chuẩn đoán các bệnh lý phổi trên tập dữ liệu CheXpert, tập trung vào 5 bệnh lý phổi chính.
  • Đánh giá hiệu suất: Mô hình được huấn luyện và đánh giá kỹ lưỡng, đạt độ chính xác trung bình trên 88%, chứng tỏ khả năng vượt trội trong việc phát hiện và phân loại bệnh lý từ ảnh X-quang.
  • Ứng dụng trong thực tế: Kết quả này có thể ứng dụng để hỗ trợ các bác sĩ trong quá trình chẩn đoán nhanh với độ chính xác cao, góp phần cải thiện chất lượng y tế, đơn giản hoá quá trình chăm sóc, điều trị và theo dõi sức khoẻ cho bệnh nhân.

Phần còn lại của bài báo được tổ chức như sau: Phần II thảo luận về các công trình liên quan sử dụng học sâu trong chẩn đoán bệnh lý phổi; Phần III trình bày phương pháp được đề xuất; Phần IV trình bày kết quả thực nghiệm và đưa ra kết luận trong Phần V.

Phương pháp

Lĩnh vực y học đã có những bước tiến vượt bậc nhờ sự kết hợp mạnh mẽ giữa trí tuệ nhân tạo và điện toán đám mây. Việc chẩn đoán bệnh chính xác, kịp thời đóng vai trò then chốt trong việc điều trị hiệu quả và việc ứng dụng trí tuệ nhân tạo trong phân tích hình ảnh y tế, đặc biệt là chụp X-quang ngực, mở ra cơ hội lớn để chẩn đoán bệnh phổi hiệu quả hơn. Nhận thấy điều này, chúng tôi đã tạo ra hệ thống như Hình 1 theo các bước như sau:

image 57

Thu thập và Chuẩn bị dữ liệu:

Tập dữ liệu CheXpert được xây dựng bởi Đại học Pennsylvania và Bệnh viện Đa khoa Massachusetts, bao gồm hơn 224,316 hình ảnh Xquang ngực từ hơn 65,240 bệnh nhân. Trong đó, bộ dữ liệu huấn luyện chứa 223.414 ảnh từ 64.540 bệnh nhân, bộ dữ liệu xác thực chứa 234 ảnh từ 200 bệnh nhân và bộ dữ liệu kiểm tra chứa 668 ảnh từ 500 bệnh nhân. Mỗi bệnh nhân chỉ xuất hiện trong một trong ba bộ dữ liệu này.

Điểm nổi bật của CheXpert là sự đa dạng, đại diện cho nhiều trường hợp lâm sàng khác nhau và được chú thích chi tiết bởi các bác sĩ chuyên
khoa X-quang cho 14 bệnh lý liên quan đến phổi. CheXpert được sử dụng rộng rãi trong nghiên cứu học máy cho các bài toán như chẩn đoán bệnh phổi, phân đoạn hình ảnh y tế và trích xuất đặc trưng. Nhờ sự phong phú và chất lượng cao, CheXpert đóng góp to lớn vào việc thúc đẩy tiến bộ trong lĩnh vực học máy y tế, góp phần nâng cao hiệu quả chẩn đoán và điều trị các bệnh lý về phổi.

Xây dựng mô hình:

Với mục tiêu huấn luyện mô hình DenseNet121 có thể phân loại nhiều bệnh phổi cùng lúc từ ảnh chụp Xquang. Đề xuất sử dụng kỹ thuật gọi là “tiền huấn luyện MAE” (Masked Autoencoders). Với tỷ lệ che phủ cao lên đến 90% các mảnh ảnh giúp quá trình huấn luyện nhanh hơn và tiết kiệm tài nguyên.

image 58

DenseNet121, với kiến trúc xoắn sâu và kết nối dày đặc, có khả năng trích xuất các đặc trưng phức tạp từ ảnh X-quang. Quá trình huấn luyện trước với MAE giúp mô hình học được các đặc trưng chung của ảnh X-quang, bao gồm cả các đặc trưng liên quan đến bệnh lý. Sau khi được huấn luyện trước với MAE, DenseNet121 đã tích lũy được một lượng kiến thức về ảnh X-quang. Kiến thức này được chuyển giao sang
nhiệm vụ phân loại bệnh phổi bằng cách điều chỉnh lại các lớp cuối cùng của mô hình. DenseNet121 được thiết kế để xử lý các nhiệm vụ phân loại đa nhãn. Điều này có nghĩa là mô hình có thể dự đoán nhiều bệnh phổi cùng lúc từ một ảnh X-quang, thay vì chỉ dự đoán một bệnh duy nhất.

image 59

Hiển thị kết quả chuẩn đoán:

  • Dựa trên mô hình đã được huấn luyện và ngưỡng cho từng loại bệnh, chúng tôi bắt đầu triển khai mô hình và xây dựng ứng dụng web nhận hình ảnh X-quang phổi và hiển thị kết quả chẩn đoán bệnh ra màn hình.
  • Chúng tôi triển khai mô hình bằng cách tạo mô hình từ tệp model.pth đã nhận được ở bước xây dựng mô hình. Sau đó chúng tôi tạo hàm xử lý hình ảnh trước khi đưa vào mô hình, hàm xử lý đầu ra và hàm trả về kết quả dự báo bệnh. Trong hàm xử lý đầu ra, chúng tôi xử dụng một hàm có sẵn(sigmoid) nhằm chuyển đổi đầu ra thành các giá trị xác suất rồi so sánh với các ngưỡng và đưa ra kết quả dự đoán.
  • Kiến trúc Mircoservices cho phép tách các thành phần ứng dụng, làm tăng tính mô đun giúp các thành phần riêng lẻ dễ bảo trì, cập nhật và mở rộng hơn. Đó là lý do tại sao chúng tôi đã sử dụng kiến trúc này thay vì kiến trúc nguyên khối cổ điển để xây dựng ứng.
image 60

Thực nghiệm

Việc thực hiện tính threshold dựa trên hàm roc_curve () với giá trị trả về bao gồm các giá trị mảng thresholds, tpr, fpr. Đây cũng là các giá trị tương ứng với đường cong ROC, một công cụ quan trọng trong đánh giá hiệu suất của các mô hình phân loại. Dựa trên đặc điểm của đường cong ROC: Đường cong ROC càng gần góc trên bên trái của biểu đồ (điểm [0,1], nơi TPR = 1 và FPR = 0) thì hiệu suất của mô hình càng cao, từ đó thực hiện tìm điểm mà hiệu suất mô hình cao nhất để tính toán và đưa ra threshold.

Triển khai ứng dụng web kiểm tra kết quả chuẩn đoán dựa trên tập dữ liệu test, cho thấy kết quả tương ứng với độ chính xác của 5 loại bệnh

image 61

Kết luận

Nghiên cứu này đã thấy được tiềm năng của việc áp dụng mô hình học sâu trong việc chấn đoán bệnh lý phổi dựa trên ảnh x-quang ngực. DeseNet121 có thể phân loại năm bênh phổi phổ biến bao gồm Cardiomegaly, Edema, Consolidation, Atelectasis và Pleural Effusion với độ chính xác cao 88% trên tập kiểm tra. Kết quả nghiên cứu này củng cố tính hiệu quả và độ tin cậy của các phương pháp học sâu trong y học, đồng thời mở ra cơ hội nâng cao chất lượng dịch vụ bệnh nhân thông qua các dịch vụ hỗ trợ y tế.

Các đóng góp chính của nghiên cứu bao gồm việc áp dụng thành công mô hình DenseNet121 vào phân loại bệnh lý phổi trên tập dữ liệu CheXpert, đánh giá và chứng minh hiệu suất của mô hình, và đề xuất ứng dụng thực tiễn trong hỗ trợ chẩn đoán y khoa, Kết quả đạt được cho thấy tiềm năng to lớn của trí tuệ nhân tạo và deep learning trong việc cách mạng hóa quá trình chẩn đoán bệnh lý, đặc biệt khi nhu cầu chẩn đoán nhanh và chính xác ngày càng tăng.

Tuy nhiên, cần nghiên cứu và thử nghiệm sâu hơn với các bộ dữ liệu đa dạng hơn và tích hợp với các hệ thống y tế hiện đại để triển khai rộng rãi mô hình này trong thực hành lâm sàng. Đào tạo, nâng cấp bác sĩ về công nghệ này cũng là yếu tố quan trọng đảm bảo sự phối hợp hiệu quả giữa con người và máy móc trong quá trình chẩn đoán.