Tổng quan
Trong thời đại số hóa ngày nay, hệ thống chăm sóc sức khỏe thông minh đã trở thành một xu hướng quan trọng, mang lại nhiều lợi ích đáng kể cho cả bệnh nhân và nhà cung cấp dịch vụ y tế. Kết hợp giữa Internet of Things (IoT) và Federated Learning (FL), hai công nghệ tiên tiến, hứa hẹn mở ra một tương lai mới đầy tiềm năng cho lĩnh vực chăm sóc sức khỏe.
Trong lĩnh vực y tế, thông tin bệnh nhân là dữ liệu nhạy cảm và cần được bảo vệ một cách nghiêm ngặt. Hệ thống IoT thu thập dữ liệu từ các thiết bị y tế, như cảm biến sức khỏe và thiết bị theo dõi, và truyền dữ liệu này đến các nút cục bộ cho việc
xử lý và huấn luyện mô hình FL. Các biện pháp bảo mật như mã hóa dữ liệu, phân quyền truy cập, và kỹ thuật mã hóa được áp dụng để đảm bảo tính riêng tư và an toàn cho dữ liệu y tế trong quá trình truyền tải và xử lý.
Áp dụng tự động hóa vào quy trình giúp làm giảm thời gian và công sức của nhân viên y tế, đồng thời tăng cường độ chính xác và hiệu suất. Hệ thống có thể tự động phát hiện và báo cáo các biểu hiện bất thường trong sức khỏe của bệnh nhân dựa trên dữ liệu được thu thập từ các thiết bị IoT. FL giúp cập nhật mô hình học máy trên dữ liệu phân tán từ nhiều nguồn khác nhau một cách tự động, đồng nhất và bảo
mật.
Việc tích hợp IoT và FL trong hệ thống chăm sóc sức khỏe thông minh không chỉ mang lại lợi ích về tự động hóa và tăng cường hiệu suất mà còn đảm bảo tính riêng tư và an toàn của dữ liệu y tế, góp phần nâng cao chất lượng phục vụ và quản lý sức khỏe cho người dùng.
Mục tiêu nghiên cứu
1) Xây Mô hình Convolutional Neural Network (CNN) trong việc huấn luyện và dự đoán trên các tập dataset về y tế:
- Xây dựng và tối ưu hóa mô hình CNN cho việc phân loại và dự đoán trên các tập dataset chứa dữ liệu y tế.
- Nghiên cứu về cách sử dụng CNN để chẩn đoán bệnh, dự đoán kết quả điều trị, hoặc phân loại các biểu hiện lâm sàng từ dữ liệu hình ảnh, dữ liệu y lệnh hoặc dữ liệu văn bản trong lĩnh vực y tế.
2) Mô hình FL để tăng tính bảo mật của dữ liệu và mô hình học máy.
- Phát triển và triển khai mô hình học máy phân tán dựa trên FL trong lĩnh vực
y tế. - Nghiên cứu cách tích hợp FL vào hệ thống chăm sóc sức khỏe thông minh để tăng tính bảo mật của dữ liệu y tế và mô hình học máy, đồng thời giữ cho dữ liệu tại chỗ mà không cần phải truyền dữ liệu qua mạng.
3) Homomorphic Encryption (HE) để thực hiện tính toán trên dữ liệu được mã hóa mà không cần phải giải mã nó trước.
- Nghiên cứu và phát triển các phương pháp và công nghệ HE để thực hiện các tính toán trên dữ liệu y tế được mã hóa mà không cần giải mã trước.
- Áp dụng HE vào các quy trình tính toán trong lĩnh vực y tế như phân tích dữ liệu, huấn luyện mô hình học máy và dự đoán kết quả bệnh lý.
4) Tự động hóa và đơn giản hóa quy trình làm việc cũng như triển khai máy học.
- Nghiên cứu và phát triển các công cụ và quy trình để tự động hóa và đơn giản hóa quy trình huấn luyện, triển khai và quản lý mô hình học máy trong môi trường y tế.
- Áp dụng tự động hóa vào hệ thống chăm sóc sức khỏe để tối ưu hóa quy trình làm việc của nhân viên y tế, cải thiện hiệu suất và tính linh hoạt của hệ thống.
Phạm vi nghiên cứu
- Nghiên cứu về cách tích hợp IoT và FL để xây dựng hệ thống chăm sóc sức khỏe thông minh có khả năng tự động hóa và bảo mật cao.
- Khảo sát cách sử dụng công nghệ tự động hóa để cải thiện hiệu suất và hiệu quả trong việc cung cấp dịch vụ chăm sóc sức khỏe.
- Nghiên cứu về các vấn đề bảo mật đặc biệt liên quan đến dữ liệu y tế nhạy cảm.
- Nghiên cứu về cách FL có thể được áp dụng trong lĩnh vực chăm sóc sức khỏe để tạo mô hình dự đoán hoặc phân loại trên dữ liệu phân tán từ nhiều nguồn khác nhau mà không cần truyền dữ liệu đến một trung tâm tập trung.
Mô hình hệ thống
Mô hình hệ thống sẽ gồm các thành phần chính sau:
Server Site
- Api Server: Là nơi nhận và xử lý các yêu cầu của các API Client, FL Server và MongoDB. Đóng vai trò trung tâm trong việc kết nối và điều phối các thành phần của một hệ thống ứng dụng, đảm bảo rằng dữ liệu và chức năng của hệ thống được truy cập một cách an toàn và hiệu quả.
⋄ add_user: Là nơi tạo tài khoản cho người dùng khi tạo tài khoản thành công người dùng sẽ được cấp cho một chuỗi token cho riêng tài khoản và người dùng đó.
⋄ login: Là nơi người dùng sẽ gửi yêu cầu đăng nhập vào ứng dụng hệ thống.
⋄ add_client: Là nơi người dùng thêm máy khách vào trong hệ thống.
⋄ start_train:Là nơi server sẽ ra lệnh cho các máy client tiến hành huấn luyện mô hình.
⋄ delete_client: Là nơi xóa các client khi client gặp lỗi hoặc không sử dụng đến nữa.
- FL Server: Là nơi lưu trữ File Weight gốc và cũng là nơi tổng hợp File Weight mà các Client gửi về.
⋄ Client Weight Encrypted: Là các trọng số và tham số của mô hình học máy được huấn luyện cục bộ. Và được gửi từ các máy khách (client).
⋄ Weight Decrypted: Là file được tổng hợp từ các file Client Weight Encrypted được giải mã bằng TenSEAL Decrypted kết hợp với hàm tổng hợp (Aggregation).
⋄ Aggregation: Là quá trình tổng hợp các trọng số của mô hình học máy từ nhiều máy khác (client) để tạo ra một mô hình toàn cầu. Quá trình này không chỉ bảo vệ tính riêng tư của dữ liệu mà còn cải thiện hiệu suất và độ chính xác của mô hình. Các hàm tổng hợp được sử dụng có thể được kể đến như (FedOpt, FedAvg, FedYogi, FedAvgM, FedTrimmedAvg)
⋄ TenSEAL De/Encryption: đóng vai trò then chốt trong việc bảo vệ dữ liệu nhạy cảm và đảm bảo tính bảo mật trong hệ thống chăm sóc sức khỏe thông minh. Bằng cách mã hóa và giải mã các File Weight trong hệ thống
⋄ Server Weight Encrypted: Là các trọng số và tham số của mô hình học máy được huấn luyện và tổng hợp từ file Weight Decrypted kết hợp với TenSEAL Decryption. Sau đó file này sẽ được chuyển cho các máy khách (client).
- MongoDB: đóng vai trò là cơ sở dữ liệu chính, lưu trữ và quản lý các thông tin của người dùng (user) hoặc thông tin của máy khách (client)
Kết luận
Sau khi thực hiện khóa luận tốt nghiệp với đề tài “TĂNG CƯỜNG BẢO MẬT VÀ TỰ ĐỘNG HÓA CHO HỆ THỐNG CHĂM SÓC SỨC KHỎE THÔNG MINH DỰA TRÊN IOT VÀ HỌC LIÊN KẾT.”, nhóm đã đạt được một số kết quả sau:
- Tự động hóa một số quy trình trong quá trình huấn luyện mô hình như: tự động hóa việc thêm client và tự động quá trình tiến hành huấn luyện.
- Kết hợp thành công thư viện flower và pre-trained model.
- Bảo mật dữ liệu của học liên kết bằng phương pháp mã hóa đồng cấu.
Công bố khoa học liên quan
Long Huynh-Phi, Duy Nguyen-Khanh, Thuat Nguyen-Khanh, Chuong Dang-LeBao, and Quan LE-TRUNG, (2024), “A Home-based Diabetes Prediction System on Internet of Things, Federated Learning and Edge Computing,” Springer INISCOM 2024, Feb.20-21 2024, Danang city, Vietnam