Tổng quan
Hiện nay, Phương pháp học liên kết (Federated learning) đang được ứng dụng rộng rãi như là một phương pháp tiên tiến trong lĩnh vực học máy và trí tuệ nhân tạo, giúp đào tạo mô hình trên dữ liệu phân tán mà không cần phải truyền dữ liệu tới một trung tâm tập trung [1]. Thay vì tập trung dữ liệu từ nhiều nguồn vào cùng một địa điểm, Federated Learning cho phép các thiết bị hoặc hệ thống phân tán thực hiện việc học từ dữ liệu của chính mình và chỉ chia sẻ thông tin cần thiết để cập nhật mô hình.
Hệ thống phát hiện xâm nhập (Intrusion Detection System) đóng vai trò quan trọng trong việc phát hiện và ngăn chặn các hành vi xâm nhập vào mạng máy tính. Gần đây, phương pháp Federated Learning [2] đã thu hút sự chú ý với khả năng đào tạo mô hình học máy trên các thiết bị phân tán mà không cần phải truyền dữ liệu tới một trung tâm tập trung, đảm bảo tính riêng tư và bảo mật của người dùng.
Trong lĩnh vực IDS, mô hình mạng nơ-rôn đã chứng tỏ khả năng xuất sắc [3] trong việc phân loại và nhận dạng các mẫu xâm nhập. Trong số các mô hình CNN phổ biến, mô hình VGG-16 nổi bật với cấu trúc sâu và khả năng trích xuất đặc trưng phức tạp.
Qua việc thực hiện đề tài này, chúng ta sẽ có cái nhìn rõ ràng hơn về ưu điểm và hạn chế của mô hình VGG-16 so với các mô hình máy học khác, đồng thời đánh giá khả năng ứng dụng của phương pháp Federated Learning trong việc xây dựng hệ thống phát hiện xâm nhập. Kết quả từ nghiên cứu này có thể cung cấp thông tin quan trọng và cơ sở cho việc phát triển và tối ưu hóa hệ thống phát hiện xâm nhập sử dụng Federated Learning trong việc bảo vệ mạng máy tính và dữ liệu trong thời đại số hóa ngày nay.
Mục tiêu và phạm vi nghiên cứu
Mục tiêu thứ nhất của nghiên cứu này là nghiên cứu và so sánh hiệu suất của mô hình VGG-16 với các mô hình máy học khác trong việc xây dựng hệ thống phát hiện xâm nhập sử dụng Federated Learning. Qua đó, chúng ta sẽ đánh giá khả năng của mô hình VGG-16 trong việc nhận dạng và phân loại các hành vi xâm nhập, so với các mô hình máy học khác được áp dụng trong cùng môi trường. Thứ hai, một yếu tố quan trọng khác của hệ thống phát hiện xâm nhập là khả năng mở rộng. Mục tiêu là xác định và đánh giá khả năng mở rộng của mô hình VGG-16 so với các mô hình máy học khác khi áp dụng phương pháp Federated Learning. Qua đó, chúng ta sẽ đưa ra các khuyến nghị và giải pháp để cải thiện khả năng mở rộng của hệ thống phát hiện xâm nhập sử dụng mô hình VGG-16. Cuối cùng, mục tiêu của đề tài là đưa ra những đóng góp mới và ứng dụng thực tế trong lĩnh vực xây dựng hệ thống phát hiện xâm nhập sử dụng Federated Learning. Dựa trên kết quả nghiên cứu và so sánh, chúng ta sẽ đề xuất các phương pháp, kỹ thuật và hướng phát triển tiếp theo để cải thiện hiệu suất, tính mở rộng, tính riêng tư và bảo mật của hệ thống phát hiện xâm nhập trong môi trường phân phối và phức tạp hiện nay
Nghiên cứu này được thực hiện trong môi trường server của trường Đại học Công nghệ Thông tin – ĐHQG TP.HCM. Hình 1 là mô hình do chúng tôi xây dựng.
Hình 1. Mô hình học cộng tác được xây dựng
Chúng tôi sẽ dựa vào mô hình đó để xây dựng một hệ thống Federated Learning nhằm thực hiện các thử nghiệm trong đề tài. Máy chủ sẽ huấn luyện một mô hình mẫu và tiến hành phân phối các trọng số tới các máy rìa. Sau đó, chúng tôi sẽ phân tích và nghiên cứu kết quả được trả về từ mô hình đó để đưa ra những kết luận.
Nội dung đề tài
1. Xây dựng hệ thống phát hiện xâm nhập trên nền tảng trí tuệ nhân tạo dựa trên Federated Learning
Dựa theo mô hình được diễn tả trong Hình 1, chúng tôi xây dựng hệ thống ban đầu với 2 máy server lần lượt sử dụng model VGG-16 và MobilenetV2, trích xuất trọng số và gửi xuống các máy rìa để triển khai mô hình Federated Learning và cho ra kết quả.
Thực hiện huấn luyện 2 models trên với 2 input khác nhau để so sánh chỉ số accuracy. Thử với nhiều tổ hợp input và model (steps_per_epoch=100, validation_steps=100, epochs=100):
– VGG-16 với input 32×32 (min)
– VGG-16 với input 64×64
– MobileNetv2 với input 64×64
– VGG-16 với input 64×64 tại máy Edge.
2. Xây dựng các mô hình khác để thực hiện
Chúng tôi lựa chọn các mô hình máy học khác thường được sử dụng như: EficientNetB0, EficientNetB7, InceptionV3, MobileNetV3, MobileNetV3Small, resnet, resnet420 để thực hiện so sách với mô hình VGG16 mà chúng tôi chọn.
3. Tạo mẫu đối kháng nhầm mục đích làm dataset cho các máy Edge
Chúng tôi sẽ sử dụng các phương pháp như: FGSM, BIM, CW, GAN để lần lượt làm các bộ dataset cho các máy Edge. Đầu tiên, cần tạo ra mô hình có được học đặc trưng của từng class trong dataset gốc ngoại trừ Normal (Analysis, Backdoor, Dos, Exploits, Fuzzers, Generic, Reconaissance, Shellcode, Worms). Ở ngữ cảnh trên, chúng tôi sử dụng mô hình MobileNetV3Small để làm xây dựng model học tính đặc trưng. Từ mô hình trên, tiến hành tạo các mẫu đối kháng bằng những thuật toán nêu trên.
Kết luận
Trong khoá luận này, trước tiên chúng tôi đã nghiên cứu khả năng của mô hình VGG-16 với các mô hình có cùng kiến trúc khác nhau trong môi trường học cộng tác. Chúng tôi thấy rằng sự tương đồng về kiến trúc mô hình không phải là một trong những yếu tố chính quyết định được mô hình có phát hiện tốt hơn trong các trường hợp cụ thể. Và nghiên cứu trên cho thấy mô hình MobileNetV3 có kết quả tiệm cận VGG-16 nhưng có kích thước nhỏ hơn nhiều, cho thấy MobileNetV3 có khả năng cạnh tranh với các mô hình cùng kiến trúc ở các nghiên cứu tiếp theo.
Ngoài ra tôi đề xuất một phương pháp xử lý dữ liệu bảng ban đầu thành dữ liệu ảnh, sau đó sử dụng dữ liệu này cho các mô hình phát hiện sử dụng đầu vào ảnh, tôi thu được kết quả phát hiện cao và cao tuyệt đối ở một số mô hình.
Cuối cùng tôi đề xuất thêm một phương pháp để phát hiện các mẫu đối kháng được tạo ra từ GAN, CW, FGSM và BIM. Phương pháp này tạo ra các mẫu đối kháng có khả năng qua mặt được các mô hình được nghiên cứu trên. Song, vẫn không thể vược mặt được các mô hình tốt. Kết quả thực nghiệm cho thấy rằng VGG-16 là một mô trong các mô hình cần được nghiên cứu và sử dụng nhiều hơn trong những nghiên cứu sau này.