Tăng cường bảo mật cho kiến trúc mạng khả lập trình bằng công nghệ học liên kết và công nghệ chuỗi khối

Enhace security for software defined network architecture by federated learning and blockchain

Khóa luận này tập trung vào việc kết hợp các công nghệ bảo mật để đề xuất một giải pháp hoặc hướng nghiên cứu mới nhằm nâng cao bảo mật cho công nghệ SDN. Cụ thể, đề tài đề xuất sử dụng hai công nghệ tiên tiến: học liên kết (Federated Learning) và chuỗi khối (Blockchain), để giải quyết các vấn đề liên quan đến phát hiện xâm nhập (Intrusion Detection – IDS).

Xem toàn văn báo cáo tại:

TÁC GIẢ

Dương Đức Anh

GIẢNG VIÊN HƯỚNG DẪN

NGÀNH

Năm:

Tổng quan

Trong bối cảnh công nghệ mạng không ngừng phát triển, kiến trúc mạng khả lập trình (Software Defined Networking – SDN) đã trở thành giải pháp tối ưu để quản lý và điều khiển hệ thống mạng với tính linh hoạt và hiệu quả cao. SDN được thiết kế dựa trên một kiến trúc linh hoạt, dễ quản lý, hiệu suất cao và thích ứng tốt, lý tưởng cho các ứng dụng yêu cầu băng thông cao và sự linh hoạt. Tuy nhiên, bên cạnh những lợi ích mà SDN mang lại, các vấn đề về bảo mật ngày càng trở nên phức tạp và khó kiểm soát.

Khóa luận này tập trung vào việc kết hợp các công nghệ bảo mật để đề xuất một giải pháp hoặc hướng nghiên cứu mới nhằm nâng cao bảo mật cho công nghệ SDN. Cụ thể, đề tài đề xuất sử dụng hai công nghệ tiên tiến: học liên kết (Federated Learning) và chuỗi khối (Blockchain), để giải quyết các vấn đề liên quan đến phát hiện xâm nhập (Intrusion Detection – IDS). Học liên kết cho phép mô hình học từ dữ liệu phân tán mà không cần tập trung hóa, giảm nguy cơ rò rỉ dữ liệu. Chuỗi khối cung cấp một lớp bảo mật bổ sung bằng cách sử dụng cơ chế mã hóa và ghi chép không thể thay đổi, từ đó tăng cường an ninh trong quá trình huấn luyện mô hình.

Trong luận văn này, tôi đã tiến hành thu thập tập dữ liệu NSL-KDD từ nhóm nghiên cứu của Đại học New Brunswick (UNB) . Tôi cũng thực hiện các bước tiền xử lý dữ liệu, xây dựng mô hình, đánh giá hệ thống và đưa ra các kết luận cùng với đề xuất cho tương lai. Những tính năng của hệ thống được đề xuất sẽ giải quyết phần lớn các hạn chế đã được xác định trước đó, góp phần nâng cao độ bảo mật và độ tin cậy trong hệ thống mạng SDN.

Bằng cách kết hợp công nghệ chuỗi khối và Machine Learning (ML), Federated Learning (FL), sẽ giải quyết được những vấn đề còn tồn tại trong mỗi công nghệ:

  • Bảo vệ quyền riêng tư dữ liệu: Sử dụng học liên kết cho phép thiết bị tham gia đào tạo mô hình trên dữ liệu cục bộ mà không cần chia sẻ dữ liệu tập trung.
  • Bảo đảm an ninh dữ liệu: Việc sử dụng chuỗi khối sẽ ghi nhận và bảo toàn các phiên trao đổi dữ liệu một cách bất biến, từ đó tăng cường an ninh trong quá trình huấn luyện mô hình.

Mục tiêu và phạm vi nghiên cứu

  • Nghiên cứu về Mạng định nghĩa bằng phần mềm (Software-defined Networking – SDN): Mục tiêu đầu tiên của bài khóa luận là tìm hiểu sâu về Mạng định nghĩa bằng phần mềm (SDN), một công nghệ mạng hiện đại đang được sử dụng rộng rãi. Bài khóa luận sẽ phân tích các nguyên lý hoạt động, kiến trúc, và các lợi ích mà SDN mang lại. Ngoài ra, chúng ta sẽ khám phá các mô hình SDN hiện có như Open SDN, SDN qua API, SDN qua mạng overlay dựa trên hypervisor, và Hybrid SDN.
  • Xây dựng mạng lưới Chuỗi khối riêng tư (Private Blockchain) sử dụng HyperLedger Fabric: Mục tiêu thứ hai là xây dựng một mạng lưới Private Blockchain sử dụng HyperLedger Fabric để tăng cường bảo mật cho mô hình mạng SDN. Chuỗi khối được biết đến với khả năng bảo mật cao nhờ vào cơ chế lưu trữ dữ liệu phân tán và không thể thay đổi. Việc tích hợp HyperLedger Fabric vào mạng SDN sẽ giúp bảo mật các giao dịch và dữ liệu trong mạng, đảm bảo tính toàn vẹn và an toàn của thông tin.
  • Xây dựng mô hình học liên kết dự đoán cho kiến trúc SDN sử dụng ScikitLearn: Mục tiêu thứ ba là xây dựng một mô hình học liên kết (machine learning) sử dụng thư viện Scikit-Learn để tiến hành dự đoán cho kiến trúc SDN dựa trên tập dữ liệu của nhóm nghiên cứu tại trường đại học New Brunswick(UNB) được tạo ra trong bài báo NSL-KDD. Mô hình này sẽ giúp phân tích và dự đoán các hành vi trong mạng SDN, từ đó nâng cao khả năng phát hiện và phòng chống các cuộc tấn công mạng.

Phạm vi nghiên cứu: Hệ thống phát hiện xâm nhập – Intrusion Detection System (IDS); Sử dụng mô hình học liên kết trong dự đoán xâm nhập; Tích hợp mô hình IDS Vào môi trường mạng SDN

Nội dung đề tài

Trong nghiên cứu này, tôi đề xuất một hệ thống phòng chống xâm nhập (NIDS) dựa trên công nghệ chuỗi khối nhằm đảm bảo tính bảo mật và minh bạch trong việc giám sát và ngăn chặn các cuộc tấn công mạng. Công nghệ chuỗi khối, với tính năng phi tập trung và bảo mật cao, mang lại nhiều lợi ích trong việc quản lý và bảo vệ dữ liệu. Không giống như các hệ thống truyền thống, chuỗi khối hoạt động mà không cần đến một điểm quản lý tập trung, giảm thiểu nguy cơ tấn công từ các điểm đơn lẻ và tăng cường tính toàn vẹn của dữ liệu.

Để xây dựng mô hình học máy, học máy liên kết, tôi sẽ thực hiện tạo mô hình theo các bước sau:

  1. Tiền xử lý dữ liệu
  2. Chuẩn hóa dữ liệu – Feature Scaling
  3. Lựa chọn đặc trưng – Feature Selection
  4. Xây dựng mô tình cây quyết định và rừng ngẫu nhiên
  5. Dự đoán & đánh giá
image 2
Hình 4.24. Mô hình triển khai

Trong phần này, tôi sẽ tiến hành thực nghiệm và đánh giá hiệu suất của các mô hình học máy (Cây quyết định và Rừng ngẫu nhiên) bằng cách tích hợp chúng vào một hệ thống phát hiện xâm nhập dựa trên Blockchain. Mục tiêu của tôi là kiểm chứng tính hiệu quả và độ tin cậy của hệ thống này so với các hệ thống truyền thống, nhờ vào khả năng đồng thuận phi tập trung và tự động hóa của blockchain cùng với các hợp đồng thông minh.

Sau khi huấn luyện được mô hình học máy Cây quyết định và Random Forest phục vụ cho bài toán, thực hiện kết hợp 2 loại mô hình này vào hệ thống NIDS và thực hiện đánh giá qua kết quả đề xuất.

image 3
Hình 4.27. Thông số mô hình cây quyết định được tạo ra theo kịch bản ban đầu

Kết luận

Thông qua nghiên cứu này, tôi đã hiểu được tầm quan trọng của việc chọn lọc các đặc trưng sao cho phù hợp cùng với thuật toán học phân loại đủ tốt để xây dựng mô hình Hệ thống phát hiện xâm nhập (IDS) đã được chứng minh. Cùng với đó, bài khóa luận này đã trình bày và đề xuất một phương pháp chọn lọc đặc trưng, bao gồm việc lựa chọn đặc trưng đơn biến kết hợp với Loại trừ đặc trưng đệ quy (RFE) bằng cách sử dụng bộ phân loại cây quyết định để xác định các đặc trưng quan trọng.

Ngoài ra, qua quá trình nghiên cứu và thực nghiệm, tôi đã chứng minh rằng việc lựa chọn và loại bỏ các đặc trưng không cần thiết không chỉ giúp đơn giản hóa mô hình mà còn nâng cao hiệu quả của hệ thống phát hiện xâm nhập (IDS). Phương pháp chọn lọc đặc trưng được đề xuất, với sự kết hợp giữa lựa chọn đặc trưng đơn biến và loại bỏ đặc trưng đệ quy, đã chứng tỏ khả năng cải thiện độ chính xác của mô hình phân loại một cách rõ rệt.

Trong các công việc tương lai, mục tiêu là tích hợp hệ thống NIDS này với một hệ thống tệp phân tán như Hệ thống Tệp liên hành tinh (InterPlanetary File System – IPFS), và đánh giá đề xuất với các tập dữ liệu khác nhau. Việc này sẽ giúp xác định khả năng ứng dụng và hiệu quả của hệ thống NIDS này trong các môi trường mạng khác nhau, đồng thời nâng cao tính bảo mật và hiệu suất của hệ thống phát hiện xâm nhập.