TỔNG QUAN
Trong bối cảnh phát triển nhanh chóng của lĩnh vực trí tuệ nhân tạo và học máy, FL đã trở thành một hướng nghiên cứu quan trọng nhằm giải quyết vấn đề bảo mật dữ liệu khi đào tạo mô hình trên dữ liệu phân tán. Khác với phương pháp truyền thống, FL cho phép nhiều thiết bị hoặc tổ chức hợp tác huấn luyện mô hình mà không cần chia sẻ dữ liệu gốc.
Ngoài ra, Distributed Machine Learning (DML) và Privacy-preserving Machine Learning (PPML) là những lĩnh vực có liên quan mật thiết, tập trung vào việc tối ưu hóa quá trình học máy trên các hệ thống phân tán và đảm bảo tính riêng tư của dữ liệu người dùng.
Việc ứng dụng các Optimization algorithms in distributed learning đóng vai trò then chốt trong việc nâng cao hiệu quả và tốc độ hội tụ của các mô hình. Tuy nhiên, các thử thách trong FL, như chi phí truyền thông lớn và sự khác biệt dữ liệu giữa các client (data heterogeneity), vẫn là những vấn đề cần được giải quyết.
Trong số các giải pháp tối ưu, Swarm Intelligence (thuật toán tối ưu bầy đàn), đặc biệt là Particle Swarm Optimization (PSO), đã chứng minh khả năng tối ưu hóa mạnh mẽ trong nhiều bài toán phức tạp. Việc ứng dụng thuật toán PSO trong học máy phân tán hứa hẹn giúp cải thiện hiệu suất và độ chính xác của mô hình.
Bên cạnh đó, Framework Flower (Flower) là một nền tảng mã nguồn mở hỗ trợ phát triển hệ thống federated learning một cách linh hoạt và mở rộng. Việc kết hợp Flower với các thuật toán tối ưu như PSO mở ra nhiều cơ hội mới trong nghiên cứu và ứng dụng thực tiễn.
Cuối cùng, xu hướng phát triển và ứng dụng FL trong các lĩnh vực công nghiệp, y tế, tài chính đã và đang thúc đẩy mạnh mẽ việc nghiên cứu sâu rộng các phương pháp tối ưu và triển khai hiệu quả hệ thống phân tán.
Mục tiêu và phạm vi nghiên cứu
• Áp dụng thuật toán tối ưu bầy đàn PSO để cải thiện hiệu quả FL, cụ thể là tối ưu hóa tham số mô hình nhằm nâng cao độ chính xác và tốc độ hội tụ.
• Giảm thiểu chi phí truyền thông giữa các client và server trong hệ thống phân tán, từ đó tăng hiệu suất đào tạo mô hình.
• Tích hợp thuật toán PSO vào Flower, tận dụng các tính năng mở rộng và hỗ trợ của framework này để xây dựng hệ thống FL có khả năng tối ưu nâng cao.
• Đánh giá và phân tích hiệu năng của giải pháp đề xuất qua các thí nghiệm thực tế, so sánh với các thuật toán tối ưu truyền thống trong FL.
• Phạm vi nghiên cứu tập trung vào học liên kết phân tán sử dụng Flower, không mở rộng sang các framework khác hoặc các mô hình học tập phân tán ngoài FL.
Phân tích và thiết kế hệ thống
Trong Flower sử dụng các thuật toán tức là các chiến lược (Strategy) và được triển khai mặc định bên trong mỗi lần dùng chỉ cần gọi ra và các thuật toán tuân theo một nguyên tắc sau được mô tả trong Thuật toán 1.

Đánh giá độ chính xác
Mã giả của thuật toán FedPSO được [9] mô phỏng chiến lược tổng hợp mô hình FedPSO trên docker, thực hiện đánh giá trực quán độ chính xác của hai chiến lược tổng hợp trọng số mô hình cục bộ và toàn cục để thấy rõ hiệu suất về thời gian và độ chính xác của hai thuật toán cho thấy sự khác biệt giữa FedPSO và FedAvg bằng dataset MNIST và CIFAR-10, với kiểu phân bố dataset lên các client là đồng đều.

Thử nghiệm và đánh giá
Mô hình máy học
Trong nghiên cứu này, một mô hình học sâu dạng CNN (Convolutional Neural Network) được xây dựng dựa trên cấu trúc phổ biến trong các bài toán thị giác máy tính, đặc biệt là trong các nghiên cứu về học liên kết liên kết (Federated Learning).
Mô hình này gồm nhiều lớp tích chập, lớp giảm chiều, lớp làm phẳng và các lớp fully-connected, cụ thể như sau:
• Lớp đầu vào: Được xác định thông qua đối số train_shape, cho phép linh hoạt trong việc xử lý các bộ dữ liệu hình ảnh có kích thước khác nhau.
• Khối tích chập 1:
– Hai lớp Conv2D với 32 bộ lọc (filters), kích thước kernel (5 × 5), hàm kích hoạt ReLU, padding kiểu same, và sử dụng regularization ℓ2 để giảm overfitting.
– Sau đó là lớp MaxPooling2D với kích thước vùng chọn (2 × 2) để giảm chiều dữ liệu không gian.
– Lớp Dropout với tỷ lệ 0.2 giúp giảm overfitting bằng cách ngẫu nhiên bỏ qua một phần neuron trong quá trình huấn luyện.
• Khối tích chập 2:
– Tương tự như khối đầu tiên, khối này gồm hai lớp Conv2D với 64 bộ lọc, kernel (5 × 5), kích hoạt ReLU, padding same, và regularization ℓ2.
– Tiếp theo là lớp MaxPooling2D và Dropout như trên.
• Khối fully connected:
– Dữ liệu đầu ra từ các lớp tích chập được làm phẳng bởi lớp Flatten().
– Tiếp đến là một lớp Dense với 512 neuron, hàm kích hoạt ReLU, và regularization ℓ2.
– Một lớp Dropout(0.2) được thêm vào nhằm tăng khả năng khái quát hóa.
• Lớp đầu ra:
– Một lớp Dense với số lượng neuron bằng số lớp (mặc định là 10), sử dụng hàm kích hoạt softmax để phân loại đầu ra thành các nhãn xác suất.
• Biên dịch mô hình:
– Mô hình được biên dịch với hàm mất mát (loss function) và bộ tối ưu hóa (optimizer) được truyền từ đối tượng khởi tạo.
– Đo lường hiệu quả mô hình bằng độ chính xác (accuracy).
Như vậy, mô hình này kết hợp giữa các kỹ thuật CNN truyền thống và các cơ chế regularization (dropout, L2) để đảm bảo hiệu quả và độ ổn định trong quá trình huấn luyện, phù hợp với các bài toán phân loại hình ảnh trong môi trường học liên kết.
Kết quả thử nghiệm và phân tích

Hình (a) cho thấy thuật toán FedPSO đạt độ chính xác cao hơn so với FedAvg trong toàn bộ quá trình huấn luyện. Sau khoảng 10 vòng lặp, FedPSO đã vượt qua mốc 60% trong khi FedAvg chỉ đạt xấp xỉ 58.5% sau 20 vòng.
Hình (b) thể hiện thời gian thực thi giữa hai thuật toán. Có thể thấy, thời gian của hai thuật toán là tương đương nhau qua từng epoch, cho thấy rằng mặc dù FedPSO sử dụng thêm thuật toán tối ưu bầy đàn, nhưng không gây ảnh hưởng lớn đến chi phí tính toán.
Kết luận và đề xuất
Tổng kết kết quả nghiên cứu
Trong đồ án này, chúng tôi đã tiến hành nghiên cứu và so sánh hiệu quả giữa hai thuật toán học liên kết là FedAvg và FedPSO trên tập dữ liệu hình ảnh CIFAR-10, với hai chiến lược phân phối dữ liệu: đồng đều (IID) và không đồng đều (non-IID).
Các kết quả thực nghiệm cho thấy:
• Trên tập dữ liệu IID: Thuật toán FedPSO đạt độ chính xác (accuracy) cao hơn đáng kể so với FedAvg, đặc biệt trong giai đoạn đầu huấn luyện. Điều này cho thấy PSO giúp cải thiện khả năng hội tụ và chất lượng mô hình toàn cục trong môi trường dữ liệu phân phối đều.
• Trên tập dữ liệu non-IID: Mặc dù gặp phải sự không đồng nhất về nhãn tại các client, FedPSO vẫn duy trì loss thấp hơn và ổn định hơn so với FedAvg. Điều này chứng tỏ rằng FedPSO có khả năng tổng quát hóa tốt hơn trong điều kiện phân phối dữ liệu không đồng đều.
• Về thời gian thực thi: Cả hai thuật toán đều có xu hướng tăng đều về thời gian tính toán theo số lượng epoch. FedPSO chỉ tăng nhẹ thời gian huấn luyện do tích hợp thuật toán tối ưu bầy đàn, nhưng không gây ảnh hưởng đáng kể tới hiệu suất tổng thể.
Từ các biểu đồ và kết quả đã phân tích, có thể khẳng định rằng FedPSO là một thuật toán học liên kết hiệu quả, đặc biệt trong bối cảnh dữ liệu phân tán không đồng nhất giữa các thiết bị.
Đóng góp của đồ án
Đồ án đã mang lại một số đóng góp quan trọng như sau:
• Xây dựng và triển khai thành công mô hình FedPSO kết hợp với nền tảng Flower phục vụ cho bài toán học liên kết.
• Thực hiện so sánh thực nghiệm giữa hai thuật toán FedAvg và FedPSO trong cùng môi trường dữ liệu, giúp làm rõ ưu điểm của phương pháp sử dụng thuật toán tối ưu PSO trong học liên kết.
• Đề xuất cách phân tích kết quả chi tiết thông qua các chỉ số như: accuracy, loss, thời gian thực thi và độ hội tụ, hỗ trợ cho việc đánh giá toàn diện hiệu quả của thuật toán.
• Tạo bộ mã nguồn và dữ liệu cấu hình phục vụ cho việc tái sử dụng và mở rộng về sau.
Hướng phát triển và nghiên cứu tiếp theo
1 Nâng cao thuật toán FedPSO
Dựa trên kết quả đã đạt được và tham khảo từ các hướng nghiên cứu mới hiện nay như trong công trình của Ouyang et al. [13], một số định hướng phát triển trong tương lai của đề tài bao gồm:
• Tối ưu trọng số đóng góp theo hiệu suất động: Tiếp tục cải tiến cơ chế tính trọng số cho mỗi client dựa trên hiệu suất huấn luyện và độ ổn định mô hình, tương tự như cách tiếp cận AdpFedPSO. Hướng đi này cho phép mô hình học liên kết thích ứng thông minh với sự không đồng đều trong dữ liệu và chất lượng client.
• Kết hợp thuật toán metaheuristic khác: Ngoài PSO, có thể kết hợp các thuật toán tối ưu khác như Genetic Algorithm (GA), Ant Colony Optimization (ACO) hoặc Differential Evolution (DE) để tăng hiệu quả tối ưu trong quá trình tổng hợp mô hình toàn cục.
• Tích hợp các cơ chế bảo mật: Bổ sung các kỹ thuật như Differential Privacy, Homomorphic Encryption hoặc Blockchain để đảm bảo tính riêng tư và an toàn cho dữ liệu người dùng, phù hợp với các yêu cầu trong thực tế.
• Mở rộng sang các ứng dụng thực tế: Triển khai mô hình FedPSO trên các bài toán thực tế như chẩn đoán y tế (Medical Imaging), nhận dạng tiếng nói, phân tích cảm xúc, hoặc các hệ thống IoT với thiết bị hạn chế tài nguyên.
• Đánh giá trên nền tảng hệ thống lớn: Tiến hành thử nghiệm mô hình trên hệ thống với hàng trăm client giả lập, mô phỏng các kịch bản có tỉ lệ tham gia và phân phối dữ liệu phức tạp hơn nhằm kiểm tra khả năng mở rộng (scalability) và độ ổn định của thuật toán.
• Ứng dụng PSO trong các tầng khác của FL: Ngoài tầng tổng hợp mô hình, PSO có thể được áp dụng để chọn tham số huấn luyện tối ưu như learning rate, batch size, hoặc kiến trúc mạng (neural architecture search), giúp tối ưu toàn bộ quá trình học liên kết. Những định hướng trên không chỉ góp phần nâng cao hiệu quả của thuật toán học liên kết mà còn mở ra các cơ hội ứng dụng thực tiễn trong các hệ thống học máy phân tán, nơi mà dữ liệu không thể tập trung và yêu cầu bảo mật ngày càng cao.
2 Hướng giải quyết hiện tượng Overfitting
Để giảm thiểu hiện tượng overfitting trong FL, nhiều hướng nghiên cứu và phương pháp đã được đề xuất nhằm cải thiện khả năng tổng quát hóa mô hình trong bối cảnh dữ liệu phân tán và không đồng nhất. Dưới đây là các hướng phát triển chính:
1. Chính quy hóa (Regularization): [14] Các kỹ thuật chính quy hóa như L1, L2 hoặc Dropout có thể được áp dụng để giảm độ phức tạp của mô hình cục bộ trên các thiết bị, từ đó hạn chế việc mô hình học quá sát dữ liệu huấn luyện. Trong FL, việc áp dụng chính quy hóa cần được điều chỉnh phù hợp với dữ liệu không đồng nhất (non-IID) trên các thiết bị.
2. Tăng cường dữ liệu (Data Augmentation): [15] Sử dụng các kỹ thuật tăng cường dữ liệu cục bộ trên từng thiết bị giúp tăng tính đa dạng của dữ liệu huấn luyện, giảm nguy cơ overfitting do dữ liệu hạn chế hoặc thiên lệch. Các phương pháp như xoay ảnh, thêm nhiễu, hoặc tạo dữ liệu tổng hợp có thể được triển khai.
3. Dừng sớm (Early Stopping): [16] Kỹ thuật dừng sớm được áp dụng trong quá trình huấn luyện cục bộ để ngăn mô hình học quá mức các đặc trưng nhiễu trong dữ liệu. Trong FL, cần thiết kế cơ chế đồng bộ để đảm bảo dừng sớm không làm ảnh hưởng đến quá trình tổng hợp mô hình toàn cầu.
4. Tối ưu hóa thuật toán tổng hợp (Federated Optimization): [14] Các thuật toán như FedAvg hoặc FedProx có thể được cải tiến để giảm overfitting bằng cách thêm các số hạng phạt vào hàm mất mát, giúp cân bằng giữa hiệu suất cục bộ và toàn cầu. Ví dụ, FedProx sử dụng số hạng chính quy hóa để xử lý dữ liệu không đồng nhất.
5. Kết hợp Blockchain và FL: Kết hợp FL với công nghệ Blockchain, như đề xuất trong [17], giúp phát hiện và loại bỏ các mô hình cục bộ độc hại hoặc quá khớp thông qua các phương pháp như Cosine Similarity hoặc cơ chế chấm điểm node. Điều này cải thiện độ tin cậy và tổng quát hóa của mô hình toàn cầu.
6. Học chuyển giao (Transfer Learning): [18] Sử dụng các mô hình được huấn luyện trước (pre-trained models) để khởi tạo mô hình trong FL, giúp giảm nguy cơ overfitting khi dữ liệu cục bộ hạn chế. Phương pháp này đặc biệt hiệu quả trong các ứng dụng như thị giác máy tính hoặc xử lý ngôn ngữ tự nhiên.
7. Quyền riêng tư khác biệt (Differential Privacy): Áp dụng quyền riêng tư khác biệt vào FL không chỉ bảo vệ dữ liệu mà còn có thể hoạt động như một kỹ thuật chính quy hóa ngầm, giảm nguy cơ overfitting bằng cách thêm nhiễu vào các bản cập nhật mô hình. Các hướng phát triển này cần được nghiên cứu sâu hơn để tối ưu hóa hiệu suất trong các kịch bản thực tế, đặc biệt là khi đối mặt với dữ liệu không đồng nhất và các hạn chế về tài nguyên tính toán trên thiết bị biên.


