Tổng quan đồ án
Việc đảm bảo an toàn giao thông là một vấn đề cấp bách ở Việt Nam, đặc biệt là đối với người tham gia giao thông bằng xe máy. Theo thống kê, tỷ lệ người không đội mũ bảo hiểm khi tham gia giao thông còn khá cao, dẫn đến nhiều vụ tai nạn thương tâm. Với công nghệ AI, ta có thể nhận dạng được những người đi xe máy không đội mũ bảo hiểm và đưa ra hình phạt thích đáng, từ đó, nâng cao ý thức của người dân và đảm bảo sự an toàn của người tham gia giao thông.
Để thực hiện nhận diện ta cần có một mô hình máy học phù hợp cho các thiết bị IOT như camera bên đường, một trong những mô hình tốt nhất hiện này chính là YOLO. Mô hình này hiện nay vô cùng phổ biến cho các công việc nhận diện hình ảnh, có độ phức tạp không quá cao, phù hợp cho các thiết bị có phần cứng yếu như camera bên đường. Nhưng vấn đề chung của huấn luyện mô hình AI đó chính là lượng dữ liệu cần thiết để thực hiện huấn luyện là rất lớn, để làm được điều đó thì camera phải ghi hình 24/7 và gửi ảnh về một bộ phận trung tâm để có thể tổng hợp mô hình lại, điều này làm dấy lên nhiều vấn đề như xâm phạm quyền riêng tư, hiệu suất truyền dữ liệu từ camera tới trung tâm giảm đáng kể và nguy cơ bị tấn công cao. Vì thế, để tối ưu một hệ thống như thế cần sử dụng một phương pháp như (Federated Learning – FL).
Federated Learning cho phép dữ liệu dùng để huấn luyện mô hình AI nằm trên các camera mà không cần truyền đi đến bộ phận trung tâm mà có thể tự huấn luyện trên phần cứng của camera. Điều này giúp đảm bảo sự riêng tư của người dùng cũng như không cần phải truyền một lượng lớn dữ liệu hình ảnh từ camera tới trung tâm. Với những thành phần trên chúng ta có thể xây dựng một hệ thống nhận diện để có thể nâng cao nhận thức của người đi xe với hiệu suất cao và vẫn đảm bảo sự riêng tư của người dùng.
Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu: YOLOv5; phương pháp học tập liên kết FL
Phạm vi nghiên cứu: Phương pháp xử lý dữ liệu cho phù hợp với định dạng của YOLO. Cách vận hành và thực hiện huấn luyện mô hình AI trên YOLOv5 bằng phương pháp học tập liên kết FL. Đánh giá kết quả đạt được của mô hình.
Nội dung đồ án
“You Only Look Once” (YOLO) là một thuật toán phát hiện đối tượng thời gian thực nổi tiếng trong lĩnh vực thị giác máy tính. YOLO được giới thiệu lần đầu tiên bởi Joseph Redmon và các đồng nghiệp vào năm 2016. Đây là một trong những thuật toán tiên tiến nhất về phát hiện đối tượng nhờ vào tốc độ và độ chính xác cao.
YOLO đã đánh dấu một bước ngoặt quan trọng nhờ cách tiếp cận sáng tạo trong lĩnh vực phát hiện đối tượng. Bằng cách đồng thời phát hiện và phân loại đối tượng chỉ trong một lần duyệt qua mạng nơ-ron tích chập (Convolutional Neural Network – CNN), thuật toán này đã kết hợp được tốc độ xử lý thời gian thực và độ chính xác cao.
Thiết kế mạng:

Kiến trúc mạng YOLOv1 được lấy ý tưởng từ mô hình GoogLeNet cho phân loại ảnh. Nó gồm có 24 Convolutional Layers dùng để trích xuất các features từ bức ảnh, theo sau bởi 2 Fully Connected Layers để dự đoán output probabilities và coordinates. Thay vì sử dụng inception modules trong GoogLeNet, YOLO chỉ sử dụng reduction layers có kích thước 1×1 theo sau bởi Convolutional Layers có kích thước 3×3. Layer cuối cùng của network là các dự đoán ở dạng tensor với kích thước 7×7×30.
Các Convolutional Layers được pretrain trên trên tập dữ liệu ImageNet cho việc phân loại ảnh với độ phân giải 224×224, rồi sau đó gấp đôi độ phân giải cho việc detection.
Federated learning (thường được gọi là học liên kết) là một phương pháp phi tập trung để đào tạo các mô hình học máy. Nó không yêu cầu trao đổi dữ liệu từ các thiết bị client đến các máy chủ toàn cầu. Thay vào đó, dữ liệu nguyên gốc trên các thiết bị biên được sử dụng để đào tạo mô hình cục bộ, từ đó nâng cao quyền riêng tư dữ liệu. Cuối cùng, mô hình được hình thành bằng cách tổng hợp các bản cập nhật cục bộ.

Kết quả
Vì chúng em đã gặp lỗi kỹ thuật khi thực hiện việc huấn luyện dữ liệu mà chúng em thu thập được trên roboflow sử dụng phương pháp federated learning nên chúng em chỉ có thể thực hiện centralized learning với lượng dữ liệu trên. Kết quả thu dược bao gồm:


Kết luận
Dự án huấn luyện mô hình học máy bằng phương pháp Federated Learning (FL) đã gặp phải một số khó khăn và chưa thể hoàn thành theo đúng kế hoạch. Tuy nhiên, vẫn còn tiềm năng để tiếp tục phát triển dự án với những sửa đổi và cải tiến phù hợp.
- Nguyên nhân: Việc triển khai FL có thể gặp nhiều thách thức do tính phức tạp của thuật toán, sự phân tán của dữ liệu và tài nguyên phần cứng.
- Kết quả: Mặc dù chưa hoàn thiện, dự án đã mang lại một số kết quả nhất định, bao gồm:
o Mô hình đã được huấn luyện tập trung và cho ra kết quả
o Thu thập được dữ liệu và kinh nghiệm trong việc triển khai FL.
o Hiệu suất mô hình centralized đạt được mục tiêu ở mức khá. - Hạn chế:
o Gặp khó khăn trong việc tích hợp và quản lý các thiết bị nhúng.
o Không triển khai được việc huấn luyện Federated Learning.


