Tổng quan
Trong bối cảnh sản xuất công nghiệp hiện đại, giám sát thiết bị là yếu tố then chốt nhằm đảm bảo hoạt động ổn định, hạn chế rủi ro và nâng cao hiệu quả vận hành. Tuy nhiên, trong nhiều nhà máy hiện nay, các máy móc thường chỉ cung cấp thông tin vận hành thông qua màn hình HMI (Human-Machine Interface), và không cho phép truy xuất dữ liệu nội bộ do các ràng buộc kỹ thuật hoặc điều khoản hợp đồng từ nhà cung cấp thiết bị. Điều này dẫn đến một thách thức lớn: làm thế nào để thu thập và quản lý dữ liệu từ các thiết bị mà không can thiệp trực tiếp vào hệ thống phần mềm hay phần cứng?
Đề tài này đưa ra một giải pháp linh hoạt và sáng tạo: sử dụng camera để chụp lại màn hình HMI, kết hợp công nghệ OCR (Optical Character Recognition) để trích xuất dữ liệu số hóa, từ đó phân tích và giám sát các thông số kỹ thuật của thiết bị.
Phương pháp này không yêu cầu kết nối phần mềm với máy móc, đảm bảo tuân thủ các giới hạn kỹ thuật, đồng thời vẫn cho phép thu thập thông tin vận hành một cách gián tiếp và đáng tin cậy. Sau khi dữ liệu được trích xuất, hệ thống tiếp tục áp dụng mô hình ARIMA (Autoregressive Integrated Moving Average) – một phương pháp thống kê chuyên biệt cho phân tích chuỗi thời gian để:
- Dự báo xu hướng giá trị trong tương lai.
- Cảnh báo sớm các tình huống rủi ro có thể xảy ra. Hệ thống giám sát tập trung này giúp doanh nghiệp dễ dàng kiểm soát tình trạng thiết bị theo thời gian thực, tự động lưu trữ và phân tích dữ liệu, đồng thời hỗ trợ ra quyết định kịp thời. Với cách tiếp cận không xâm lấn, chi phí thấp và dễ triển khai, giải pháp hướng đến mục tiêu ứng dụng rộng rãi trong các nhà máy truyền thống, góp phần thúc đẩy quá trình chuyển đổi số trong sản xuất công nghiệp theo xu hướng Công nghiệp 4.0.
Trong khóa luận này, nhóm nghiên cứu đã xây dựng một hệ thống giám sát thiết bị công nghiệp theo cách tiếp cận không xâm lấn – sử dụng camera chụp lại màn hình HMI của máy móc, thay vì can thiệp vào phần mềm điều khiển vốn thường bị ràng buộc bởi hợp đồng bảo hành hoặc giới hạn kỹ thuật. Dữ liệu hình ảnh sau đó được xử lý bằng công nghệ OCR (PaddleOCR) để trích xuất giá trị số là nhiệt độ của các bộ phận máy dệt được thể hiện trên màn hình HMI, và được truyền qua MQTT về server để lưu trữ và phân tích bằng các mô hình dự đoán như ARIMA, GRU, LSTM và BiLSTM. Hệ thống sử dụng kiến trúc phân tầng gồm các node (ESP32-CAM, Raspberry Pi), gateway trung gian, và server xử lý trung tâm (MongoDB, Python, Winform UI), giúp dễ mở rộng và quản lý linh hoạt. Trong giai đoạn thử nghiệm thực tế tại nhà máy dệt bao bì, hệ thống cho thấy độ chính xác OCR lên đến 96.81%, mô hình ARIMA cho kết quả dự báo tốt với RMSE thấp, hỗ trợ phát hiện sớm các giá trị vượt ngưỡng theo thời gian thực. Giải pháp có chi phí thấp, dễ triển khai, không phụ thuộc vào hạ tầng phần mềm hiện hữu, hướng đến mục tiêu số hóTrong khóa luận này, nhóm nghiên cứu đã xây dựng một hệ thống giám sát thiết bị công nghiệp theo cách tiếp cận không xâm lấn – sử dụng camera chụp lại màn hình HMI của máy móc, thay vì can thiệp vào phần mềm điều khiển vốn thường bị ràng buộc bởi hợp đồng bảo hành hoặc giới hạn kỹ thuật. Dữ liệu hình ảnh sau đó được xử lý bằng công nghệ OCR (PaddleOCR) để trích xuất giá trị số là nhiệt độ của các bộ phận máy dệt được thể hiện trên màn hình HMI, và được truyền qua MQTT về server để lưu trữ và phân tích bằng các mô hình dự đoán như ARIMA, GRU, LSTM và BiLSTM. Hệ thống sử dụng kiến trúc phân tầng gồm các node (ESP32-CAM, Raspberry Pi), gateway trung gian, và server xử lý trung tâm (MongoDB, Python, Winform UI), giúp dễ mở rộng và quản lý linh hoạt. Trong giai đoạn thử nghiệm thực tế tại nhà máy dệt bao bì, hệ thống cho thấy độ chính xác OCR lên đến 96.81%, mô hình ARIMA cho kết quả dự báo tốt với RMSE thấp, hỗ trợ phát hiện sớm các giá trị vượt ngưỡng theo thời gian thực. Giải pháp có chi phí thấp, dễ triển khai, không phụ thuộc vào hạ tầng phần mềm hiện hữu, hướng đến mục tiêu số hóa sản xuất và cảnh báo sớm sự cố trong môi trường công nghiệp theo đúng tinh thần của chuyển đổi số và công nghiệp 4.0.a sản xuất và cảnh báo sớm sự cố trong môi trường công nghiệp theo đúng tinh thần của chuyển đổi số và công nghiệp 4.0.
Mục tiêu nghiên cứu
Với đề tài “Hệ thống quản lý tập trung thiết bị IoT công nghiệp”, mục tiêu chính là xây dựng một giải pháp hiệu quả và linh hoạt để quản lý tập trung các thiết bị theo dõi dữ liệu từ màn hình HMI trong môi trường công nghiệp.
Hệ thống sẽ tận dụng các thiết bị phần cứng hiện đại như Raspberry Pi, ESP32- Camera, và ESP32 để đảm bảo khả năng thu thập, xử lý, và truyền tải dữ liệu một cách chính xác và liên tục. Điểm nổi bật của hệ thống là khả năng cấu hình từ xa các thiết bị, giúp đơn giản hóa việc cài đặt, vận hành và bảo trì. Ngoài ra, hệ thống sẽ tích hợp các công nghệ truyền thông không dây tiên tiến như Wi-Fi và MQTT, kết hợp với module NRF24 để tạo ra một mạng lưới truyền thông ổn định, đáp ứng nhu cầu giao tiếp dữ liệu nhanh chóng và tiết kiệm năng lượng.
Hệ thống này không chỉ hỗ trợ việc giám sát các thông số quan trọng (như nhiệt độ, áp suất, hoặc các thông tin vận hành khác) mà còn đảm bảo tính linh hoạt khi mở rộng hoặc nâng cấp. Đồng thời, áp dụng mô hình ARIMA để dự báo chuỗi dữ liệu tiếp theo từ tập dữ liệu thu được từ màn hình HMI, đảm bảo độ chính xác và thời gian phản hồi nhanh. sẽ giúp tối ưu hóa hiệu suất vận hành, giảm thiểu thời gian
chết của thiết bị, và hướng đến việc xây dựng một hệ thống quản lý phù hợp với xu hướng chuyển đổi số trong công nghiệp 4.0.
Thông qua đề tài này, nhóm nghiên cứu hướng đến việc tạo ra một nền tảng quản lý dữ liệu hiệu quả, dễ triển khai và tiết kiệm chi phí, đồng thời góp phần nâng cao hiệu quả quản lý sản xuất cho doanh nghiệp.
Phạm vi nghiên cứu
Đề tài được thực hiện trong phạm vi kỹ thuật và ứng dụng như sau:
- Phạm vi thu thập dữ liệu: Dữ liệu được thu thập trực tiếp từ các màn hình HMI trong nhà máy sản xuất. Tuy nhiên, quá trình thu thập chỉ dừng lại ở cấp độ ảnh chụp màn hình, không can thiệp trực tiếp vào hệ thống phần mềm hay phần cứng của thiết bị để đảm bảo tuân thủ yêu cầu kỹ thuật và bảo hành của nhà cung cấp.
- Phạm vi triển khai thử nghiệm: Hệ thống được xây dựng và kiểm thử trong môi trường giả lập bao gồm máy tính cá nhân và phòng lab tại trường. Việc huấn luyện mô hình, xử lý dữ liệu và đánh giá kết quả được thực hiện độc lập, không triển khai trực tiếp trong môi trường sản xuất thực tế.
- Phạm vi phần cứng: Sử dụng các thiết bị như ESP32-CAM, Raspberry Pi, camera ELP để chụp ảnh màn hình HMI, truyền dữ liệu qua Wi-Fi hoặc NRF24 về máy chủ xử lý nội bộ qua MQTT.
- Phạm vi xử lý dữ liệu: Dữ liệu hình ảnh được xử lý bằng OCR để trích xuất chuỗi số liệu vận hành (như nhiệt độ, tốc độ, áp suất,…). Sau đó, các mô hình dự đoán chuỗi thời gian được áp dụng để đánh giá xu hướng và cảnh báo sớm.
- Phạm vi mô hình dự đoán bao gồm bốn mô hình được sử dụng:
o ARIMA: Cho dữ liệu tuyến tính, đơn giản – Mô hình chính.
o GRU: Nhẹ, nhanh huấn luyện – Mô hình dùng để so sánh.
o LSTM: Nhớ dài hạn, hiệu quả với dữ liệu dao động – Mô hình dùng để so sánh.
o BiLSTM: Tối ưu với chuỗi có ngữ cảnh hai chiều thời gian – Mô hình dùng để so sánh.
o Các mô hình này được đánh giá dựa trên độ chính xác (MAE, MAPE), thời gian huấn luyện và thời gian đưa ra dự đoán.
Thiết kế hệ thống
Để triển khai hệ thống, nhóm nghiên cứu đã thiết kế mô hình hệ thống với ba phần là Node, Server và Data Processing được thể hiện ở hình 3.1.

1. Lớp NODE
Đây là tầng thu thập dữ liệu bao gồm:
- NODE 1, NODE 2: Là các thiết bị đầu cuối gắn camera, thường là ESP32- CAM, Raspberry Pi hoặc module IP Camera. Nhiệm vụ chính là ghi nhận ảnh từ màn hình HMI thiết bị và truyền về gateway hoặc Server.
- Gateway: Tổng hợp dữ liệu từ các node, có thể xử lý sơ bộ hoặc chuyển tiếp ảnh về server chính.
2. Lớp SERVER
Chịu trách nhiệm xử lý trung tâm, bao gồm: - MongoDB: Lưu trữ ảnh gốc, kết quả OCR, log, và dữ liệu phân tích.
- MQTT Broker: Trung gian giao tiếp giữa các node và hệ thống cảnh báo. Mô hình publish/subscribe giúp các thiết bị giao tiếp linh hoạt.
- Website: Giao diện giám sát và cấu hình hệ thống. Cho phép người dùng xem ảnh nhận dạng, trạng thái node, cấu hình camera, khu vực đọc OCR.
- Ứng dụng Winform: Hệ thống giao diện quản lý cục bộ cho kỹ thuật viên tại nhà máy, thường dùng cho thao tác nhanh.
3. Lớp MODEL
Là tầng xử lý dữ liệu nâng cao, bao gồm: - PaddleOCR: Hệ thống nhận dạng ký tự quang học dùng để trích xuất giá trị từ ảnh màn hình HMI.
- ARIMA: Mô hình dự báo chuỗi dữ liệu, sau đó cập nhật các kết quả dự báo lên MongoDB.
4. Luồng dữ liệu
- Ảnh được gửi từ các node về server thông qua gateway hoặc mạng nội bộ.
- Ảnh được lưu vào MongoDB và đồng thời đưa vào PaddleOCR để trích xuất giá trị số.
- Kết quả OCR được lưu kèm ảnh trong MongoDB, đồng thời được hiển thị trên Website giúp người dùng dễ dàng giám sát dữ liệu.



Kết luận
Hệ thống giám sát thiết bị đã được triển khai thành công theo phương pháp không xâm lấn, đảm bảo tính an toàn và thuận tiện trong việc tích hợp vào hệ thống hiện có. Trong quá trình triển khai, nhóm đã xây dựng và sử dụng tập dữ liệu thu thập được để huấn luyện các mô hình dự báo chuỗi thời gian. Kết quả cho thấy mô hình ARIMA có khả năng dự báo chính xác chuỗi dữ liệu nhiệt độ, chứng minh hiệu quả
và tính khả thi của phương pháp tiếp cận trong điều kiện thực tế.
Tuy nhiên, hệ thống vẫn tồn tại một số hạn chế nhất định. Hiệu quả nhận diện văn bản và kết quả dự báo chịu ảnh hưởng đáng kể bởi chất lượng ảnh đầu vào từ HMI, đặc biệt trong những điều kiện ánh sáng môi trường không ổn định. Bên cạnh đó, hệ thống hiện tại chưa hỗ trợ xử lý dữ liệu và phát cảnh báo theo thời gian thực, dẫn đến độ trễ trong việc phản hồi các tình huống cần xử lý nhanh.
Hướng phát triển
Để phát triển đề tài hiện tại nhóm nghiên cứu đề xuất sử dụng các mô hình học sâu để tăng độ chính xác cho dự đoán của hệ thống. Sử dụng camera có độ phân giải cao hơn, áp dụng các biện pháp chống chói cho camera. Tiến hành thử nghiệm trên các loại thiết bị công nghiệp có màn hình HMI khác để đánh giá thêm hiệu suất của hệ thống.


