Xây dựng mô hình đánh giá chất lượng đường bộ

BUILDING ROAD QUALITY ASSESSMENT MODEL

Nhận thức được tầm quan trọng của việc nâng cao quá trình đánh giá chất lượng hệ thống đường bộ qua những hạn chế trên, nhóm chúng tôi quyết định đề xuất một giải pháp mới nhằm cải thiện quá trình phân loại, đánh giá chất lượng đường bộ. Cụ thể, nhóm xây dựng một mô hình học sâu có tên là ResEViT-Road, với sự kết hợp kiến trúc CNN (Convolutional Neural Network) và ViT (Vision Transformer) để phân loại chất lượng đường bộ dựa trên các hình ảnh thu thập được từ hệ thống giám sát hoặc các thiết bị di động. Mô hình được thiết kế để vừa gọn nhẹ, có thể triển khai trên các thiết bị biên với tài nguyên tính toán giới hạn, nhưng vẫn đảm bảo được độ chính xác cao với quy mô đánh giá chất lượng toàn diện hơn.

Xem toàn văn báo cáo tại:

TÁC GIẢ

Nguyễn Trà Bảo Ngân, Nguyễn Cao Thi

GIẢNG VIÊN HƯỚNG DẪN

NGÀNH

Năm:

Tổng quan

Trong những năm gần đây, sự lớn mạnh không ngừng của trí tuệ nhân tạo đã và đang khẳng định vị thế cốt lõi, kiến tạo nên những bước chuyển đột phá, định hình lại mô hình phát triển kinh tế – xã hội, đem lại hàng ngàn lợi ích đối với sự phát triển toàn cầu về mọi mặt. Máy học (Machine learning) và học sâu (Deep learning) đã có những bước tiến đáng kể và mở ra hàng ngàn ứng dụng rộng rãi trong hầu hết lĩnh vực thực tiễn. Trong đó, thị giác máy tính (Computer vision) là một trong số các lĩnh vực nổi bật nhất của học sâu, đem lại nhiều đóng góp to lớn trong các tác vụ nhận diện đối tượng, phân loại ảnh, phát hiện vật thể.

Hòa chung dòng chảy tiến bộ này, việc ứng dụng học sâu vào phân tích và phân loại hình ảnh đường bộ đã nổi lên như một lĩnh vực đầy tiềm năng, thu hút sự chú ý của đông đảo cộng đồng công nghệ trên toàn thế giới. Hàng loạt các đóng góp sáng tạo, các công trình nghiên cứu được đề xuất từ nhiều nhà nghiên cứu, nhóm nghiên cứu khác nhau hứa hẹn mang lại tiềm năng tự động hóa và tối ưu hóa cho công tác quản lý, bảo trì và phát triển cơ sở hạ tầng giao thông. Tuy nhiên, một câu hỏi lớn vẫn được đặt ra giữa vô vàn những đóng góp khoa học ấy, liệu có bao nhiêu ứng dụng thực sự chứng minh được tính hiệu quả và thiết thực trong các tình huống thực tế được áp dụng và việc triển khai, việc vận hành có rộng rãi, có mang lại giá trị bền vững hay không? Có thể thấy được khoảng cách giữa lý thuyết và ứng dụng thực tiễn vẫn đang là một thách thức to lớn.

Chính vì lẽ đó, khóa luận này được thực hiện với mục tiêu thu hẹp khoảng cách nêu trên bằng cách tập trung vào nghiên cứu, thiết kế và phát triển một mô hình học sâu tiên tiến, mạnh mẽ dành riêng cho nhiệm vụ phân loại chất lượng đường bộ. Phương pháp tiếp cận của chúng tôi đi sâu vào việc nghiên và áp dụng những kiến trúc học sâu tiên tiến nhất hiện nay, bao gồm mạng nơ-ron tích chập (Convolution Neural Network) và biến thể Transformer cho thị giác máy tính (Vision Transformer). Sự lựa chọn kết hợp hai mô hình này nhằm mục đích tối ưu hóa hiệu suất mô hình và quan trọng hơn là đảm bảo mô hình đủ nhỏ gọn để triển khai hiệu quả trên các thiết bị có tài nguyên phần cứng hạn chế như Raspberry Pi và Jetson Nano. Từ đó có thể hiện thực hóa việc ứng dụng rộng rãi mô hình học sâu này vào thực tế trong công tác đánh giá cơ sở hạ tầng đường bộ, đặc biệt với phạm vi một thành phố lớn và năng động như Thành phố Hồ Chí Minh.

Đối tượng nghiên cứu

Đối tượng nghiên cứu chính của đề tài được xác định cụ thể như sau:

  • Các mô hình học sâu: Nghiên cứu sẽ tập trung vào việc nghiên cứu, tìm hiểu về các phương pháp học sâu hiện đại, cụ thể là những kiến trúc như mạng nơ-ron tích chập – CNN, Vision Transformer – ViT, cùng với đó là các kiến trúc nổi bật phát triển từ CNN và ViT như ResNet, EfficientViT cũng được tiếp cận và ứng dụng vào mô hình để đảm bảo việc tối ưu hóa hiệu suất mô hình.
  • Thiết bị biên IoT: Lựa chọn thiết bị biên phù hợp với ngữ cảnh triển khai thực tế cũng là một đối tượng trong đề tài nghiên cứu này. Cụ thể Jetson Nano và Raspberry Pi là hai thiết bị mục tiêu được nhóm lựa chọn. Quá trình nghiên cứu sẽ bao gồm việc so sánh hiệu năng, sự ổn định và tương thích của mô hình trên từng thiết bị. Từ đó, có thể đưa ra nhận định về việc lựa chọn thiết bị phù hợp, tối ưu cho từng tình huống cụ thể.
  • Hệ thống theo dõi và quản lý: Xây dụng một ứng dụng theo dõi và giám sát hoạt động của mô hình khi được gắn vào các phương tiện di chuyển trong thực tế. Hệ thống này sẽ thu thập dữ liệu, hiển thị kết quả phân loại chất lượng một cách trực quan, hỗ trợ người dùng cuối trong việc bảo trì đường bộ.

Phạm vi nghiên cứu

Tính khả thi trong nghiên cứu là điều quan trọng hàng đầu, do đó phạm vi nghiên cứu sẽ được giới hạn như sau:

  • Tập dữ liệu huấn luyện và kiểm thử: Dữ liệu huấn luyện và kiểm thử sẽ tập trung vào một số khu vực địa lý và loại đường bộ cụ thể. Hai tập dữ liệu được sử dụng là Crowdsensing-based Road Damage Detection Challenge (CRDDC-2022), một tập dữ liệu công khai về tình trạng mặt đường bê tông trên các quốc gia khác nhau và Road_CLS_quality [9], một tập dữ liệu đa dạng hơn về loại mặt đường. Việc sử dụng 2 loại tập dữ liệu này hướng đến 2 bài toán phân loại nhị phân và đa lớp, chứng minh rằng mô hình có thể chạy được trên nhiều tập dữ liệu khác nhau.
  • Ngữ cảnh triển khai phần cứng: Đề tài tập trung vào việc triển khai mô hình trên hai loại thiết bị tính toán biên là Raspberry Pi 4 model B và Jetson Nano 2GB. Kết luận sau đó sẽ đánh giá được hiệu suất mô hình triển khai trên hai loại thiết bị cũng như chứng minh được sự gọn nhẹ, hiệu quả khi triển khai trên các thiết bị có phần cứng giới hạn.

PHƯƠNG PHÁP TIẾP CẬN

image 9

Trong nghiên cứu này, chúng tôi lựa chọn khai thác khả năng trích xuất đặc trưng cục bộ mạnh mẽ của ResNet [16] cho nhánh CNN và sức mạnh mô hình hóa mối quan hệ toàn cục của EfficientViT cho nhánh Attention. Kiến trúc tổng thể được chia thành bốn giai đoạn (stages). Sau mỗi giai đoạn, một khối tương tác (Interactive Block) được tích hợp để cho phép trao đổi và bổ sung thông tin giữa hai luồng đặc trưng. Cuối cùng, một khối kết hợp (Combine Block) sẽ hợp nhất các biểu diễn đặc trưng cấp cao từ hai nhánh để đưa ra dự đoán cho bài toán phân loại. Chi tiết của kiến trúc đề xuất được minh họa trong Hình 3.1.

image 10
image 11
image 12

Triết lý tiếp cận

Phương pháp tiếp cận của chúng tôi được xây dựng dựa trên nguyên tắc cốt lõi là cân bằng giữa độ chính xác và hiệu quả tính toán. Để đạt được kiến trúc đã nêu ở trên, chúng tôi tuân thủ các triết lý thiết kế sau đây.

Thứ nhất, chúng tôi đã phân tích, đánh giá và tinh chỉnh mô hình bằng cách lược bỏ các khối yêu cầu số lượng tính toán lớn nhưng đóng góp không đáng kể vào kết quả cuối cùng, cũng như các khối có chức năng trùng lặp. Tiếp đó, điểm trọng tâm ở nghiên cứu này là việc đề xuất khối tương tác (Interactive Block) và khối kết hợp (Combine Block). Khi đã loại bỏ các khối để tối ưu sự phức tạp của mô hình, cũng như việc triển khai hai kiến trúc độc lập, dẫn đến các thành phần còn lại thiếu sự liên kết. Do đó, cần xây dựng các liên kết giữa chúng, nhưng đảm bảo tính gọn nhẹ của thiết kế. Cuối cùng, các tham số quan trọng của mô hình, từ số lượng kênh đặc trưng, đến số lượng của từng thành phần đã được lựa chọn và tinh chỉnh cẩn thận thông qua quá trình thực nghiệm để đạt được hiệu suất tối ưu nhất.

Kết quả là một kiến trúc lai (hybrid) vừa mạnh mẽ trong việc trích xuất đặc trưng đa dạng, vừa hợp lý về mặt tài nguyên tính toán, đã được đề xuất để phục vụ cho mục đích của khóa luận này

HỆ THỐNG PHÂN LOẠI CHẤT LƯỢNG ĐƯỜNG

Tổng quan kiến trúc của hệ thống

Hệ thống phân loại chất lượng đường bộ được xây dựng dựa trên kiến trúc tích hợp giữa thiết bị biên, mô hình học sâu và nền tảng web. Hình 5.1 mô tả chi tiết kiến trúc và hoạt động của toàn bộ hệ thống.

image 13

Thiết bị biên gồm 1 Jetson Nano, mô hình học sâu được tích hợp trong Jetson, mô-đun GPS và camera gắn trên mỗi phương tiện di chuyển để thu thập dữ liệu mặt đường bộ. Khi phương tiện di chuyển, thiết bị sẽ tự động chụp ảnh mặt đường và lấy thông tin vị trí tương ứng thông qua tín hiệu GPS. Dữ liệu này sau đó được xử lý ngay trên Jetson, nơi đã được tích hợp sẵn mô hình học sâu ResEViT–Road, để phân
loại tình trạng mặt đường.

Vì hình ảnh được chụp, phân loại sau đó gửi ngay lên server thông qua mạng internet, do đó cần một đường truyền tốt. Tuy nhiên, trong một số trường hợp bất khả kháng như ngoài vùng phủ sóng, không có kết nối internet hoặc đường truyền bị ảnh hưởng bởi các yếu tố bên ngoài, hình ảnh phân loại sẽ không được lưu và có thể bị bỏ lỡ các tuyến đường hư cần phân loại. Do đó, một bộ nhớ đệm (cache) được triển khai trên Jetson Nano giúp khắc phục tình trạng mất dữ liệu đó.

Kết quả phân loại sẽ được gửi đến máy chủ trung tâm để lưu trữ và quản lý. Từ máy chủ, dữ liệu tiếp tục được truyền tới giao diện website nhằm trực quan hóa thông tin cho người dùng. Trên nền tảng web, người dùng có thể truy cập và theo dõi tình trạng mặt đường theo từng khu vực cụ thể thông qua các hình ảnh đã được gắn vị trí và phân loại.

Toàn bộ quy trình được thiết kế nhằm đảm bảo việc thu thập, xử lý và trình bày thông tin được thực hiện một cách tự động, liên tục và chính xác, góp phần hỗ trợ các đơn vị quản lý hạ tầng giao thông trong việc giám sát và bảo trì đường bộ một cách hiệu quả hơn.

KẾT LUẬN

Kết quả đạt được

Kiến trúc đề xuất ResEViT-Road của nhóm chúng tôi đã mang lại nhiều kết quả tích cực trong ứng dụng vào các tác vụ phân loại hình ảnh đường bộ, với những đóng góp đáng kể ở các khía cạnh sau:
1 Hiệu suất mô hình

Trong nghiên cứu, chúng tôi xây dựng một mô hình kết hợp ResNet và EfficientViT bằng cách triển khai hai nhánh song song, nhằm tích hợp thiên vị quy nạp với phụ thuộc tầm xa. Cụ thể, nhóm đã thiết kế một khối tương tác (Interactive Block) để tương tác với các tính năng cục bộ và toàn cục, cũng như một khối kết hợp (Combine Block) để tổng hợp thông tin từ cả hai nhánh. Kết quả là, chúng tôi đã đạt được hiệu suất tốt trên hai tập dữ liệu, đó là tập dữ liệu phân loại nhị phân (CRDDC–2022) và tập dữ liệu phân loại đa lớp (Road_CLS_quality), cũng như đạt hiệu suất vượt trội trên các thiết bị có khả năng tính toán hạn chế. Thêm vào đó, nhóm đã xây dựng được một hệ thống toàn diện bao gồm xử lý và phân loại chất lượng đường tại thiết bị biên, đồng thời lưu trữ trên hệ thống máy chủ và trực quan bởi giao diện web.

2 Đóng góp khoa học

Qua nghiên cứu của nhóm, đây là một trong những đề tài đầu tiên xây dựng mô hình học sâu để phân loại chất lượng đường bộ theo hướng gọn nhẹ, có thể triển khai trên các thiết bị có phần cứng hạn chế, ví dụ như trên Raspberry Pi 4 và Jetson Nano, hai máy tính nhúng mà đề tài của nhóm đã thực hiện triển khai. Cũng như đi đầu trong việc lắp đặt các thiết bị này trên phương tiện giao thông nhằm đánh giá chất lượng đường bộ một cách tự động. Bên cạnh đó, chúng tôi đã đề xuất một kiến trúc hệ thống cùng quy trình xử lý nền tảng toàn diện, cho phép các nghiên cứu được triển khai hoàn chỉnh từ khâu xây dựng mô hình, thực thi trên thiết bị, đánh giá và trực quan hóa chất lượng đường.

Do đó, đóng góp của chúng tôi sẽ là một nền tảng hữu ích cho các nghiên cứu về vấn đề đánh giá chất lượng đường bộ, một vấn đề nóng bỏng trong thời đại giao thông đường bộ là huyết mạch phát triển của một quốc gia.

3 Đóng góp về mặt kinh tế – xã hội

Nước ta là một nước đang phát triển rất mạnh về cả kinh tế và xã hội, cũng như đang có một vị thế nhất định trên thị trường quốc tế. Tuy nhiên, một tình trạng mà nước ta đang đối mặt là chất lượng đường giao thông vận tải đang xuống cấp nghiêm trọng, điều đó kìm hãm sự phát triển của đất nước. Với tình trạng như vậy, nhà nước đã triển khai hàng loạt các biện pháp để khắc phục tình trạng đường hư hỏng, nhưng hiệu quả thì chưa cao do còn phát hiện địa điểm đường hư một cách thủ công bằng sức người với tốc độ khá chậm.

Do đó, một giải pháp mới hiệu quả hơn, tiết kiệm chi phí hơn và nhanh chóng hơn là điều cấp thiết. Mặt khác, trí tuệ nhân tạo đang phát triển cực kỳ mạnh mẽ, nó được áp dụng trong từng ngóc ngách và đa dạng lĩnh vực trong cuộc sống, giúp xã hội cải thiện năng suất công việc, giảm thời gian và tiết kiệm chi phí một cách đáng kể. Từ đó nhận thấy rằng tiềm năng của trí tuệ nhân tạo và việc áp dụng nó vào vấn đề phát hiện đường hư hỏng chỉ còn là công việc sớm hay muộn.

Bởi những lý do đó, phương pháp của chúng tôi đã được đề xuất. Đóng góp này giúp phát hiện đường một cách tự động và nhanh chóng, cũng như tiết kiệm đáng kể cho ngân sách quốc gia. Ví dụ, triển khai giải pháp này cho khu vực thành phố Hồ Chí Minh bằng cách lắp đặt các thiết bị đã được tích hợp mô hình phân loại chất lượng đường gọn nhẹ lên một số lượng lớn các phương tiện công cộng. Khi các phương tiện này vận hành, hình ảnh về các điểm hư hỏng sẽ được thu thập liên tục, định vị vị trí và truyền tải về hệ thống quản lý trung tâm. Từ đó, cho phép cơ quan có thẩm quyền giám sát tình trạng hạ tầng một cách hiệu quả và có thể tối ưu hóa việc điều phối nguồn lực cho công tác duy trì, sửa chữa kịp thời.

Hạn chế

Chúng tôi chỉ phát triển mô hình cho nhiệm vụ phân loại, tuy nhiên trong thực tế đòi hỏi một mô hình có thể thực hiện với nhiều nhiệm vụ hơn như phát hiện đối tượng và phân đoạn ngữ cảnh. Đồng thời, nghiên cứu chưa đánh giá về tình trạng kết nối trong quá trình vận hành, đây cũng là một yếu tố quyết định hiệu quả, vì hệ thống được triển khai trong môi trường mạng không dây rất nhạy cảm với các yếu tố tự nhiên.

Cũng như, hệ thống ResEViT-Road vẫn còn một số hạn chế kỹ thuật cần được cải thiện. Cụ thể, hệ thống chưa được trang bị các giải pháp giúp ổn định hình ảnh trong quá trình thu thập dữ liệu mặt đường, điều này có thể ảnh hưởng đến chất lượng và độ chính xác của hình ảnh khi phương tiện di chuyển gặp rung lắc. Bên cạnh đó, hệ thống hiện tại còn thiếu cơ chế cân bằng tải và đảm bảo hiệu suất xử lý ổn định khi có số lượng lớn thiết bị biên hoạt động đồng thời. Cuối cùng, giao diện người dùng cần được cải thiện để trực quan hơn, để dễ dàng trong nhiệm vụ quan sát, phân tích dữ liệu và quản lý hệ thống.

Hướng phát triển

Nghiên cứu của chúng tôi cho thấy hiệu suất vượt trội trong nhiều trường hợp và có thể phát triển trong tương lai. Tuy nhiên, nghiên cứu còn một vài điểm hạn chế đã được đề cập ở mục 6.1.2, từ những hạn chế đó chúng tôi lên một kế hoạch cho đề tài để phát triển trong tương lai như sau.

Đầu tiên, phát triển mô hình với khả năng đa nhiệm, không chỉ thực hiện phân loại chất lượng đường mà còn phải khoanh vùng được vị trí đường bị hư hỏng và phân đoạn ngữ cảnh mặt đường để có cái nhìn tổng thể về tình trạng mặt đường. Khi cải thiện mô hình với những chức năng như vậy, chắc chắn mô hình sẽ tăng độ phức tạp và thời gian thực thi. Điều đó dẫn đến một công việc trong tương lai là phải tối ưu mô hình vừa sở hữu khả năng thực hiện nhiều nhiệm vụ, đồng thời cũng phải gọn nhẹ, hiệu quả và tối ưu về mặt thời gian suy luận.

Về vấn đề chất lượng đường truyền, do hệ thống của chúng tôi được vận hành trong điều kiện mà một thay đổi nhỏ của môi trường cũng có thể ảnh hưởng đến kết nối không dây. Vì vậy, trong tương lai, việc tích hợp một cơ chế để ước tính chất lượng mạng không dây là thiết yếu, giúp đưa ra những hành động kịp thời. Để chuẩn bị cho công việc tương lai đó, chúng tôi cũng đã thực hiện đề xuất một phương pháp để phân loại chất lượng kết nối không dây cho các thiết bị IoT dựa trên mô hình học sâu. Phương pháp này đã đạt được một số kết quả sơ bộ và được chúng tôi trình bày trong phần Phụ lục B.

Việc tích hợp các mô hình trí tuệ nhân tạo (AI) vào môi trường vận hành thực tế, đặc biệt là trong bối cảnh Internet vạn vật (IoT), vốn tiềm ẩn nhiều thách thức đáng kể. Trong nghiên cứu này, chúng tôi nhận thấy việc triển khai mô hình AI lên các thiết bị biên (edge devices) còn một số giới hạn nhất định. Do đó, một trong những mục tiêu tiếp theo của đề tài là phát triển và ứng dụng các kỹ thuật tiên tiến bao gồm chống rung lắc, khử nhiễu chói và tối ưu hóa điều kiện chiếu sáng. Những cải tiến này nhằm mục đích ổn định hóa quy trình thu thập dữ liệu hiện trạng mặt đường, từ đó nâng cao đáng kể chất lượng và độ chính xác của mô hình dự đoán đường hư hỏng.

Cuối cùng, hệ thống ResEViT-Road yêu cầu tập trung cải tiến độ tin cậy, khả năng mở rộng và tính tương tác. Để đạt được điều này, chúng tôi sẽ triển khai các giải pháp cân bằng tải hiện đại, đồng thời tận dụng sức mạnh của các dịch vụ điện toán đám mây phổ biến (ví dụ: AWS, Azure, Google Cloud) nhằm đảm bảo khả năng đáp ứng, tính sẵn sàng và hiệu suất ổn định ngay cả khi số lượng thiết bị đầu cuối gia tăng đáng kể. Bên cạnh đó, một trọng tâm quan trọng là hoàn thiện giao diện người dùng, hướng tới việc cung cấp một hệ thống quản lý thiết bị trực quan, kèm theo các tính năng phân tích và hiển thị dữ liệu thống kê một cách khoa học và dễ hiểu.