Tổng quan
Trong những năm gần đây, xu thế chuyển đổi số đang diễn ra mạnh mẽ ở gần như mọi lĩnh vực trong đời sống, trong đó lĩnh vực giáo dục đại học cũng không ngoại lệ. Việc tối ưu hoá quy trình vận hành và nâng cao chất lượng hỗ trợ cho người học và người dạy đã trở thành một yêu cầu cấp thiết, đòi hỏi các trường phải không ngừng đổi mới và thích ứng.
Tuy nhiên, bối cảnh thực tế là đa số các cơ sở đào tạo đại học vẫn còn tồn tại hai thách thức lớn: Thứ nhất, đối với học sinh, phụ huynh đang muốn tìm ngành học phù hợp gặp nhiều rào cản trong việc tiếp cận nguồn tin thông tin chính xác, kịp thời và đầy đủ về các chương trình đào tạo ngày càng đa dạng và phức tạp. Hệ quả tất yếu là tình trạng lựa chọn ngành học không phù hợp với năng lực, sở thích và định hướng nghề nghiệp vẫn diễn ra phổ biến. Đồng thời, ngay cả với sinh viên trong trường, việc tra cứu và tiếp cận thông tin chi tiết về chương trình đào tạo hiện hành cũng gặp nhiều khó khăn, các bạn không biết cần phải chuẩn bị gì trước khi vào học kỳ mới, điều này vô tình sẽ dẫn đến bộ phận hỗ trợ sinh viên bị quá tải. Thứ hai, về phía đội ngũ giảng viên phải dành một khối lượng thời gian và công sức đáng kể cho công tác đánh giá và chấm điểm các văn bản học thuật như đề cương hay khoá luận. Đây là một quy trình đòi hỏi sự tỉ mỉ nhưng lại mang tính lặp lại cao, tiềm ẩn nguy cơ thiếu tính nhất quán trong đánh giá, đồng thời làm hạn chế thời gian mà giảng viên có thể đầu tư cho các hoạt động nghiên cứu và giảng dạy.
Các giải pháp truyền thống như website hay hệ thống trả lời câu hỏi thường gặp (FAQ) kém linh hoạt và chưa đáp ứng được nhu cầu truy vấn thông tin theo thời gian thực. Sự ra đời của các Mô hình Ngôn ngữ lớn (LLMs) đã mở ra một hướng đi đầy hứa hẹn. Mặc dù vậy, việc ứng dụng trực tiếp các Large Language Models (LLMs) phổ biến như: ChatGPT, Gemini, Claude,… bộc lộ những hạn chế cố hữu, đặc biệt là hiện tượng ảo giác (hallucination) – tự tạo ra thông tin sai lệch, và giới hạn tri thức (knowledge cutoff) – không được cập nhật với các quy định, tài liệu mới nhất của một tổ chức cụ thể. Những yếu tố này khiến chúng không đủ độ tin cậy để trở thành nguồn thông tin tham chiếu chính thức.
Để giải quyết các vấn đề nêu trên, đề tài “Xây dựng hệ thống multi-agent trợ lý ảo hỗ trợ sinh viên, giảng viên” được đề xuất với mục tiêu nghiên cứu và triển khai các kiến trúc Trí tuệ Nhân tạo tạo sinh tiên tiến. Cụ thể, đề tài tập trung vào hai giải pháp đột phá:
- Đối với bài toán hỏi-đáp, khoá luận áp dụng kiến trúc Retrieval-Agumented Generation (RAG). Kiến trúc này kết hợp khả năng ngôn ngữ của LLMs với một cơ sở tri thức được kiểm chứng, cho phép hệ thống truy xuất các thông tin liên quan từ tài liệu nguồn của nhà trường trước khi sinh ra câu trả lời. Cách tiếp cận này trực tiếp khắc phục các nhược điểm của LLMs, đảm bảo các câu trả lời không chỉ chính xác, phù hợp ngữ cảnh mà còn có khả năng trích dẫn nguồn gốc, tăng cường tối đa độ tin cậy.
- Đối với bài toán đánh giá, đề tài đề xuất một kiến trúc Tác nhân Artificial Intelligence (AI) có cấu trúc, được hiện thực hóa bằng thư viện LangGraph. Thay vì một tương tác hỏi-đáp đơn giản, phương pháp này cho phép mô hình hóa quy trình đánh giá thành một đồ thị các bước có trạng thái (stateful graph). Tác nhân có thể tự động thực hiện một chuỗi các hành động như phân tích các phần như: cấu trúc, nội dung, ngôn ngữ và đối chiếu với bộ tiêu chí cho trước và cuối cùng là tổng hợp các đánh giá của từng phần. Điều này không chỉ giúp tự động hóa một tác vụ phức tạp mà còn đảm bảo tính nhất quán và minh bạch trong quá trình đánh giá.
Vì vậy, việc thực hiện đề tài này không chỉ mang ý nghĩa thực tiễn trong việc tạo ra một công cụ hữu ích, giúp nâng cao hiệu quả công tác đào tạo tại trường đại học, mà còn có giá trị khoa học khi đóng góp vào việc nghiên cứu ứng dụng các kiến trúc AI tạo sinh thế hệ mới vào giải quyết những bài toán nghiệp vụ chuyên sâu trong lĩnh vực công nghệ giáo dục.
Mục tiêu nghiên cứu
- Tổng hợp và phân tích sâu các công nghệ nền tảng, bao gồm các Mô hình Ngôn ngữ lớn (LLMs), kiến trúc RAG để giải quyết bài toán hỏi-đáp có căn cứ, và kiến trúc Tác nhân AI với các công cụ như LangGraph để mô hình hóa các quy trình phức tạp.
- Xây dựng một mô hình kiến trúc phần mềm toàn diện, có khả năng tích hợp và điều phối hoạt động của nhiều tác tử chuyên biệt, đảm bảo tính module hóa, khả năng mở rộng và bảo trì.
- Hiện thực các tác nhân AI: Phát triển Tác nhân Hỏi đáp Tài liệu có khả năng truy xuất thông tin từ một cơ sở tri thức cục bộ (văn bản, quy định đào tạo) để cung cấp các câu trả lời chính xác và đáng tin cậy, phát triển Hệ Thống Đa Tác nhân Đánh giá Tài liệu có khả năng thực thi một quy trình đánh giá văn bản học thuật theo các bước và tiêu chí được định nghĩa trước, phát triển hệ thống Đa Tác Nhân Cải Tiến Chương Trình Đào Tạo cung cấp khả năng tìm kiếm thông tin mạnh mẽ và tạo thành các báo cáo chuyên nghiệp thuật hỗ trợ Giảng Viên trong việc phát triển hệ thông giáo dục.
- Kiểm thử và đánh giá: Xây dựng các kịch bản thực nghiệm để đo lường và đánh giá hiệu quả hoạt động của từng tác tử và toàn bộ hệ thống dựa trên các tiêu chí định lượng (ví dụ: độ chính xác, tốc độ phản hồi) và định tính (ví dụ: tính nhất quán, mức độ hữu ích của phản hồi).
Đối tượng nghiên cứu
Các đối tượng nghiên cứu được hướng tới trong khoá luận này:
- Các kiến trúc Trí tuệ Nhân tạo tạo sinh tiên tiến, bao gồm kỹ thuật RAG, kiến trúc Tác nhân AI, và phương pháp xây dựng hệ thống đa tác nhân bằng LangGraph.
- Kỹ thuật xử lý ngôn ngữ tự nhiên, các Mô hình Ngôn ngữ lớn, cơ sở dữ liệu vector,…
PHƯƠNG PHÁP THỰC HIỆN
Sơ đồ Kiến trúc Tổng thể
Dựa trên các phân tích yêu cầu, hệ thống được thiết kế theo mô hình kiến trúc microservice, lấy API Gateway làm trung tâm điều phối. Kiến trúc này giúp phân tách các mối quan tâm, tăng cường khả năng mở rộng và bảo trì.

Kiến trúc Triển khai Hệ thống
Để hiện thực hóa kiến trúc trên, hệ thống được triển khai trên một máy chủ duy nhất, sử dụng Docker và Docker Compose để quản lý các container dịch vụ, đảm bảo môi trường hoạt động nhất quán và dễ dàng quản lý

Sơ đồ này chi tiết hóa việc triển khai các thành phần kiến trúc. Toàn bộ các dịch vụ (Web, Application, Knowledge, Database, System) đều được đóng gói thành các Docker containers và được điều phối bởi Docker Compose.
- Web Services: Bao gồm Nginx làm reverse proxy và xử lý SSL, và API Gateway (FastAPI) tại cổng 8000.
- Application Services: Gồm 3 service chính là Hệ thống Đánh Giá Tài liệu (cổng 8001) và Hệ thống Cải Tiến Chương Trình Đào tào(cổng 8002).
- Knowledge Services: Gồm KNOWLEDGEBASE (tương ứng Hệ thống Truy vấn Tri thức, cổng 8003) và cơ sở dữ liệu vector ChromaDB (cổng 8004).
- Database Services: Gồm SQLite (lưu trên file system) và Redis (cổng 6379) cho caching và lưu session.
- System Services: Bao gồm hệ thống lưu trữ file và các công cụ giám sát (Monitoring).
Cách tiếp cận này giúp hệ thống dễ dàng được triển khai và quản lý, đồng thời đảm bảo các dịch vụ được cách ly và hoạt động ổn định
THỰC NGHIỆM, ĐÁNH GIÁ VÀ THẢO LUẬN



Kết luận
Sau quá trình nghiên cứu và triển khai đề tài “Hệ thống Trợ lý ảo Đa tác nhân Hỗ trợ Công tác Đào tạo”, dự án đã đạt được những kết quả quan trọng và có ý nghĩa trên cả phương diện kỹ thuật và ứng dụng thực tiễn.
1 Về mặt Kỹ thuật
Xây dựng thành công một hệ thống tích hợp ba module AI chuyên biệt: Đề tài đã hiện thực hóa thành công một hệ sinh thái phần mềm, bao gồm:
- Hệ thống Đánh giá Tài liệu: Một hệ thống đánh giá tự động, có khả năng phân tích và cho điểm các văn bản học thuật với độ tương đồng cao so với chuyên gia.
- Hệ thống Cải tiến Chương trình Đào tạo: Một hệ thống phân tích thông minh, áp dụng mô hình “CUNG – CẦU” để đối chiếu chương trình đào tạo với nhu cầu thị trường.
- Hệ thống Truy vấn Tri thức: Một framework RAG linh hoạt, hỗ trợ nhiều pipeline suy luận và được trang bị giao diện quản trị toàn diện.
- Áp dụng thành công kiến trúc Microservice hiện đại: Hệ thống được xây dựng trên nền tảng microservice với API Gateway tập trung, giúp tách biệt rõ ràng các chức năng, đảm bảo khả năng mở rộng độc lập và tăng cường độ bền bỉ cho toàn hệ thống.
- Làm chủ các kỹ thuật AI tạo sinh tiên tiến: Đề tài đã ứng dụng thành công các kỹ thuật phức tạp như Prompt Engineering có cấu trúc kết hợp Regex Parsing để đảm bảo tính định lượng và nhất quán của kết quả AI, cũng như kỹ thuật xử lý song song (Parallel Processing) trong LangGraph giúp tối ưu hóa đáng kể thời gian xử lý.
2 Về mặt Ứng dụng thực tế - Giải quyết các bài toán thực tiễn tại môi trường đại học: Hệ thống đã chứng tỏ tiềm năng ứng dụng cao khi trực tiếp giải quyết các vấn đề cốt lõi:
- Rút ngắn đáng kể thời gian đánh giá văn bản học thuật cho giảng viên, từ vài giờ xuống còn vài phút.
- Cung cấp các phản hồi đánh giá nhất quán, khách quan dựa trên các tiêu chí khoa học đã được định sẵn.
- Hỗ trợ ban lãnh đạo khoa trong việc ra quyết định cải tiến chương trình đào tạo dựa trên dữ liệu phân tích từ thị trường lao động.
- Tích hợp và khai thác dữ liệu thực tế: Hệ thống được thiết kế để làm việc với các nguồn dữ liệu đặc thù của nhà trường, bao gồm hơn 400 môn học và các chương trình đào tạo chi tiết, cho thấy khả năng tùy biến và ứng dụng trong bối cảnh cụ thể.
AI một cách có trách nhiệm, minh bạch và hiệu quả, tạo ra một hệ sinh thái giáo
dục thông minh phục vụ cho sự phát triển bền vững của xã hội.
Hạn chế
Bên cạnh những kết quả đạt được, trong quá trình thực hiện, đề tài không tránh khỏi những hạn chế nhất định về mặt dữ liệu, công nghệ và khả năng mở rộng.
1 Hạn chế về Dữ liệu
Thiếu dữ liệu lịch sử để tinh chỉnh mô hình: Hệ thống chưa có một tập dữ liệu lớn các khóa luận đã được chuyên gia đánh giá để thực hiện việc tinh chỉnh (fine-tuning) mô hình, do đó việc xác thực độ chính xác của agent đánh giá hiện tại chủ yếu vẫn dựa trên phương pháp thủ công.
Dữ liệu thị trường chưa đầy đủ: Việc thu thập dữ liệu từ các trang tuyển dụng có thể bị ảnh hưởng bởi các cơ chế chống bot. Đồng thời, hệ thống chưa có khả năng tiếp cận các nguồn dữ liệu quý giá như mức lương và lộ trình sự nghiệp của cựu sinh viên.
2 Hạn chế về Công nghệ
Sự phụ thuộc vào các API bên ngoài: Hoạt động của hệ thống phụ thuộc vào các dịch vụ LLM của bên thứ ba (ví dụ: Google Gemini). Điều này tiềm ẩn rủi ro về chi phí vận hành khi mở rộng quy mô và sự gián đoạn dịch vụ không mong muốn.
Chưa hỗ trợ đầy đủ đa phương thức (Multimodal): Hiện tại, hệ thống chủ yếu xử lý dữ liệu dạng văn bản và chưa có khả năng phân tích các thành phần quan trọng khác trong một khóa luận như hình ảnh, biểu đồ, hay các đoạn mã nguồn.
3 Hạn chế về Khả năng Mở rộng
Kiến trúc đơn người dùng (Single-tenant): Thiết kế hiện tại yêu cầu mỗi trường đại học phải triển khai một phiên bản hệ thống riêng biệt, làm tăng độ phức tạp trong việc quản lý và chưa cho phép chia sẻ tri thức giữa các đơn vị.
Hướng phát triển
Để khắc phục các hạn chế và phát huy tối đa tiềm năng của dự án, một lộ trình phát triển dài hạn đã được vạch ra, bao gồm các định hướng chính sau:
1 Nâng cấp Công nghệ (Lộ trình 3-6 tháng)
Tích hợp AI Đa phương thức: Nghiên cứu và tích hợp các mô hình như GPT-4 Vision để cho phép hệ thống có khả năng phân tích hình ảnh, biểu đồ, và các thành phần phi văn bản khác.
Xây dựng Năng lực Phân tích Mã nguồn: Tích hợp các công cụ phân tích mã nguồn tĩnh để tự động đánh giá chất lượng của các sản phẩm phần mềm đi kèm khóa luận.
Triển khai GraphRAG: Nâng cấp hệ thống truy vấn tri thức bằng cách xây dựng các đồ thị tri thức (knowledge graphs) từ chương trình đào tạo và các công trình nghiên cứu, cho phép các truy vấn phức tạp và có tính suy luận cao hơn.
2 Mở rộng Tính năng (Lộ trình 6-12 tháng)
Xây dựng Hệ thống Gợi ý Thông minh:
- Gợi ý Đề tài: Tự động đề xuất các đề tài khóa luận tiềm năng dựa trên xu hướng thị trưng và năng lực của sinh viên.
- Gợi ý Giảng viên Hướng dẫn: Tự động đề xuất giảng viên hướng dẫn phù hợp nhất cho sinh viên dựa trên sự tương đồng về chuyên môn.
Phát triển Năng lực Phân tích Nâng cao:
- Mô hình Dự báo: Xây dựng các mô hình dự đoán khả năng thành công của một khóa luận dựa trên các chỉ số ban đầu.
- Phân tích Xu hướng theo Thời gian: Theo dõi và phân tích sự thay đổi trong nhu cầu kỹ năng của thị trường qua từng năm.
3 Phát triển Nền tảng (Lộ trình 1-2 năm)
- Chuyển đổi sang Nền tảng SaaS Đa người dùng (Multi-tenant): Phát triển hệ thống thành một nền tảng dịch vụ (SaaS), cho phép nhiều trường đại học cùng sử dụng trên một hạ tầng chung, với cổng quản lý riêng cho từng đơn vị.
- Tích hợp Hệ sinh thái Giáo dục: Kết nối và tích hợp với các Hệ thống Quản lý Học tập (LMS) phổ biến như Moodle, Canvas, và các nền tảng tuyển dụng để tạo ra một dòng chảy dữ liệu liền mạch.
4 Nghiên cứu và Đổi mới (Lộ trình 2-3 năm)
- Nghiên cứu AI có tính Giải thích (Explainable AI – XAI): Phát triển các cơ chế cho phép hệ thống có thể giải thích lý do đằng sau mỗi quyết định và đánh giá của mình, tăng cường tính minh bạch và sự tin tưởng của người dùng.
- Ứng dụng Học Liên kết (Federated Learning): Nghiên cứu khả năng huấn luyện các mô hình AI trên dữ liệu phân tán từ nhiều trường đại học mà vẫn đảm bảo tuyệt đối quyền riêng tư về dữ liệu.
Tầm nhìn 5 năm: Hệ thống sẽ trở thành nền tảng chuẩn cho việc đánh giá và quản lý học thuật tại các trường đại học Việt Nam, đồng thời mở rộng ra khu vực Đông Nam Á với khả năng hỗ trợ đa ngôn ngữ và đa văn hóa giáo dục.
Mục tiêu cuối cùng: Góp phần nâng cao chất lượng giáo dục đại học thông qua việc ứng dụng


