Red-MIRROR là hệ thống kiểm thử xâm nhập (penetration testing) tự chủ dựa trên multi-agent LLM được nghiên cứu và phát triển tại InSecLab.

Hệ thống Red-MIRROR là bộ khung kiểm thử xâm nhập tự chủ dựa trên kiến trúc bộ nhớ–phản tư chặt chẽ (Shared Recurrent Memory Transformer kết hợp Dual-Phase Reflection), giúp khắc phục các hạn chế lớn của các framework hiện nay: quản lý bộ nhớ phiên làm việc kém, thiếu cơ chế xác thực và tinh chỉnh payload, cũng như phụ thuộc quá mức vào kiến thức nội tại của mô hình. Red-MIRROR tích hợp RAG để bổ sung kiến thức bên ngoài cùng bộ công cụ chuyên biệt cho reconnaissance và exploitation.

Kết quả thực nghiệm trên benchmark XBOW cho thấy Red-MIRROR đạt tỷ lệ giải quyết thành công 86% và tỷ lệ hoàn thành subtask trung bình 93.31%, vượt trội hơn so với các hệ thống SOTA cùng sử dụng mô hình nền tảng: VulnBot (6%), PentestAgent (50%), AutoPT (46%).

Nghiên cứu do nhóm sinh viên Trần Vỹ Khang và Nguyễn Đặng Nguyên Khang (Lớp An ninh tài năng 2022 – Khoa Mạng máy tính và truyền thông) thực hiện dưới sự hướng dẫn của TS. Phan Thế Duy, PGS. TS. Phạm Văn Hậu thuộc khuôn khổ hoạt động nghiên cứu khoa học thường xuyên của Phòng thí nghiệm An toàn Thông tin.

image 60

Chi tiết nghiên cứu có thể tham khảo tại preprint: https://arxiv.org/pdf/2603.27127

InSecLab tiếp tục hướng đến các nghiên cứu kết hợp AI và an ninh mạng thực tiễn, trong bối cảnh nhu cầu tự động hoá ngày càng cao với sự xuất hiện của các công cụ trí tuệ nhân tạo.