Phát hiện xâm nhập sử dụng XGBoost để lựa chọn tính năng với Logarithmic Autoencoder và Bidirectional LSTM
Phát hiện xâm nhập sử dụng XGBoost để lựa chọn tính năng với Logarithmic Autoencoder và Bidirectional LSTM
CH1902033 - Nguyễn Trọng Minh Hồng Phước
Trong bối cảnh hiện nay, với sự bùng nổ của Công nghệ thông tin (CNTT) và các phụ trợ, cuộc sống của chúng ta đang diễn ra một giai đoạn biến đổi mạnh mẽ. Việc phát triển không ngừng này của các ngành trong CNTT này đã đặt ra một thách thức lớn, là làm thế nào để có thể duy trì sự cạnh tranh và thích ứng. Trong bối cảnh này, việc số hóa dữ liệu đang trở thành một vấn đề được đặt ưu tiên lên hàng đầu. Và đồng thời từ việc này cũng đang mở ra những cánh cửa lớn cho những kẻ tấn công tinh vi. Các kẻ tấn công và tên trộm thông tin ngày càng tinh nhuệ hơn, luôn tìm cách xâm nhập trái phép vào các hệ thống dùng để lưu trữ dữ liệu. Đáng nói là các kỹ thuật tấn công vào các hệ thống ngày ngày đang trở nên đa dạng và khó bị phát hiện. Những hệ thống nhận diện truyền thống dựa trên các quy tắc cố định đang dần trở nên yếu thế và thậm chí lạc hậu khi đối mặt với sự tinh vi của các loại tấn công hiện đại.
Với ý tưởng là sẽ kết hợp ưu điểm của hai nhóm phương pháp trong bài toán IDS: Nhóm phương pháp dựa trên máy học và Nhóm phương pháp dựa trên học sâu, đề tài chọn việc kết hợp chúng để tạo ra mẫu đặc trưng của dữ liệu hoạt động mạng có độ phân biệt cao như sau: Mẫu đặc trưng với độ phân biệt cao, được chọn lọc và đóng góp vào việc phân biệt các cuộc tấn công mạng và trạng thái bình thường, ít chịu ảnh hưởng của nhiễu. Học từ đặc trưng dựa vào các kỹ thuật DL cho phép học đặc trưng quan trọng từ dữ liệu mạng. Thực nghiệm được tôi thực hiện sử dụng CSDL của Đại học New Brunswick, Canada (NSL-KDD) cho thấy rằng phương pháp đề xuất vượt trội hơn các phương pháp hiện có đã được công bố.
Trân trọng.