Nam Thang Hoang, Nguyễn Trần Lê Tuấn, Dương Công Sơn, Tống Văn Vạn, Trân Hải Anh
{"title":"Phân loại luồng dữ liệu dựa trên học chuyển giao đa nguồn trong hệ thống mạng SDN phân tán","authors":"Nam Thang Hoang, Nguyễn Trần Lê Tuấn, Dương Công Sơn, Tống Văn Vạn, Trân Hải Anh","doi":"10.54654/isj.v2i19.990","DOIUrl":null,"url":null,"abstract":"Tóm tắt— Ngày nay, phân loại luồng dữ liệu mạng đóng một vai trò quan trọng trong nhiều lĩnh vực như quản trị mạng, bảo mật, an toàn thông tin. Dữ liệu mạng mã hoá đang dần phổ biến, đơn cử như các dữ liệu của các nhà cung cấp dịch vụ lớn như Google, Facebook. Với các dữ liệu mạng bị mã hoá thì các phương pháp truyền thống như phân loại theo cổng (Port), theo kiểm tra gói sâu (DPI – Deep Packet Inspection) đã không còn hiệu quả, thay vào đó các phương pháp dựa vào học máy sẽ hiệu quả hơn. Gần đây các nghiên cứu về mạng định nghĩa bằng phần mềm SDN (Software Defined Networking) phân tán đã giúp giải quyết vấn đề nhất quán dữ liệu giữa các miền SDN. Từ đó vấn đề phân loại luồng dữ liệu trong mạng SDN phân tán có thể quy về việc phân loại như trên một miền, tuy nhiên trong trường hợp có một miền mạng SDN mới kết nối vào mạng SDN phân tán với số lượng ít các dữ liệu có thể dẫn tới kết quả phân loại không được tốt. Với lý do đó nhóm tác giả đã đề xuất giải thuật MMSTrAda, một giải thuật chuyển giao tri thức từ các miền mạng đã có nhiều dữ liệu sang miền mạng mới thành lập dựa trên giải thuật MSTradaBoost (TrAdaBoost đa nguồn). Kết quả phân loại dữ liệu mã hóa khi sử dụng giải pháp đề xuất để phân loại 3 loại dịch vụ E-commerce, Interactive data, Video on-demand trên miền mạng mới xuất hiện với chỉ số macro-F1 đều đạt trên 88%.","PeriodicalId":471638,"journal":{"name":"Nghiên cứu khoa học và công nghệ trong lĩnh vực an toàn thông tin","volume":"5 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-10-11","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Nghiên cứu khoa học và công nghệ trong lĩnh vực an toàn thông tin","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.54654/isj.v2i19.990","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
Abstract
Tóm tắt— Ngày nay, phân loại luồng dữ liệu mạng đóng một vai trò quan trọng trong nhiều lĩnh vực như quản trị mạng, bảo mật, an toàn thông tin. Dữ liệu mạng mã hoá đang dần phổ biến, đơn cử như các dữ liệu của các nhà cung cấp dịch vụ lớn như Google, Facebook. Với các dữ liệu mạng bị mã hoá thì các phương pháp truyền thống như phân loại theo cổng (Port), theo kiểm tra gói sâu (DPI – Deep Packet Inspection) đã không còn hiệu quả, thay vào đó các phương pháp dựa vào học máy sẽ hiệu quả hơn. Gần đây các nghiên cứu về mạng định nghĩa bằng phần mềm SDN (Software Defined Networking) phân tán đã giúp giải quyết vấn đề nhất quán dữ liệu giữa các miền SDN. Từ đó vấn đề phân loại luồng dữ liệu trong mạng SDN phân tán có thể quy về việc phân loại như trên một miền, tuy nhiên trong trường hợp có một miền mạng SDN mới kết nối vào mạng SDN phân tán với số lượng ít các dữ liệu có thể dẫn tới kết quả phân loại không được tốt. Với lý do đó nhóm tác giả đã đề xuất giải thuật MMSTrAda, một giải thuật chuyển giao tri thức từ các miền mạng đã có nhiều dữ liệu sang miền mạng mới thành lập dựa trên giải thuật MSTradaBoost (TrAdaBoost đa nguồn). Kết quả phân loại dữ liệu mã hóa khi sử dụng giải pháp đề xuất để phân loại 3 loại dịch vụ E-commerce, Interactive data, Video on-demand trên miền mạng mới xuất hiện với chỉ số macro-F1 đều đạt trên 88%.