Professional Documents
Culture Documents
基于有督导机器学习的网络流量识别系统
基于有督导机器学习的网络流量识别系统
2015
第 38 卷第 21 期 Modern Electronics Technique Vol. 38 No. 21
109
doi:10.16652/j.issn.1004⁃373x.2015.21.029
基于有督导机器学习的网络流量识别系统
邢玉凤,毛艳琼
(云南经济管理学院 人文艺术学院,云南 昆明 650106)
摘 要:针对真实网络环境中存在大量干扰噪声和野值样本等严重影响最小二乘支持向量机算法的性能等问题,提出
一种结合协同量子粒子群优化算法和最小二乘支持向量机的网络流量识别系统。将网络流量分为 12 个类型,并进行数据
采集。使用采集的数据对网络流量识别系统进行训练和性能测试。为研究提出的基于 CQPSO⁃LSSVM 算法的性能,将其与
基于 CQPSO⁃LSSVM 算法和基于 PSO⁃LSSVM 算法进行对比,结果表明基于 CQPSO⁃LSSVM 算法具有更快的识别速度以及更
好的识别准确率,避免了出现陷入局部最优解的情况发生。
关键词:有督导机器学习;网络流量识别;LSSVM;协同量子粒子群优化算法
中图分类号:TN711⁃34;TP393 文献标识码:A 文章编号:1004⁃373X(2015)21⁃0109⁃04
Abstract:In the real network environment,a large number of interference noise and outlier samples are existed,which se⁃
riously affect on the performance of the least square support vector machine(LSSVM)algorithm. A network traffic identification
system combining cooperative quantum particle swarm optimization (CQPSO) algorithm with LSSVM is proposed. The network
traffic is divided into 12 types,in which the data of network traffic are collected. The network traffic identification system is con⁃
ducted with training and performance test by the collected data. To study the performance of the CQPSO ⁃ LSSVM based algo⁃
rithm,the CQPSO⁃LSSVM based algorithm is compared with the PSO⁃LSSVM based algorithm. The comparison results show that
the CQPSO⁃LSSVM based algorithm has faster identification speed and better identification accuracy,which can avoid the occur⁃
rence that the system is caught in local optimal solution.
Keywords:supervised machine learning;network traffic identification;LSSVM;CQPSO algorithm
导机器学习的网络流量分类识别方法;基于无督导机器
0 引 言
学习的网络流量分类识别方法。有督导机器学习算法
随着随着互联网技术的不断发展壮大,不断涌现出 又分为基于贝叶斯算法、基于决策树算法和基于支持向
各种各样的网络服务和应用类型,这对互联网管理提出 量机算法以及基于神经网络算法等;无督导机器学习算
了更高的要求,同时网络安全问题日益严重,对网络流 法又分为基于模型方法、基于密度方法以及基于划分方
量进行实时有效的检测,具有非常重要的意义 [1⁃2]
。 法等 [3⁃6]。
传统对网络流量进行分类识别的方式手段主要有:
1 网络流量识别系统
基于端口识别技术的网络流量分类识别方法;基于数据
包载荷内容的网络流量分类识别方法。传统网络流量 1.1 网络流量分类
分类识别方法虽然具有算法简单、效率高等优点,但是 近年来,P2P 技术已经得到了非常广泛的应用,P2P
由于其自身局限性已经不再适用于当今复杂多样互联 应用类型也随着其服务类型的增长而增长,因此,过去
网服务类型和应用。 文献在对网络流量识别进行研究时,通常将网络流量类
现在应用比较广泛的网络流量分类识别方法主要 型分为 10 个类型。本文根据 P2P 服务类型将三种常用
有:基于统计特征的网络流量分类识别方法;基于有督 应用类型分别考虑,即分为 P2P 文件共享、音视频以及
即时通信应用服务。因此,本文对网络流量类型划分为
收稿日期:2015⁃04⁃28 12 个类型,如表 1 所示 [7]。
110 现代电子技术 2015 年第 38 卷
表1 网络流量分类表 但是由于真实网络环境中,存在大量干扰噪声和野
类别 应用名称
值 样 本 等 ,严 重 影 响 了 最 小 二 乘 支 持 向 量 机 算 法 的 性
能;因此本文提出一种结合协同量子粒子群优化算法和
WWW HTTP,HTTPS
最小二乘支持向量机的网络流量识别系统。
P2P 文件共享 eMule,BitTorrent
参 考 文 献
[1] 王涛,余顺争.基于机器学习的网络流量分类研究进展[J].小型
微型计算机系统,2012(5):1034⁃1040.
[2] 邓河.基于机器学习方法的网络流量分类研究[D].株洲:湖南
工业大学,2009.
[3] 杨飞虎.特征选择算法及其在网络流量识别中的应用研究[D].
南京:南京邮电大学,2012.
[4] 杨宜辰.基于机器学习的网络流量分类技术研究与应用[D].淮
南:安徽理工大学,2014.
[5] 储慧琳,张兴明.一种组合式特征选择算法及其在网络流量识
别中的应用[J].小型微型计算机系统,2012(2):325⁃329.
[6] 陶 维 天.基 于 校 园 网 的 网 络 流 量 监 控 技 术 研 究 与 应 用 [D].兰
州:兰州大学,2010.
[7] 王程.网络流量识别分析系统的设计与实现[D].长春:吉林大
学,2014.
图3 CPSO 与 CQPSO 算法性能对比 [8] 许孟晋.基于机器学习的网络流量分类系统研究与实现[D].长
沙:国防科学技术大学,2010.
CQPSO⁃LSSVM 识别算法的平均识别准确率达到了
[9] 顾成杰,张顺颐.基于改进 SVM 的网络流量分类方法研究[J].
93.36% ,比 QPSO⁃LSSVM 算 法 的 平 均 识 别 准 确 率 高 出 仪器仪表学报,2011(7):1507⁃1513.
5.28% ,比 PSO ⁃ LSSVM 算 法 的 平 均 识 别 准 确 率 高 出 [10] 杨子江.基于混沌量子粒子群算法的流水线调度[D].上海:华
10.3%,CQPSO⁃LSSVM 识别算法的平均识别反馈率达到 东理工大学,2013.
作者简介:魏全增(1990—),男,山东聊城人,硕士。主要研究方向为智能检测与控制。
陈机林(1965—),男,江苏扬中人,副教授。主要研究方向为武器系统智能控制与检测技术。
高 强(1979—),男,陕西汉中人,副教授。主要研究方向为武器系统智能控制与检测技术。
(上接第 112 页)
作者简介:邢玉凤(1983—),女,云南曲靖人,硕士,讲师。主要从事计算机应用、数据加密及算法研究。
毛艳琼(1984—),女,云南昆明人,硕士,讲师。研究方向为电子商务、软件开发。