您的位置: turnitin查重官网> 计算机 >> 计算机毕业题目 >流管基于用户行为挖掘数据流管理技术

流管基于用户行为挖掘数据流管理技术

收藏本文 2024-02-13 点赞:9066 浏览:34145 作者:网友投稿原创标记本站原创

摘要:日益增加的网络安全威胁促使各种安全防御机制应运而生,这些安全机制大都需要浅析网络数据流,以发现违规行为和有害信息。当前的数据流安全管理主要基于关键字浅析,未全面考虑关键字所在的网络上下文环境信息,比如关键字所在网页的内容语义和浏览该页面的网络用户类别信息。为此,本论文以影响数据流安全管理的用户行为、内容浅析和管理调度三个方面开展探讨,主要贡献为:1.在用户维度,提出一种用户行为预测模型,该模型使得数据流安全管理系统可以针对用户类别实行差别化管理。具体来说,该模型通过收集网络用户的网页点击行为数据和搜索行为数据,构造一个关联用户行为和用户类别的预测模型。比较于以往的用户行为浅析策略,该模型有以下革新:(i)构建全而的行为类别系统和行为特点空间,借鉴概率潜在语义浅析思想,提出了一种用户潜在行为倾向发现策略来挖掘“用户-行为”共现中的倾向语义;(ii)该模型结合安全管理的运用背景,发现倾向的描述能力较弱,设计了一种“倾向-类别”映射联系学习算法,同时对该学习算法的信息转换等价性进行了论述浅析;(iii)针对预测结果,设计了相应的度量指标和评估办法,实验证明:在不对用户标注的情况下,该模型可准确预测用户的行为类别。2.在流内容维度,提出了多分类器快速内容判别模型。对每一个高速到来的元组,联合多个分类器对其进行综合判别。虽然该策略提升了判别的精度和稳定性,但是判别的速度会严重下降。为此,考虑利用多分类器之间的共享部分来提升判断的速度。具体来说,设计了两种集成模型索引结构(E-Tree和SVM-Index),论述上证明了这两种结构可以达到亚线性(O(logN)和O(1))判别速度。进一步地,在UCI公开数据集上的实验结果验证了预测开销平均可以降至原来的25%和3%左右。3.在整体调度上,提出利用数据挖掘和机器学习的策略来构建自适应的过滤器排序模型。一方面,针对较稳定的数据流环境,基于K-means思想,提出了一种层次化聚类排序模型KHO,来提升过滤器排序算法的鲁棒性;另一方面,针对非平稳数据流环境,基于指数平滑和层次决策的思想,提出了一种自适应的平滑排序模型AHES。以上策略解决了当前数据流过滤器排序算法无法随着数据流上下文环境自适应调节的不足。最后,大量实验结果证明:提出的模型能够体现出较好的性能和环境感知能力。4.基于上面陈述的关键技术的探讨探讨,设计并实现了一个用户行为数据安全管理引擎IceStream,并详细介绍了核心模块的主要功能和设计思路。关键词:流浅析论文流管理论文用户行为论文集成学习论文过滤器排序论文

    摘要4-6

    ABSTRACT6-12

    第一章 绪论12-24

    1.1 探讨背景12-17

    1.1.1 网络安全严峻形势12-14

    1.1.2 面对的挑战14-16

    1.1.3 本论文的探讨内容16-17

    1.2 本论文工作17-24

    1.2.1 本论文的探讨思路17-19

    1.2.2 本论文的工作成果19-21

    1.2.3 本论文的结构21-24

    第二章 基本概念和相关技术24-46

    2.1 数据流模型及其特点24-27

    2.1.1 数据流模型24-25

    2.1.2 数据流的特点25-27

    2.2 数据流管理技术探讨27-31

    2.2.1 数据流查询不足描述27-29

    2.2.2 数据流管理系统29-31

    2.3 数据流挖掘技术探讨31-44

    2.3.1 数据流分类综述31-43

    2.3.2 用户数据挖掘综述43-44

    2.4 探讨近况总结44-46

    第三章 用户维度的行为类别预测46-74

    3.1 引言46-49

    3.2 用户行为类别预测模型49-52

    3.2.1 不足描述49-50

    3.2.2 UCP模型概述50-52

    3.3 UCP模型的用户行为倾向挖掘策略52-60

    3.3.1 行为特点词典的构建53-54

    3.3.2 用户行为联系建模54-56

    3.3.3 用户行为倾向挖掘56-58

    3.3.4 不足求解58-60

    3.4 UCP模型中的映射联系学习算法60-62

    3.5 实验结果及浅析62-69

    3.5.1 实验配置62-63

    3.5.2 数据集63-64

    3.5.3 比较策略64-65

    3.5.4 评估指标65-66

    3.5.5 实验结果66-69

    3.6 相关工作69-71

    3.6.1 基于行为事件的实时预测69-71

    3.6.2 行为数据的用户分组71

    3.7 本章小结71-74

    第四章 内容维度上的语义过滤74-114

    4.1 引言74-80

    4.2 E-Tree索引结构及相关算法80-87

    4.2.1 不足描述80-81

    4.2.2 基本结构81-82

    4.2.3 预测算法82-84

    4.2.4 插入算法84-86

    4.2.5 删除算法86-87

    4.3 SVM-Index索引结构和相关算法87-97

    4.3.1 不足描述88-89

    4.3.2 基本结构89-92

    4.3.3 预测算法92-93

    4.3.4 插入算法93-95

    4.3.5 删除算法95-97

    4.4 论述浅析97-99

    4.5 实验结果及浅析99-107

    4.5.1 数据集100-101

    4.5.2 比较策略101

    4.5.3 度量指标101-102

    4.5.4 实验结果102-107

    4.6 相关工作107-111

    4.6.1 数据流分类107-109

    4.6.2 数据索引109-111

    4.7 本章小结111-114

    第五章 调度管理维度上的自适应排序114-138

    5.1 引言114-117

    5.2 不足描述117-120

    5.2.1 剩余图118-120

    5.3 基于K-means的层次聚类排序模型120-124

    5.3.1 基本思路和自定义操作120-123

    5.3.2 层次聚类排序模型中的排序算法细节123-124

    5.4 基于指数平滑的层次排序模型124-129

    5.4.1 层次决策建模126-128

    5.4.2 指数平滑预测128-129

    5.5 实验结果及浅析129-135

    5.5.1 实验配置和数据集129-131

    5.5.2 比较策略131-132

    5.5.3 实验结果132-135

    5.6 相关工作135-137

    5.7 本章小结137-138

    第六章 系统设计及其实现138-146

    6.1 系统概述138-140

    6.1.1 引擎工作流程138

    6.1.2 引擎与三个探讨点的联系138-140

    6.2 系统设计与实现140-144

    6.2.1 总体结构140-141

    6.2.2 系统设计141-144

    6.3 本章小结144-146

    第七章 工作总结和展望146-152

    7.1 本论文探讨工作总结146-147

    7.2 探讨工作展望147-152

copyright 2003-2024 Copyright©2020 Powered by 网络信息技术有限公司 备案号: 粤2017400971号