您的位置: turnitin查重官网> 计算机 >> 计算机仿真 >探究模型微博污染检测模型

探究模型微博污染检测模型

收藏本文 2024-03-28 点赞:5277 浏览:18387 作者:网友投稿原创标记本站原创

摘要:信息传播的高速性加剧了谣言等网络污染在微博网络中的扩散。微博网络的用户量和信息量极为庞大。因此,对微博污染传播机制和污染检测手段的研究显得尤为重要。根据基于用户影响力建立的微博谣言传播模型,利用蚁群算法逆推污染传播路径,搜索受染用户,并分别以Twitter和新浪微博为实验平台,通过对比分析验证了模型的可行性。实验结果表明:模型通过对受染个体的搜索,缩小了污染的检测范围,提高了微博污染的治理效率和准确性。
关键词:微博;谣言传播;社交网络;检测
0引言
Web2.0将网络信息交流渠道由单向获取向互动转变,用户接入方式的多样化和各种移动终端设备的支持提高了微博的应用强度。微博网络中的节点联系紧密,尤其利于信息的传播。同时,微博所具有的小世界特性也会加速网络中的谣言等污染的传播[3],严重阻碍社交网络的使用和推广。如何有效地检测社交网络中的污染情况日益重要。
文献[4]针对社交网络中的突发事件进行了传播特性分析;文献[5]利用ROST软件研究了微博中垃圾信息的扩散模式,但上述两篇文献并未涉及模型的具体应用;文献[6-7]根据SIS(Susceptible Infected Susceptible)和SIR(Susceptible Infected Removed)两种不同的传染病原理,构建了博客中的信息传播模型,并对污染情况进行预测,但该应用是针对未来时态的预测,没有逆向分析既定的污染事实。
微博中一旦出现污染传播,应及时掌控污染的扩散情况,高效、准确处理疫情,避免对社交网络造成更大的威胁。本文建立了一种以活跃度、传播力、覆盖度共同影响节点的影响力乃至信息走向的微博信息传播模型,通过获取Twitter和新浪的数据,选取谣言一类借助于社交网络人际关系进行传播的污染物,分析其在两种社交网络上的扩散过程,检测受染用户,验证其对提高微博环境的净化效率和准确性的功效。
1相关工作

2.2指标选取

信息到达节点之后的走向取决于该节点的影响力[4]。不同的影响力计算方式对应多种的传播模型,文献[4]中提出:节点影响力受内场强和外场强两方面因素的影响,本文将概念指标

摘自:学术论文网www.udooo.com

化,分别对应活跃度、传播力和覆盖度。
节点的活跃度和传播力分别表示节点参与讨论的可能性和在话题传播中所起的作用,覆盖度反映了节点一旦传播可能造成的威胁程度。在微博网络中,这三个因子存在内部关联。在话题传播过程中,影响力大的节点往往热衷于新鲜话题,常在话题出现初期就在个人微博中发布了相关信息[9]。在相同条件下,活跃度高的节点得知话题信息并参与讨论的概率也高,经过时间累积,其好友覆盖度也会增大。本文检测设用户的影响力B(i)由活跃度、传播力和覆盖度三个因子共同决定,相关定义如下:
3污染源分析
在根据所掌握的污染个体进行传播检测的过程中,分析所面临的好友数量很庞大,造成检测定位工作的效率低下,并且检测具有随机性,准确性也不高。检测工作需有一定的路径选择依据,而可用于路径选择的算法很多,如遗传算法和Floyd算法等。其中,隶属于遗传算法的蚁群算法具有参数设置简单和全局极小搜索能力强等特点[11],本文就此选取蚁群算法对谣言扩散的历史进行逆推,实现对其余“隐身”I态用户的搜索。
蚁群算法(AntColonyOptimization,ACO)是MarcoDorigo于1992年提出的一种仿生类非线性优化算法,该算法常用于解决旅行商问题(TrelingSaleanProblem,TSP)和分类问题。蚂蚁在蚁群中间会通过信息素传递信息,其他蚂蚁通过感知该信息来指导自己的行径方向,通过不断的正反馈,整个蚁群的集中趋势加强。
在实际的觅食过程中,信息素会随着时间的流逝而挥发,因此蚁群算法中的信息素需持续更新。据信息素更新策略的不同,蚁群算法可划分为Ant Cycle(蚁周)、Ant Quantity(蚁量)和Ant Density(蚁密)三种模型[11]。蚁周模型采用全局更新策略,运算量过大,其他两者均为局部更新,其中蚁密模型的更新策略恒为常数,与研究课题相关性较弱,综合上述分析,本文选取蚁量模型。

    copyright 2003-2024 Copyright©2020 Powered by 网络信息技术有限公司 备案号: 粤2017400971号