您的位置: turnitin查重官网> 计算机 >> 计算机毕业题目 >阐述舆情基于语义统计网络舆情挖掘技术网

阐述舆情基于语义统计网络舆情挖掘技术网

收藏本文 2024-02-14 点赞:4955 浏览:12853 作者:网友投稿原创标记本站原创

摘要:随着互联网技术的进展和网络运用的普及,互联网成为民众获取信息的重要来源,同时也成为人们传播信息和表达观点的重要渠道。通过网络了解社情民意,关注舆情动向,对于推动社会和谐稳定、推动社会与法制建设具有重要的现实作用。网络信息浩如烟海,鱼龙混杂,人工识别和研判显得力不以心。如何利用计算机网络技术、人工智能技术和数据挖掘技术,对网络舆情信息有效地挖掘和浅析成为了一个新的探讨热点。如何识别民众所关注的热点话题并有效地分类,如何判断民众对社会事件的态度是正向的还是反向的,如何浅析和把握社会热点事件的波动性等,是网络舆情探讨中的亟需解决的重点不足,对认识和引导网络舆情具有重要的科学作用。本论文针对网络舆情信息的挖掘和浅析中有着的不足展开探讨,将基于Web的文本分类技术、机器学习算法探讨、波动性的统计浅析等技术运用到网络突发事件的分类、网络舆情信息的情感倾向性浅析、舆情演变的波动性浅析等探讨中。主要的探讨内容和革新点包括:1.本论文提出将Fisher判别准则运用到网络舆情文本的分类不足中,并实现对突发事件的分类。由突发事件引发的网络舆情信息,以内容形式来看主要为文本,由此舆情信息的分类本质上是文本分类的不足。Fisher判别准则是解决降维不足的有效策略之一,但在文本分类中探讨较少。本论文将Fisher判别准则作为分类的特点提取的策略运用于文本分类,并运用于网络突发事件新闻报道的分类。针对舆情的相关探讨,将突发事件按照公共安全的四类,即突发自然灾害、事故灾难、公共卫生事件和社会安全事件进行分类。实验证明,Fisher准则的策略略逊于信息增益,但比较其他特点选择策略都更好。2.本论文提出基于类别相关度的局部潜在语义浅析的算法LR-LSA,改善了局部潜在语义浅析算法进行文本分类。浅析介绍了潜在语义浅析的原理,包括奇异值分解和计算文档间相似联系的策略。通过浅析潜在语义浅析策略的局限性,提出算法LR-LSA,先利用SVM分类器给每篇文档一个类别相关度,然后根据相关度的大小选择生成局部区域的策略。在中文Web文本语料的两组分类实验中,验证了算法LR-LSA比LSA和LC-LSA更有效。3.针对机器学习策略在情感倾向性浅析中对情感语义信息考虑不足的不足,本论文提出了将情感方式和机器学习相结合的策略PMML,并运用于Web评论文本的情感倾向性分类。介绍了情感倾向性浅析的相关探讨,包括不同粒度级的基于情感词典浅析的分类策略,以及基于机器学习的情感倾向性分类策略。利用本论文提出的策略PMML对Web评论文本分类,在对原始语料文本进行基本的分词之后,先进行关键词提取,再进行方式匹配来提取情感评价短语,匹配成功后形成相应的情感特点序列,分别计算每个特点的情感倾向值,再通过机器学习的策略最终得到文本的情感倾向。实验验证了PMML策略较之机器学习的策略在分类效果上的有效性。4.本论文提出基于GARCH类模型的网络舆情信息演变的波动性探讨策略。在热点事件的传播历程中,波动性是其重要特点之一,强烈的波动往往意味着信息内容的不断传播和各种流言的不断蔓延,有着转变为突发事件的可能性。通过浅析网络舆情演变历程中的波动性的特点,如变化率序列呈现的异方差性、尖锋厚尾性等,比较金融领域的波动性,本论文提出基于GARCH类模型的波动性探讨策略。通过热点事件在主流搜索引擎中采集到的Web页面数,定量地浅析与这个事件相关的舆情演变走势。选择社会热点事件“温州动车事故”,通过收集数据,浅析变化率,分别建立了GARCH, EGARCH, TARCH模型。实证浅析了说明GARCH类模型对舆情演变的波动性浅析的可行性。关键词:网络舆情挖掘论文Fisher判别准则论文突发事件分类论文局部潜在语义浅析论文GARCH类模型论文

    中文摘要4-6

    Abstract6-11

    第1章 绪论11-21

    1.1 论文探讨背景11-13

    1.1.1 舆情和网络舆情11-12

    1.1.2 网络舆情挖掘的探讨作用12-13

    1.2 国内外网络舆情探讨近况13-17

    1.2.1 基于潜在语义浅析的文本分类13-15

    1.2.2 情感倾向性分类15-16

    1.2.3 网络舆情信息的演变浅析16-17

    1.3 本论文的主要探讨内容17-18

    1.4 本论文的章节结构18-21

    第2章 网络舆情信息挖掘和浅析策略概述21-34

    2.1 引言21

    2.2 网络舆情信息的采集21-25

    2.2.1 舆情信息采集的来源22-23

    2.2.2 网络舆情信息采集对策23-25

    2.3 基于WEB挖掘的网络舆情信息浅析25-31

    2.3.1 网络舆情话题检测与跟踪25-26

    2.3.2 基于Web的文本挖掘和分类26-27

    2.3.3 文本的情感倾向性浅析27-30

    2.3.4 舆情信息的演变和数据流挖掘30-31

    2.4 网络舆情挖掘和浅析的架构系统31-33

    2.5 本章小结33-34

    第3章 网络突发事件舆情信息的分类探讨34-53

    3.1 探讨背景34-35

    3.2 文本分类的相关策略介绍35-45

    3.2.1 文本表示模型35-37

    3.2.2 文本的特点选择策略37-40

    3.2.3 文本的分类策略40-43

    3.2.4 文本分类效果的评价指标43-45

    3.3 基于FISHER判别的特点提取策略45-48

    3.3.1 Fisher线性判别准则45-46

    3.3.2 Fisher线性判别用于文本特点提取46-47

    3.3.3 实验结果和浅析47-48

    3.4 突发事件舆情信息的分类探讨48-51

    3.4.1 网络舆情关键词的选择49-50

    3.4.2 突发事件分类语料的获取50

    3.4.3 分类性能的比较50-51

    3.5 本章小结51-53

    第4章 基于局部潜在语义浅析的舆情文本分类53-66

    4.1 探讨背景及相关探讨53-54

    4.2 潜在语义浅析54-58

    4.2.1 潜在语义浅析的原理54-55

    4.2.2 奇异值分解55-56

    4.2.3 利用奇异值分解计算各种相似联系56-58

    4.3 基于局部潜在语义浅析的WEB文本分类58-62

    4.3.1 特点词的局部特性58

    4.3.2 局部潜在语义浅析58-59

    4.3.3 局部区域的生成59-62

    4.4 实验及结果浅析62-65

    4.4.1 实验数据及预处理62

    4.4.2 实验结果及浅析62-65

    4.5 本章小结65-66

    第5章 网络舆情信息的情感倾向性浅析66-86

    5.1 引言66

    5.2 情感倾向性浅析的相关探讨66-73

    5.2.1 不同粒度的情感倾向性浅析探讨67-73

    5.2.2 中文情感浅析评测及语料库73

    5.3 基于机器学习的情感倾向性分类策略73-77

    5.4 方式匹配和机器学习相结合的情感倾向性分类77-82

    5.4.1 PMML策略结构流程78-79

    5.4.2 关键词的提取79

    5.4.3 方式的提取和匹配79-80

    5.4.4 文本的情感倾向性计算80-82

    5.5 实验结果及浅析82-85

    5.5.1 实验数据来源82-83

    5.5.2 数据的处理83

    5.5.3 实验设置和结果83-85

    5.6 本章小结85-86

    第6章 网络舆情信息演变的波动性浅析86-107

    6.1 背景介绍86-87

    6.2 网络舆情信息演化的统计计量探讨87-88

    6.3 网络舆情信息演化的波动性特点88-90

    6.4 GARCH类模型相关介绍90-95

    6.4.1 GARCH类模型概述90

    6.4.2 以ARCH到GARCH90-92

    6.4.3 GARCH模型的检验和参数估计92-93

    6.4.4 不对称的GARCH类模型93-95

    6.5 基于GARCH类模型的舆情信息波动性浅析95-105

    6.5.1 探讨对象95-96

    6.5.2 数据收集和处理96-100

    6.5.3 GARCH模型的建立100-102

    6.5.4 不对称性的模型的建立102-105

    6.6 本章小结105-107

    第7章 总结与展望107-110

    7.1 全文工作总结107-108

    7.2 进一步的展望108-110

copyright 2003-2024 Copyright©2020 Powered by 网络信息技术有限公司 备案号: 粤2017400971号