您的位置: turnitin查重官网> 工程 >> 电气工程 >> 铁路电气化安全 >试议可视化链接结构和信息可视化和运用

试议可视化链接结构和信息可视化和运用

收藏本文 2024-03-16 点赞:4758 浏览:12460 作者:网友投稿原创标记本站原创

摘要:信息时代的到来,网站信息量呈现出的爆炸式发展导致用户无法定位其中信息,使用网站信息可视化辅助用户导航网站是解决上述问题的主要方法。由于网站中信息复杂多变,如何融合展现网站中的各类信息是目前的难点问题。在此使用RadialView树型布局算法绘制由超链接信息组成的网站拓扑结构。提出一种可视化规则在网站结构图的基础上添加对网页关联、热度等使用信息的可视化;以聚变数据库网站为实际应用案例,分析了该文关于网站信息可视化方面的工作在辅助用户导航网站方面的效果。
关键词:网站信息可视化;结构信息;网站使用信息;聚变数据库
1004373X(2012)18006704
引言
随着网站信息量的扩展,网站结构愈加复杂,如何迅速在网站中寻找信息越来越困难。使用网站信息可视化方法对网站进行导航是解决上述问题的主要途径,因此网站的信息可视化逐渐成为一个热点研究领域。早期使用可视化技术主要关注网站的结构信息,如E.H.Chi在文献中使用conetree的可视化技术展现WebSpace结构,文献[3]使用图布局技术可视化网站等。但是上述研究无一例外地忽视了网站的一个重要组成因素:网站用户。随着网站用户的增多以及网站使用信息量的扩充,分析并可视化网站使用信息逐渐被提及和关注,如文献[45]中可视化了诸如用户的访问模式、网页的访问频率等网站使用信息。其中如何将网站的结构信息与日志文件中所包含的使用信息相融合,并以容易理解的方式可视化出来是一个难点问题。鉴于此,JiyangChen在文献[6]中提出了一种新的多边形可视化技术,可以在保持网站原有链接结构的基础上,展示一种及多种网站使用信息;Makiko在文献[7]中融合展现了网站链接结构信息和访问模式信息。
基于上述已有的一些网站信息可视化工作,本文提出使用RadialView[8]树型布局算法对网站的结构信息进行了可视化;并在网站结构信息可视化结果的基础上添加网站使用信息的可视化效果。在此认为,对网站的此类信息进行可视化能够辅助用户在网站中寻找信息,有利于重构网站即对网站内容重新布局。
1方法概述
有很多利用信息可视化方法辅助导航网站用户的案例,其可视化信息内容的主要关注点有:一个是关注网站本身的信息结构,因为一个清晰的信息空间结构和网页结构有利于简化迷失方向的问题;另一个是可视化网站的使用信息。总之使用网站信息可视化结果对辅助用户导航网站效

源于:毕业设计论文网www.udooo.com

果较为显著。
所以本文提出并实现了一种可视化网站的结构信息和使用信息的方法,具体过程见图1所示。主要包括以下几个步骤:
(1)为了让用户可以从总体上把握整个网站的内容分布,对网站结构一目了然,本文使用网络爬虫工具抓取网站的超链接结构信息,使用点线的布局算法,即节点代表网页,线代表网页间的超链接关系,绘制网站的结构图形,生成网站地图。
(2)本文还从网站的怎么写作器日志中提取网页的热度信息和关联信息,目的让用户可以选择对热度值较高的网页进行访问,同时在选择某个网页时,与该网页相关的一系列网页呈现给用户,从而减少用户导航网站时间,提高信息命中率。
(3)为了在一个可视化空间内有效展现网站中各类信息,本文定义一套可视化策略,用以融合显示网站背后隐藏的使用信息和网站结构信息。
由图1可知,本文关于网站信息可视化的工作主要分为两部分,即网站信息的提取和具体信息的可视化。
2网站信息的提取
网站信息可视化的前提是要获取网站中的各类信息,本文实现网站信息可视化的数据主要来源于:
(1)通过网络爬虫工作构建的网站拓扑结构信息。
(2)通过网站怎么写作器日志获取的网页关联和热度信息。
本文使用的怎么写作器日志数据默认是标准的格式,即收录了网站用户的IP、访问的网页URL和时间等信息。

2.1结构信息的提取

网站中负责页面间跳转的是网页中的超链接信息,可以将超链接视为线,网页视为结点,这样就组成了一个图的结构,被称之为网站的拓扑结构。本文使用基于htmlparser[9]的网络爬虫工具提取网页中的超链接信息,同时剔除了网页中夹杂的无效链接、多媒体链接和站外链接。由于网站拓扑结构呈现出来是图结构,不利于用户的理解和导航,本文拟将其组织成层次性结构,所以本文特别设计了图的广度遍历算法将网站的拓扑结构转换成树型结构,以便用户认知和使用。

2.2使用信息的提取

(1)网页间关联信息的提取
网页关联关系的提取过程如图2所示,首先对网站怎么写作器日志进行预处理,识别出其中的会话,如图2(a)中对会话期间访问的网页进行标识;接着使用关联规则算法分析会话期间访问的网页集合,如图2(b)所示,得到最终的最大频繁项集,可以认为该项集中的网页具有一定潜在的关联关系。
(2)网页热度信息的提取
使用一般的统计方法抽取网页的热度信息,以标识a的网页为例,从处理过后的日志数据中可以得到所有网页出现的次数:maxValue,网页a出现的次数为a.num,那么可以认为网页a的热度信息值:a.hot=f(a.num/maxValue)3网站信息的可视化
本文的基础工作是对网站结构信息的可视化。由于网站结构复杂,不利于用户理解和认知,所以本文在对网站结构进行可视化的同时,提出一种可视化策略,用以融合网页的热度信息和关联信息。其中热度信息用于简化网站的拓扑结构,关联信息用于增强网站信息可视化的使用效果。

3.1结构信息的可视化

在网站的信息可视化中,所使用的信息可视化技术不仅要增强单个页面的可理解性,还要揭示整个网站的结构。本文采用点线的方式绘制网站结构,结点代表网页,线代表网页间的超链接关系,当视某个网页为根节点时,该网页中超链接所指向的网页作为其子节点,这种链接关系被描述成图3所示的父亲孩子结构。
鉴于网站内容组织结构具有层次性的特点,在此采用树型结构来展现网站。此外网站信息结构的还具有如下特点:
(1)网站链接结构具有层次性,网页结点繁多,可视化树的叶子结点数量庞大。
(2)网站中有效数据大都分布在树型结构中叶子结点页面。

copyright 2003-2024 Copyright©2020 Powered by 网络信息技术有限公司 备案号: 粤2017400971号