基于径向布局的多维层次可视化方法
【技术领域】
[0001] 本发明涉及多维和层次可视化技术领域,特别涉及一种基于径向布局的多维层次 可视化方法。
【背景技术】
[0002] 多维层次数据是同时具有多维特性和层次特性的一类数据。多维性是指每个数据 对象具有两个或两个以上独立或者相关属性,如电脑的配置信息,CPU、内存、硬盘等参数, 每个参数描述电脑的一个属性。层次性表现为两类,包含和从属,如地理位置分布和社会组 织架构。此类数据广泛存在于人们的日常社会生产中,如购物网站中的商品分类、国家统计 局发布的全国各省市统计年鉴、包含地理信息的气象数据、社交网络数据等,且该数据中蕴 含了丰富的信息。随着移动互联网时代的到来,真实世界与虚拟世界已经变得密不可分,信 息的产生和流动瞬息万变,呈现、理解和应用此类新型的海量复杂数据已然成为数据可视 化与分析面临的新挑战。
[0003] 可视化技术是一种利用人眼感知能力对数据进行交互的可视表达以增强认知的 技术。它将数据转化为可感知的图形、符号、颜色、纹理等,来增强数据识别效率,传递有效 信息。由于可视化技术的直观与高效,越来越广泛地被应用到科学研宄与实际应用中。目 前的探索和分析方法主要针对该类数据的单个特性,即高维可视化和层次可视化。而同时 兼顾多维和层次特性的可视化方法较少,且在展示粒度上存在局限性。
[0004] 多维可视化作为可视化领域的一个重要分支,通过数据处理,如特征提取和降维, 及图形映射,反映多维信息及其各属性之间的关系,实现在低维可视空间中展示多维抽象 信息的多属性数据特征。目前多维可视化的研宄较为成熟,针对高维数据的可视化方法较 多,如平行坐标、散点图矩阵、VHDR等,这些方法主要是对数据的多维特性进行分析,对同时 具有层次特性的数据而言,会丢失其层次结构。此外,由于这些方法本身的特点,使得其对 布局空间较敏感且可伸缩性较低。
[0005] 层次可视化作为信息可视化的另一个重要分支,其主要目标是对数据中的层次关 系进行有效刻画。可视化中,采用不同的视觉符号表示不同类型关系决定了层次可视化的 两种主要类别:节点-链接和空间填充。在表达数据层次信息时,前者的缺点在于随着层次 和节点数的增加会引起广度和深度的过度扩展,导致可读性较差,且大量数据点聚集在屏 幕局部范围,难以高效利用有限的屏幕空间;后者具有高效的空间利用率,但在表达层次信 息上没有前者清晰。
[0006] 已有的多维层次可视化方法,如Treemap在展示层次信息的同时使用视网膜变量 (如颜色,形状,大小,标签等)来表示维度信息,然而该方法存在维度可扩展性弱的缺点; 融合多维和层次视图的复合可视化方法分别使用层次视图和多维视图来展示数据的层次 结构和多维信息,其缺点是需要用户在多个视图和全局视图间维持视觉平衡,且多个视图 间的切换可能导致用户丢失全局上下文信息。
[0007] 以上提到的可视化技术在对多维层次数据进行展现时主要存在问题有:1)仅仅 针对原始数据的单个特征层面进行分析和探索;2)对维度增长敏感,较低的可伸缩性,且 容易造成用户丢失全局上下文信息。
【发明内容】
[0008] 本发明所要解决的技术问题是提供一种基于径向布局的多维层次可视化方法,设 计多维层次视图对数据进行展示。
[0009] 为解决上述技术问题,本发明采用的技术方案如下:
[0010] 一种基于径向布局的多维层次可视化方法,包括径向层次视图的绘制算法、圆形 平行坐标绘制算法、视图融合三个部分;
[0011] 径向层次视图的绘制算法:给定父节点pNode的第i+1个孩子节点childi+1GTm, ^为树结构,下标m表示节点数,该节点在视图中的绘制为:
孩子节点childi+1对应视图中的扇形块Widget,每个扇形块由〈innerRadius,outerRadi us,startAngle,endAngle〉四元组唯一确定;rStep表示每个节点对应的扇形块的径向宽 度,由该节点的内半径innerRadius和外半径outerRadius决定,节点childi+1的起始角 度startAngle等于父节点pNode起始角度加上节点q的结束角度endAngle;节点跨度 arcWidth由以该节点为根节点的子树的叶子节点数占原始树的总的叶子节点数的比例;
[0013]圆形平行坐标绘制算法:对于给定数据集UmXn,其中的n维数据点映射为二维空间 上的一条圆形折线段,其映射函数定义为:
[0014]
其中Vij(x,y)表示 轴&第1条折线段与轴的交点,其坐标由
进 行计算,uMaXj,uMirij表示第j个维度上的最大值和最小值,(X,y)为节点vu (X,y)在圆形 平行坐标中相应轴上的坐标值,9由
计算获得;
[0015] 视图融合:借助镂空设计策略HolowSpiralModel实现多维层次视图的无缝融 合,DetailOutside交互设计实现对视图的联动分析。
[0016] 根据上述方法,还包括定义多维层次数据的数据结构和对原始数据进行抽取、预 处理生成预定义数据结构的数据两个步骤;
[0017] 定义多维层次数据的数据结构:设共包含m条数据记录且具有n个数据维度的原 始数据集表示为矩阵UmXn,定义为
其中
:表示第i条数据记录,Uij表示第i条数据记录的第j个 属性值,相应的潜在层次结构表示为Tm=〈V,E>,定义为
^是连通图,树中的每个节点node定义为:
={vdv2,…,v|v|}表示节点集,对应原始数据集的条目,E={epe2,…,e|E|}表示 数据中隐含的包含或从属关系,attrs为节点属性集,children表示子节点集,三元 组表示一个节点或一条折线段,即多维层次数据结构定义为D= {<U,t>|uGUmXn,tGTj;
[0019] 对原始数据进行抽取、预处理生成预定义数据结构的数据:首先对原始数据集进 行异常值处理,异常值包括空条目、数据类型错误,具体为,遍历每条记录,对其中存在的异 常属性值按照不同的异常情况进行不同的处理,数值空条目进行零值填充,数据类型错误 进行类型转换,根据该条目数据取平均或最值处理;再对预处理后的数据进行数据抽取,具 体为,遍历数据集中的每条记录,记录由基本属性字段和特征字段组成,对于该记录生成与 之对应的节点node,基本属性字段对应节点node中的atts属性集,而特征字段生成为:
[0020]
每个\对应该特征维度上的取值,同时根据数 据中的组织结构或地理信息获取节点间的从属关系,得到由节点n〇de=<atts,ICcMWreny组成的节点集,即为隐藏的生成树模型,根节点即为无父节点的节点,表示为:
获得可绘制的单个数据元素Visualltem;最后递归地对 VisualItem进行绘制。
[0021] 根据上述方法,还包括借助Colorbrewer使用颜色放射渐变的方法,同时修改色 调和透明度对每层节点进行着色,通过透明度加添加剂的设计方法使得满足筛选条件的节 点或折线簇的辨识度提高。
[0022] 根据上述方法,还包括提供用户交互的接口,允许用户定制筛选规则,辅助用户从 多角度多层次地探索和分析数据以发现潜在的知识和模式。
[00
23] 与现有技术相比,本发明的有益效果是通过对原始数据中存在的多维信息和层次 结构进行抽取和预处理生成多维层次数据结构,并设计多维层次视图对数据进行展示,该 可视化方法保持了较高空间利用率和较好伸缩性,同时也维持了布局的全局径向性,实现 多维层次视图的无缝融合。
【附图说明】
[0024] 图1是本发明基于径向布局的多维层次可视化方法的整体系统概览图。
[0025] 图2是本发明基于径向布局的多维层次可视化方法的多维层次视图。
[0026] 图3是本发明基于径向布局的多维层次可视化方法的交互操作展示图。
[0027] 图4是本发明基于径向布局的多维层次可视化方法的层次结构设计图。
[0028] 图5是本发明基于径向布局的多维层次可视化方法的多维结构设计图。
[0029] 图6是本发明基于径向布局的多维层次可视化方法的视图融合与交互之展示图 〇
[0030] 图7是本发明基于径向布局的多维层次可视化方法的视图融合与交互之展示图 --〇
[0031] 图8是本发明基于径向布局的多维层次可视化方法的视图融合与交互之展示图 _? 〇
[0032] 图9是本发明基于径向布局的多维层次可视化方法的使用颜色放射渐变效果图。
[0033] 图10是对本发明方法进行进行具体实例验证之结果图一。
[0034]图11是对本发明方法进行进行具体实例验证之结果图二。
[0035] 图12是对本发明方法进行进行具体实例验证之结果图三。
[0036] 图13是对本发明方法进行进行具体实例验证之结果图四。
[0037] 图14是对本发明方法进行进行具体实例验证之结果图五。
[0038] 图15是对本发明方法进行进行具体实例验证之结果图六。
[0039] 图16是本发明基于径向布局的多维层次可视化方法的实现流程示意图。
【具体实施方式】
[0040] 本发明的目的是提供一种基于径向布局的多维层次可视化方法,主要是多维层次 视图的绘制算法,还包括多维层次数据结构的定义与抽取、以及保持局部和全局上下文信 息的交互设计,包括3大步骤。
[0041] (1)多维层次数据结构的定义与抽取
[0042] 由于搜集的原始数据大都以条目的形式保存,数据中本身包含的多维属性和层 次特性表现不明显,故需要对其进行数据结构的抽取。设原始数据集UmXn包含m条记录
,iG[0,m)表示记录的索引值,jG[0,n)表示每条记录的第 j个特征项的索引值,Uu表示第i条记录的第j个特征项。通过上述步骤抽取得到数据条 目的多维属性,而原始数据的层次结构根据其所隐含的组织结构或地理信息等定义为树结 构,同样,对于数据集UmXn,定义层次树Tm=〈V,E>,数据记录映射为树结构中的节点集V,数 据记录间潜在的包含或从属关系集对应树结构中的边集E。最终可以得到,原始数据的数 据结构定义为D= {〈u,t>IuGUmXn,tGTJ。至此,完成对多维层次数据结构的定义和抽 取。
[0043] (2)多维层次视图的绘制算法
[0044] 多维层次视图的绘制算法包括三个部分:径向层次视图的绘制算法、圆形平行坐 标绘制算法和视图融合。其优势在于:①保持整体视图的全局径向性,充分利用有限的屏幕 空间,使得在维度或层次扩展的同时具有较好的伸缩性;②采用镂空的设计策略,实现径向 层次视图和圆形平行坐标的无缝融合,方便用户在交互探索时维持全局和局部的上下文信 息。
[0045] 1)径向层次视图绘制算法:对于树结构Tm=〈V,E>,采用径向填充算法进行绘制, 其中采用扇形块,如下式:
[0046]Widget00
[0047] {(innerRadius,outerRadius,startAngle,endAngle) |innerRadius,outerRadiu s>0八0° <startAngle,endAngle<360° }此公式表示层次结构中的节点。每个节点对应 的扇形块Widget由对应的四元组唯一确定,其中innerRadius,outerRadius分别表示其内 外半径,startAngle,endAngle表示沿顺时针方向扇形块的起始和终止角度。父子节点之 间的层次关系使用Widget之间的相互嵌套隐喻来表达,如图2所示,即孩子节点绘制于其 父节点所占有的扇形区域内,而每个节点所对应的Widget角度跨度对应其所包含所有子 孙节点中叶子节点占总的叶子节点的比例,即表示为
式中childi.leafCount表示第i个子节点的节点数目,pNode.leafCount表示其父节点所 含子节点数目,而pNode.arcWidth表示父节点的Widget角度跨度。当层次增加时,为了更 好地识别每个层次的节点,使用颜色放射渐变的策略提供直观有序的视觉效果。
[0048] 2)圆形平行坐标绘制算法:传统的平行坐标在二维空间中采用等距离的、竖直的 k条平行坐标轴表示k维空间,每条轴线对应一个属性维度,坐标轴的取值范围可根据数据 自定义映射关系,k维空间的数据点对应平行坐标上的折线段。然而该方法随着维度的增 加对屏幕大小敏感,为了提高空间利用率和保持整体视图的全局径向性,提出圆形平行坐 标绘制算法。其主要思想为:在二维空间中采用圆形布局的策略使用k条射线轴表示k维空 间,同时为了融合径向层次视图,每个坐标轴的起始位置开始于半径为rin的圆环,终点放 置于半径为1~_的圆环上。坐标轴XJ1 = 1,…,k)顺时针依次部署于圆环上,每个k维数 据点Pi=(Pk),Pm. .,(其中Py_表示k维空间中第j个分量)映射为一条圆形折线段
.其中Vij表示第j,je[0,k-1]条的数据点,^ViU-2-Vik-l 表示轴k-2与k-1之间的折线。
[0049] 3)视图融合:经过上述两步分别生成了表示层次信息的径向层次视图和表示多 维信息的圆形平行坐标,该视图均满足全局径向性。由于圆形平行坐标采用中间镂空的设 计策略HolowSpiralModel,故将径向层次视图绘制于镂空区域以实现两视图的无缝融 合,径向层次视图的最外层圆环半径略大于圆形平行坐标内圆环半径CinnOTKadius。
[0050] (3)保持局部和全局上下文信息的交互设计:在该步骤中,采用DetailOutside 策略设计Multi-focus+context交互式视图,使用户可以同时分析多维层次视图的多个区 域。当视图中的折线或节点获得焦点后,将会生成一棵以该当前节点为根的子树SubTree, 其数据结构与整体视图的数据结构一致。新生成的SubTree向外扩张,其根节点对应外圈 新生成的圆环,而SubTree的子孙节点仍然和整体视图相同的布局算法依次向外层布局, 原先的整体视图向内中心镂空区域收缩,保持多维层次视图的全局径向性。此时生成的视 图包含有全局信息,也含有局部上下文信息,提供用户多视角多层次的分析需求,如图3所 不〇
[0051] 结合上述可视化方法的主要设计思路,本发明基于径向布局的多维层次可视化方 法具体实现过程详述如下。
[0052] 步骤1:定义多维层次数据的数据结构
[0053] 设共包含m条数据记录且具有n个数据维度(属性字段或数据特征)的原始数据 集可表示为矩阵u
mXn,定义为
,其中,
1表示第i条数据条目,表示第i条记录的第j个属性值。 相应的潜在层次结构可表示为
Tm是连通 图,树中的每个节点节点node定义为:
^,…,v|v|}表示节点集,对应原始数据集的条目,E={epe2,…,e|E|}表示数据 中隐含的包含或从属关系,attrs为节点属性集,children表示子节点集,三元组 <atts,i!;,chiWren>表示一个节点或一条折线段。至此,由多维层次数据结构可定义为:D= {<u,t>|uGUmXn,tGTj〇
[0055] 步骤2 :对原始数据进行抽取、预处理生成预定义数据结构的数据
[0056] 定义后的数据为抽象数据,无布局信息,对应某一节点或折线段无坐标、颜色、尺 寸、标签等信息,只含有数据的基本信息,并对该数据进行布局渲染生成可绘制数据元素 Visualltem。此设计为一种可视化框架,优势在于在可视化过程中保存数据的原始结构信 息,同时为多个可视化模型提供基础数据模型(basedatamodel),这使得多个特定的可视 化模型共享原始数据结构信息而又相互独立(模式-视图-控制器模式),用户执行的交互 操作只针对与其对等的可绘制元素VisualItem。
[0057] 对原始数据集进行异常值处理,如空条目、数据类型错误等。首先遍历每条记录, 对其中存在的异常属性值按照不同的异常情况进行不同的处理,如数值空条目,由于没有 历史数据进行零值填充;数据类型错误进行类型转换,有可能数值不符合要求,根据该条目 数据取平均或最值处理。
[0058] 对预处理后的数据进行数据抽取,具体为,遍历数据集中的每条记录,其由基本 属性字段(如记录的标识、名称、从属信息等)和特征字段(即为要展示分析的维度) 组成,对该记录生成与之对应的节点node,基本属性字段对应节点node中的atts属性 集,而特征字段生成为
,其中每个&对应该特征维度上 的取值,同时根据数据中的组织结构或地理信息等获取节点间的从属关系,如遍历节点node其地理名称为"成都市",其为节点"四川"的管辖城市,故找到节点parent其name 属性为"四川",添加node的节点为其子节点,即parent.addChild(node),得到由节点 node=<atts,c/iiWren>组成的节点集,即为隐藏的生成树模型,根节点即为无父节点的 节点,表示为J/nHotyatts.icMdren》。然后对处理后的数据进行特征选取,该可视 化方法中需要对数据的多维属性进行可视分析,一般来讲,对于交互式设计,维度过高,容 易使得绘制的视图中出现聚簇,造成视觉混乱,对维度数较少12),可结合已有的知识 背景或经验进行选取,或全部进行绘制,而对于维度较高(>12),由于屏幕空间的限制无 法全部绘制出来,此时提供用户对维度的可控,如选取若干维度进行展示并分析,同时采 用降维技术(PCA)对数据进行降维,从而完成维度信息的提取。此时数据条目可表示为
,根据数据潜在的层次结构如组织架构、地理信息等提取生 成树模型
[0059] 该模型由下述绘制算法进行布局、渲染,从而获得可绘制的单个数据元素 VisualItem,此时的VisualItem具有可绘制的所有信息,如坐标、颜色、标签、尺寸等,且具 有数据的原始结构信息如,层次、多维属性等,最后递归的对Visualltem进行绘制。
[0060] 步骤3 :定义多维层次视图的绘制算法,包括径向层次视图的绘制算法、圆形平行 坐标绘制算法、视图融合三个部分。具体如下:
[0061] 1)径向层次视图的绘制算法
[0062] 给定节点pNode的第i+1个孩子节点childi+1GTm,该节点在视图中的绘制为:
[0064] 在此公式中,孩子节点childi+1对应视图中的扇形块Widget,而每个扇形块由〈in nerRadius,outerRadius,startAngle,endAngle〉四元组唯一确定。rStep表不每个节点对 应的扇形块的径向宽度,由该节点的内半径innerRadius和外半径outerRadius决定,孩子 节点childi+1的起始角度startAngle等于父节点pNode起始角度加上节点ci的结束角度 endAngle。节点跨度arcWidth由以该节点为根节点的子树的叶子节点数占原始树的总的 叶子节点数的比例,如图4所示。
[0065] 2)圆形平行坐标绘制算法
[0066] 对于给定UmXn,其中的n维数据点映射为二维空间上的一条圆形折线段,如图5所 示,其映射函数定义为
,其 中,vu(X,y)表示轴&第i条折线段与轴的交点,其坐标可由以下定义计算:
[0067]
,式中,uMaXj,uMirij表示第j个维 度上的最大值和最小值,得到的(x,y)为节点Vij(x,y)在圆形平行坐标中相应轴上的坐标 值,0可由以下公式计算获得:
[0068] 通过以上映射算法,将数据集UmXnWn维空间映射到二维空间,每条记录洱Gt;对 应一条折线段QeL,整个数据集可由相应的折线段集合表示,即L={Li10 <i〈m}。
[0069] 3)视图融合
[0070] 借助镂空设计策略HolowSpiralModel实现多维层次视图的无缝融合,Detail Outside交互设计实现对视图的联动分析。
[0071]设计圆形平行坐标时,若n维坐标轴起点为同一圆心,在邻近圆形区域由于空间 密集狭窄,对于折线图的绘制会引起视觉上的混乱,故采用镂空思想使圆形平行坐标的中 心区域镂空,同时由于其几何特性,使得中心区域满足全局径向性,从而易于层次视图无缝 嵌入其中。
[0072]当视图中某一折线段或节点获得焦点时,会生成已改当前节点为根节点的子树, 并依此向镂空区域的外侧布局,而整体视图则想内侧收缩,并自动填充空白区域,提高空间 利用率,同时实现对局部区域的分析,并不丢失全局上下文信息。此外,由于采用径向布局 策略,位于下方的坐标轴或节点与人的视觉放下相反,故设计平移、旋转交互操作,使得整 个视图的方向可定制,如图6、图7和图8所示。
[0073] 步骤4 :视觉编码
[0074] 借助Colorbrewer使用颜色放射渐变的策略,同时修改色调和透明度对每层节点 进行着色,提供对每层节点视觉上直观清晰的辨识,此外当折线段过多,易于出现聚簇影响 视觉效果,在此通过透明度+添加剂的设计策略使得满足筛选条件的节点或折线簇的辨识 度提尚。渐变效果如图9所不。
[0075] 最终,本发明实现的原型系统如图1所示,包括如下几个部分:
[0076] (1)多维层次视图(图1中a、b):图1中a为RSF布局的层次视图展示数据层次 结构,图1中b为改进的圆形平行坐标表示数据的维度信息,其整体上采用径向布局策略, 在具有较高空间利用率的同时保持较好的全局和局部上下文信息。
[0077] ⑵Colormap(图1中c):该视图用于展示维度信息的数据分布,不同的数据分布 值映射为色调和透明度不同的颜色值,采用此策略各个色块之间具有较好的颜色区分度。
[0078] (3)用户接口(图1中d):提供用户可交互的接口,允许用户定制筛选规则,辅助 用户从多角度多层
次的探索和分析数据以发现潜在的知识和模式。
[0079] 为验证本发明基于径向布局的多维层次可视化方法的实用性和有效性,做如下实 例分析。选取来自中国气象局的气象数据为研宄对象对本发明基于径向布局的多维层次可 视化方法进行验证。气象数据的层次结构表现为全国各省市城市,12个月份或各项气象指 标代表该数据的多维信息。从原始数据网站爬取数据,形成的整个数据集由353个层次节 点(全国各省、市、县等)及对应12月份的9个气象(极端高温、平均高温、平均温度、平均 低温、极端低温、降雨量、相对湿度、平均日降雨量、日照等)。考虑到各气象指标之间的相关 性,本实例中选取了前6个气象指标作为分析对象。
[0080] 首先,从整体视图的概览图可以观察到,从11月到2月份大部分城市的降雨量相 对于其他月份较低,同时各城市的降雨量呈上升趋势,并在7、8、9月达到峰值,然后呈下降 趋势,如图10、图11、图12和图13所示。
[0081]当观察圆形平行坐标内侧时,如云南普洱、广东的汕头茂名,可以看到这些城市的 降雨量在全年呈圆形状,这表示这些城市的降雨量较均匀且量少。此外,在6、7、8月份在多 个维度上降雨量呈密集(聚簇)分布,如图14和图15所示。通过过滤和选择操作,发现这 些层次在这些月份的降雨量大都集中在80mm与186mm之间,该现象与全国多个区域的降雨 量分布一致。
[0082]其次,通过本发明所实现的原型系统,可以检测原始数据中的一些异常值。在图 图14和图15的右侧,初始时,视图的底部区域有聚簇,还有些离散的折线段,而且其值较 大,通过detailondemand和旋转交互操作,选择其中的一条折线段并观察Colormap和 Detail视图,发现该城市为海南三亚,它在6月至11月的降雨量分布相对集中,且大致分 布于190mm与240mm之间,该分布符合三亚的热带海洋性季风气候特征。同样的,我们观察 另一异常值,发现其为广西东兴县,该县的降雨量在4月至11月的分布跨度较大,大致在 151. 2mm与570. 9mm之间,通过在线查阅资料,我们发现东兴县属于亚热带海洋季风气候, 符合该区域降雨量的分布特征。
【主权项】
1. 一种基于径向布局的多维层次可视化方法,其特征在于,包括径向层次视图的绘制 算法、圆形平行坐标绘制算法、视图融合三个部分; 径向层次视图的绘制算法:给定父节点pNode的第i+Ι个孩子节点childi+le Tm,TmS 树结构,下标m表示节点数,该节点在视图中的绘制为:,孩子 节点childi+1对应视图中的扇形块Widget,每个扇形块由〈innerRadius, outerRadius ,startAngle, endAngle〉四元组唯一确定;rStep表示每个节点对应的扇形块的径向宽 度,由该节点的内半径innerRadius和外半径outerRadius决定,节点childi+1的起始角 度startAngle等于父节点pNode起始角度加上节点Ci的结束角度endAngle ;节点跨度 arcWidth由以该节点为根节点的子树的叶子节点数占原始树的总的叶子节点数的比例; 圆形平行坐标绘制算法:对于给定数据集Umxn,其中的η维数据点映射为二维空间上的 一条圆形折线段,其映射函数定义为:其中VijU, y)表示 轴^第i条折线段与轴的交点,其坐标由进 行计算,uMaXj,UMinj表示第j个维度上的最大值和最小值,(X,y)为节点V u (X,y)在圆形 平行坐标中相应轴上的坐标值,Θ由+j 计算获得; 视图融合:借助镂空设计策略Holow Spiral Model实现多维层次视图的无缝融合, Detail Outside交互设计实现对视图的联动分析。2. 如权利要求1所述的基于径向布局的多维层次可视化方法,其特征在于,还包括定 义多维层次数据的数据结构和对原始数据进行抽取、预处理生成预定义数据结构的数据两 个步骤; 定义多维层次数据的数据结构:设共包含m条数据记录且具有η个数据维度的原始数 据集表示为矩阵Unixn,定义为=佐=U,:,.,…,!々,卜〗)…S i < in, 0旬· < ?ι},其 中,珥=Uij,表示第i条数据记录,Uij表示第i条数据记录的第j个属性值,相应的潜在层次结构表示为Tm=〈V,E>,定义为 ^是连通图,树中的每个节点node定义为:V = Iv1, v2, …,V|v|}表示节点集,对应原始数据集的条目,E= Ie1, e2,…,e|E|}表示数据中隐含的包含 或从属关系,attrs为节点属性集,children表示子节点集,三元组<atts,i!;,c/iiWrenV表示 一个节点或一条折线段,即多维层次数据结构定义为D = {〈u,t> |u e UmXn,t e TJ ; 对原始数据进行抽取、预处理生成预定义数据结构的数据:首先对原始数据集进行异 常值处理,异常值包括空条目、数据类型错误,具体为,遍历每条记录,对其中存在的异常属 性值按照不同的异常情况进行不同的处理,数值空条目进行零值填充,数据类型错误进行 类型转换,根据该条目数据取平均或最值处理;再对预处理后的数据进行数据抽取,具体 为,遍历数据集中的每条记录,记录由基本属性字段和特征字段组成,对于该记录生成与之 对应的节点node,基本属性字段对应节点node中的atts属性集,而特征字段生成为: ?; = u;1,, , 每个U ij对应该特征维度上的取值,同时根据数据中 的组织结构或地理信息获取节点间的从属关系,得到由节点·de=<atts, ?;, c/iiWren〉 组成的节点集,即为隐藏的生成树模型,根节点即为无父节点的节点,表示为: Tm: root=<atts,i!;,c/iiWren>,获得可绘制的单个数据元素 VisualItem ;最后递归地对 VisualItem进行绘制。3. 如权利要求1或2所述的基于径向布局的多维层次可视化方法,其特征在于,还包 括借助Colorbrewer使用颜色放射渐变的方法,同时修改色调和透明度对每层节点进行着 色,通过透明度加添加剂的设计方法使得满足筛选条件的节点或折线簇的辨识度提高。4. 如权利要求1或2所述的基于径向布局的多维层次可视化方法,其特征在于,还包括 提供用户交互的接口,允许用户定制筛选规则,辅助用户从多角度多层次地探索和分析数 据以发现潜在的知识和模式。
【专利摘要】本发明公开了一种基于径向布局的多维层次可视化方法,即定义多维层次视图的绘制算法,包括三个部分:一、径向层次视图的绘制算法,给定父节点pNode的第i+1个孩子节点childi+1∈Tm,该节点在视图中的绘制为:二、圆形平行坐标绘制算法,对于给定数据集Um×n,其中的n维数据点映射为二维空间上的一条圆形折线段;三、视图融合,借助镂空设计策略Holow Spiral Model实现多维层次视图的无缝融合,Detail Outside交互设计实现对视图的联动分析。本发明保持了较高空间利用率和较好伸缩性,同时维持了布局的全局径向性,实现多维层次视图的无缝融合。
【IPC分类】G06F17/30
【公开号】CN104899288
【申请号】CN201510305090
【发明人】朱敏, 唐彬彬, 刘汉清, 苏亚博
【申请人】四川大学
【公开日】2015年9月9日
【申请日】2015年6月5日