测品娱乐
您的当前位置:首页一种面向网络舆情危机预警的观点柔性挖掘模型

一种面向网络舆情危机预警的观点柔性挖掘模型

来源:测品娱乐
情 报 杂 志第28卷 第10期             28 No.10             Vol.2009年10月Oct. 2009JOURNALOFINTELLIGENCE

一种面向网络舆情危机预警的观点柔性挖掘模型

丁菊玲1,2 勒中坚1,2 王根生1 周 萍1,2

(1.江西省电子商务工程技术研究中心;2.江西财经大学信息管理学院 南昌 330013)

3

ANewFlexibleOpinionMiningModelFacingInternetPublicOpinionsCrisisWarning

摘 要 针对网络舆情危机预警方法的不尽完善,建立柔性舆情挖掘、观点演化和网络舆情危机预警三个子模型。采用统一挖掘算法,实现粗、中、细三种粒度观点柔性挖掘;采用发酵、异化和演化模型实现观点演化,并研判演化趋势;结合网络生态环境和观点演化趋势以及危机预警子模型实现对网络舆情危机的识别和预警并且给出了基于观点树的柔性观点挖掘实例。

关键词 观点挖掘 网络舆情 危机预警 柔性舆情挖掘

中图分类号 G350TP391    文献标识码 A      文章编号 1002-1965(2009)10-0152-03

  近年来,随着各种危机事件的不断爆发,国内外普遍关注公共危机的预警研究,希望通过预警机制实现对危机爆发前的预警,减少危机损失[1]。但是大多数学者没有将危机的预警工作作为研究重点,尤其是对重大突发事件的危机预警研究还处于起步阶段[2-3]。网络舆情危机的预警机制研究相对较少[4],只在少数文献中看到关于高校网络舆情危机预警[5]研究的提法,没有相关的实际深入研究。

网络舆情是网民对现实生活中某些热点、焦点问题所持的有较强影响力、倾向性的言论和观点,主要通过BBS论坛、博客、新闻跟贴、转贴等实现并加以强化。网络舆情,主要是半结构化或非结构化信息,迫切需要先进的信息技术对网络舆情危机预警进行研究,若干研究尝试从技术角度用观点挖掘(OpinionMining简称OM)的方法进行网络舆情监控[6-8]。广义的观点挖掘[9]也被称为情感分类[10](SentimentClassifica2

tion)、情感分析[11](SentimentAnalysis)或文本意见挖

士[15]等对其均有较深入的研究,在单粒度的观点挖掘算法和情感语料库的构建上都取得了很好的研究成果。国内在观点挖掘方面的研究刚刚起步,其中中国科学院计算所[16]、清华大学[10]、上海交通大学[11]、复旦大学[17]、大连理工大学[18]等在该领域进行了积极的探索;研究集中在细粒度汉语文本意见挖掘以及汉语情感语料库的构建上,但都处于初步研究阶段。

现有的观点挖掘技术[19-20]都是用某一算法实现单一粒度的观点挖掘,如用于判断观点极性的粗粒度挖掘算法、观点强度的判定算法、细粒度的挖掘算法等以及对这些算法的改进,但缺乏统一的挖掘模型或算法用以同时实现多种粒度的观点挖掘研究。

网络舆情具有很强的时变性和环变性,本文提出一种面向网络舆情危机预警的观点柔性挖掘模型,通过构建统一模型(UnifiedModel),建立基于观点树的粗、中、细三种粒度的统一观点挖掘模型,并对细粒度观点进行演化,预测观点的发展趋势,最终构建危机识别和预警模型,达到网络舆情危机预警的目的。1 模型设计

观点柔性挖掘模型的总体设计如图1所示,共包括三个子模型,分别是:a.柔性舆情挖掘子模型:构建统一挖掘模型,生成观点树,得到多粒度的观点;b.观点演化子模型:可视化输出所挖掘出的观点,对网络生态环境进行研判;构建发酵模型,对所挖掘出的细粒度

掘(OpinionMiningforText)等,涉及到自然语言处理、信息检索、数据挖掘等研究领域。观点包括简单的赞同、反对或中立三种态度(粗粒度),也包括对某一对象所持态度的强度(中粒度),甚至是对该对象具体看法和态度(细粒度)等。

对观点挖掘的研究,国外起步相对较早,美国伊利诺斯大学的刘兵教授[12-13]、匹兹堡大学的Janyce

Wiebe教授[14]和意大利比萨大学的AndreaEsuli博

收稿日期:2009-05-08    修回日期:2009-06-26

基金项目:全国教育科学“十一五”规划2008年度教育部青年专项课题(编号:ECA080292);国家社科基金项目(编号:09BTQ034)资助。作者简介:丁菊玲(1981-),女,博士研究生,讲师,主要研究方向为观点挖掘、网络信息安全;勒中坚,教授,博士生导师;王根生,博士研究生,工程师;周 萍,博士研究生,讲师。

第10期           丁菊玲,等:一种面向网络舆情危机预警的观点柔性挖掘模型・153・

观点进行观点发酵;构建异化模型,对细粒度观点进行观点异化,得到趋势观点集合,并将其分类成相近观点和相异观点;观点演化则将趋势观点经演化模型生成对观点的趋势预测结果;c.舆情危机预警子模型:经演化模型计算出网络舆情的发生概率和危机影响值,从而判断其所处在网络舆情晴雨表中的象限位置,进行相应的危机预警。

a.先建立根节点,也就是确定网络舆情主题;b.对于该舆情主题,挖掘出正面、中立或负面观

点,构建观点树的第一层中间节点;

c.挖掘出具有某粗粒度观点的强度,构建观点树

的第二层中间节点;

d.叶子节点的构建,它给出的是针对所持强度观

点的具体观点,即<对象1,观点1>,<对象2,观点2

>...<对象n,观点n>等二元组。观点树结

构图如图2所示。

 1.2 观点演化 网络是人与信息的生态,被称为人类的“第二生存环境”,对容易引发网络舆情危机的网络生态环境研判是网络舆情危机预警的一个重要问题。网络生态环境是复杂多变的,网民关注的焦点事件会随时间变化而不同,需要判断容易引发网络舆情危机的环境变化。网民群体观点不仅会随时间而变化,也会随网络生态环境而变化,观点演化结果直接影响网络舆情危机的预警。本文对挖掘出的细粒度观点,一方面通过构建发酵模型生成趋势观点集合A1,另一方面通过构建的异化模型得到观点集合A2;考虑到相近观点和相异观点对观点趋势的影响不同,也为了更有效地进行网络舆情危机预警,将A1、A2组合成趋势观点集合A(即A=A1+A2),用相似度函数计算

A中观点与柔性舆情挖掘中所挖掘观点的相

似度,将A分类成相近观点A′1和相异观点

图1 模型总体设计

 1.1 柔性舆情挖掘 舆情挖掘子模型包括:统一挖掘模型、观点树、多粒度观点挖掘。统一挖掘模型是对某一主题下网民观点的统一挖掘建模。观点树的根节点到叶子节点,描述的是关于某主题的粗、中、细三种粒度的观点,并随着用户对粒度的不同需求,给予不同粒度的挖掘结果。如,企业高层决策用户只需要关注粗粒度的观点挖掘结果,而管理层用户关注的是中粒度的挖掘结果,作业层用户关注的是细粒度的挖掘结果。多粒度观点挖掘结果以可视化形式输出,提供网络生态环境研判参考。

常见的单一算法,在实现单一粒

度研究上,忽视了不同粒度观点之间的关联,观点柔性挖掘的统一模型构建,从观点树的生成着手,建立基于观点树的统一挖掘模型,其步骤为:

A′A′2(即A=A′1+A′2),再将A′1、2输入到演化模

型中进行演化。

     图2 观点树

 1.3 舆情危机预警 将观点演化趋势的指标集输入预警子模型,计算出网络舆情危机发生概率和危机影响值,得到网络舆情晴雨值,如图3所示为网络舆情晴雨表。

                     情 报 杂 志                  第28卷・154・

3 小 结

目前,我国已经建立了多种应急预案、多级预防体系,用于应对突发性、群发性等危机事件,但危机爆发前的预警工作相对较弱,特别是对突发性强、覆盖面广、影响力大、传播速度快的网络舆情危机缺乏有效的预警。面向网络舆情危机预警的观点柔性挖掘模型研究,a.从网络舆情危机预警的角度,构建观点柔性挖掘模型;b.基于观点树的统一挖掘模型,实现多粒度的观点挖掘;c.基于网络生态环境,模拟危机中观点演化过

图3 网络舆情晴雨表

程,构建发酵模型和异化模型衍生得到相近和相异观点,通过观点演化模型预测观点演化趋势。

参考文献

[1] 程传超.危机管理视角的网络舆情监管研究[D].兰州大学,

2008(4)[2] 王国玉.我国公共危机预警的现状及对策探究[D].吉林大学,

2008(4)

[3] 吴绍忠,李淑华.互联网络舆情预警机制研究[J].中国人民公

  横坐标为网络舆情危机发生概率(0~100%),纵坐标为网络舆情危机影响值(0~10),由4个象限组成,第I象限表示高危机影响值和发生率,危险程度高,属于红色预警区域;第II象限表示高概率低影响,危险等级处于中间状态,属于黄色预警区域;第III限表示危机时间发生概率较低,危机的影响也较低,危险等级较低,属于蓝色预警区域;第IV象限表示舆情危机发生概率低,但危机的影响值高,危险等级较高,属于橙色预警区域;根据判断所处象限,采取不同等级的预警措施。2 实 例

图4所示为基于观点树的观点柔性挖掘实例。从人民网强国论坛中采集的2009年3月3日从上午9:

12至下午15:25之间的舆情数据,它是采用上贴、跟

安大学学报(自然科学版),2008,57(3)

[4] 王来华.如何应对“舆情危机[J].决策,2007(7)

[5] 桑 华,卿涛.浅谈高校舆情危机预警[J].当代经济,2008(8)[6] 梅中玲.基于Web信息挖掘的网络舆情分析技术[J].中国人

民大学学报(自然科学版),2007,54(4)

[7] 许 鑫,章成志.互联网舆情分析及应用研究[J].情报科学,

2008,26(8)

[8] 张 超.文本倾向性分析在舆情监控系统中的应用研究[D].

北京邮电大学,2008(2)

[9] 王 辉,王晖昱,左万利.观点挖掘综述[J].计算机应用研究,

2009,26(1)

[10]周立柱,贺宇凯,王建勇.情感分析研究综述[J].计算机应用,

2008,28(11)

[11]姚天日方,程希文,徐飞玉,等.文本意见挖掘综述[J].中文信息

帖、回帖的形式进行。对其采用人工标注的方式进行分析:网络舆情的主题是网络检举监督,得到的粗粒度观点分别是54.9%支持,18.3%中立,26.8%反对。对正面观点进一步挖掘,得到中粒度观点为20.5%非常支持,.1%较支持和15.4%一般支持。对各种强度的观点挖掘可得到观点细节如<网络检举,非常满意>,<举措,很好>等。

学报.2008,22(3)

[12]MGanapathibhotla,BLiu.MiningOpinionsinComparativeSen2

tences[A].Proceedingsofthe22ndInternationalConference

  onComputationalLinguistics(Coling

2008),Manchester,August2008:241-248

[13]XWDing,BLiu,PSYu.AHolistic

Lexicon-BasedApproachtoOpinionMining[A].WSDM’08.February11-122008.ACM,USA

[14]JWiebe,TWilson,CCardie.Annotat2

ingExpressionsofOpinionsandEmo2tionsinLanguage[J].LanguageRe2sourcesandEvaluation,2005,39(2/3)

PaloAlto.California,

(下转第67页)

图4 基于观点树的观点柔性挖掘实例

第10期             东 方《公共图书馆建设标准》:述评及其对策研究・67・

的图书配送体系”创造条件。

值得注意的是,随着社会的发展,农民工成为较庞大的特殊群体。《建设标准》以公共图书馆的服务对象作为确定其建设规模的基本依据,如何确保公共图书馆为外来务工人员服务是一个不容忽视的问题。农民工是城乡统筹发展、社会和谐发展的重要力量,为城市现代化建设做出了较大的贡献,享受公共文化成果也是理所当然。公共图书馆应该关注和重视城市农民工的文化需求,把丰富农民工精神文化生活作为图书馆履行公共服务职能的一部分。农民工虽然对公共图书馆有一定的文化需求,但由于文化知识水平参差不齐,利用图书馆时可能存在心理、经济、文化和时间等障碍[11]。公共图书馆需要树立自觉为农民工服务的意识,对服务方针与工作策略进行调整,最大限度地满足农民工的文化需求。应该系统搜集有益于农民工发展的各类信息,编发信息简报;根据城市农民工群体的文化需求、经济能力和居住环境等特点,建立便捷的图书馆服务体系;主动利用城市文化资源,组织以农民工为主体的各种文化活动,引导他们融入城市文化生活,提高这一群体的现代生活意识等。 3.3 加强公共图书馆的网站建设和特色数字资源建设,是公共图书馆服务的保障 主导观点认为,数字化、网络化对公共图书馆的建设提出了面积和技术新的要求,这是确定公共图书馆建设规模和发展前景的一个重要因素。公共图书馆网站作为网络环境下公共图书馆服务于大众的平台,是公众在互联网上获取公共文化服务,寻求知识信息的重要渠道[12]。网站建设的好坏,直接关系到读者对图书馆资源的利用率,关系到图书馆职能的发挥,也关系到受众的满意度。为了确保公共图书馆采用现代化的信息技术手段为公众服务,当务之急是应该建设好其门户网站。网站设计是网站建设的重要一环。网站结构是否合理直接影响到访问者的使用,所以在设计时,应当坚持以用户为中心,以优化服务质量为原则,注意做到结构合理、外观美化、内容充实。以网络为平台,向社会提供各种网络资源和知识服务,特别是数字参考咨询服务,采用在线

(上接第154页)

[15]AEsuli.AutomaticGenerationofLexicalResourcesforOpinion

Mining:Models,AlgorithmsandApplicatins[D].doctoraldisser2tation.UniversitàdiPisa.Italy,2008

[16]唐慧丰,谭松波,程学旗.基于监督学习的中文情感分类技术

解答、E-mail、BBS等方式提供服务。

另外,还应注意特色数字资源的建设。公共图书馆建设具有自身特色的网络数字资源以满足日益增长的信息需求,对于扩大知名度与影响力,提升公共图书馆的社会形象具有积极的作用[13];但目前我国公共图书馆特色数字资源建设还存在一些问题。公共图书馆应该充分挖掘特色资源,加大对地域特色资源、历史地方文献特色资源、学科特色资源以及其它专题特色资源的开发力度;并注意制定统一标准,进行合理的规范,提高特色资源的利用率。

参考文献

[1] 城市新图.《公共图书馆建设标准》11月1日起施行[EB/OL].

[2009-02-28].http://www.cityphotos.cn.

[2] 同花顺金融服务网.《公共图书馆建设标准》正式出台[EB/

OL].[2009-02-28].http://news.10jqka.com.cn/content/521/244/402/521244402.shtml.[3] 冯守仁.《公共图书馆建设标准》主要指标分析及应用[EB/

OL].[2009-02-28].http://www.yzlib.cn/book/1.ppt.[4] 中华人民共和国文化部.《公共图书馆建设标准》答记者问

[EB/OL].[2009-02-28].http://www.mcprc.gov.cn.[5] 张广钦等.美国公共图书馆建设标准核心要素分析[J].中国图

书馆学报,2009,35(1):18-25,70

[6] 吴 悦.美国爱荷华州公共图书馆建设标准及启示[J].图书馆

工作与研究,2009(3):23-28

[7] 张 丽等.美国威斯康星州公共图书馆标准对我国公共图书馆

相关标准的启示和影响[J].图书馆建设,2008(7):24-28

[8] 李国新.公共图书馆“用地”与“建设”标准的性质、作用和特点

[J].中国图书馆学报,2009,35(1):4-10

[9] 阮胜利.基层公共图书馆服务体系建设的几个基本问题[J].图

书馆杂志,2008,27(1):36-39

[10]王学熙.公共图书馆服务体系建设的现状与对策[J].图书馆

理论与实践,2008(2):82-87

[11]赵任飞.强化公共图书馆的城市农民工服务[J].图书馆杂志,

2008,27(8):33-34,23

[12]孙淑娟.从优化网站服务谈公共图书馆网站建设[J].图书馆

理论与实践,2008(5):82-83

[13]裴成发.我国省级公共图书馆特色数字资源建设调查[J].图书

馆杂志,2008,27(10):21-24

(责编:刘影梅)

[18]徐琳宏,林鸿飞,杨志豪.基于语义理解的文本倾向性识别机

制[J].中文信息学报,2007,27(1)

[19]DMartens,LBruynseels,BBaesens,etal.PredictingGoing

ConcernOpinionwithDataMining[J].DecisionSupportSys2tems,2008,45(4):765-777

[20]N.Kobayashi.OpinionMiningfromWebDocuments:Extraction

andStructurization[D].NaraInstituteofScienceandTechnology,2007(3)

(责编:白燕琼)

比较研究[J].中文信息学报,2007,21(5):11

[17]章剑锋,张 奇,吴立德等.中文观点挖掘中的主观性关系抽

取[J].中文信息学报,2008,22(2):3

因篇幅问题不能全部显示,请点此查看更多更全内容