前言
在Web 2.0时代里,互联网上存在着大量可作为情感语料数据原型的评论。如何高效精确地获取基于这些语料的情感信息,并依此进行相关研究成为当前信息科学与技术领域面临的重大挑战。情感分析,又称意见挖掘(opinion mining),是用于分析人对特定对象及其相关属性的观点、态度以及其他主观感情的技术。
为了给广大研究者提供科研参考,本书在深入研究文本情感问题及现状的基础上,充分结合计算语言学、统计学、机器学等相关理论及方法,利用语义块、句子、文本等不同语言粒度进行文本情感倾向性的建模、分析与研究,从而提出高效、精确的文本情感分类技术与方法。
本书阐述的技术可广泛应用于推荐系统、社会舆情分析、产品在线跟踪和质量评价、影视评价、Blogger声誉评价、新闻报道评述、事件分析、股票评论、图书推荐、敌对信息检测、企业情报系统等方面。
本书可分为九个模块,从情感分析的具体流程,包括语料、文本预处理、特征选择与情感分类等为文本的情感分析提供相关的技术指导,并着重介绍了数据获取、自然语言处理、算法运用与文本情感比较等多种技巧,内容全面丰富,语言详细。
本书不但可以满足广大科研工作者、博士、硕士研究生的科学技术研究和情感语言分析的实际操作的需求,也可以作为高校研究生的参考教材,让读者在进行技术研究时得到更多的技术指导。
在本书编写过程中,感谢中国青年政治学院计算机搜索团队成员马敬贤、纪彬伟、陈思、吴佳妮等不辞辛劳地审校,感谢张洪喆、王函石、李志晓、闫晓宇等挚友对本书稿提出的宝贵建议和指导,感谢中国社会科学出版社的支持和帮助。
有关文本情感分析的知识、理论和技能还有很多,并且随着计算机应用技术的扩展以及新兴产品的普及,情感分析所涉及的领域会变得更为宽广。本书对于目前关键性的技术内容进行研究、总结和撰写,书中难免有不妥与欠缺之处,敬请读者批评指正或提出修改建议。
朱俭
2014年4月于北京