【猎云网(微信号:ilieyun)杭州】2月20日报道(文/盛丽艳)
虽然成立不足半年,语忆科技已推出了他们的产品——市面上首款中文文本情感解析引擎Kismet。
刚过去的这个情人节,语忆科技在其公众号上发布了一个名为“微博情绪分析小助手”的功能插件。将任意博主的微博号粘贴在小助手中,插件便会根据其最近发布的10条微博进行情绪分析,包括情绪走势、情感分数、以及具体每条微博的情绪分布(惊喜、兴奋、胆怯等情绪的分布情况)。
实际上,这个简单有趣的C端小功能只是语忆科技为应对情人节而发布的,Kismet解析引擎真正的目标客户是B端企业。Kismet能够为各领域的企业提供快速的中文情感分析和情绪解析云服务,从而进一步完善和提高产品与服务体验。
就具体运用而言,Kismet能够用爬虫在全网抓取用户对B端客户的评价,生成情绪时间轴,根据时间顺序分析用户的情感走向。在企业进行危机公关或突发性事件处理时,情绪时间轴能够帮助他们即时掌握用户的心理变化,以做出正确应对。
此外,它还能通过情感关键词挖掘技术,分析出最能引起受众心理波动的核心词,帮企业将视线聚焦到引起用户强烈情绪的产品细节。DT财经曾做过一次手机评测,在评测过程中使用了Kismet系统,从而分析出了各个手机品牌的情绪关键词,如“苹果”的情绪关键词为“黑屏”。
在关键词挖掘技术之前,市场上被广泛使用的是词频分析技术,依据词语出现的频率来分析其重要性,然而词频分析法无法过滤掉“我”、“你”等高频无用词。“情感关键词挖掘能够避免这种情况”,创始人袁晋对猎云君说道。
决定要开发Kismet这样一个平台,与创始人程凯的自身经历不无关系,他曾就读于哥伦比亚大学,当时基于英文的情绪分析技术已经开始起步,IBM Watson核心技术来源之一AlchemyAPI,已能提供可识别五种情绪的情感分析API。可是基于中文的情绪分析系统却还处于起步阶段,程凯遂决定选择这一方向作为研究课题。
中英文的分词方式和语法结构差异或许是程序开发过程中最大的拦路虎,程凯这样总结道。英文本就以词为基础构成句子,而中文则必须先经过分词,分词不准将极大影响词语判断。而中文相对不严谨的语法结构也为自动化情感分析带来了一些挑战。
Kismet的算法仍在不断地迭代更新中。除了提供情绪正负面判断之外,算法可对18种细分情绪(6种正面情绪、6种负面情绪和6种中立情绪)进行判断。同时,系统也可通过深度学习,挖掘企业需求并不断加入新的细分情绪类型。据袁晋介绍,情绪分析的准确度一般在85%左右,在情感浓度较低的场景(如新闻)会稍低一些,约为70%。
目前,项目正在寻求天使轮融资。
项目:Kismet
公司:杭州语忆科技有限公司
网址:www.kismet-emotions.com