❶ 中文情感分析 的难点在哪
情感分析(Sentiment Analysis)
第一步,就是确定一个词是积极还是消极,是主观还是客观。这一步主要依靠词典。
英文已经有伟大词典资源:SentiWordNet. 无论积极消极、主观客观,还有词语的情感强度值都一并拿下。
但在中文领域,判断积极和消极已经有不少词典资源,如Hownet,NTUSD但用过这些词典就知道,效果实在是不咋滴(最近还发现了大连理工发布的情感词汇本体库,不过没用过,不好评价)。中文这方面的开源真心不够英文的做得细致有效。而中文识别主客观,那真的是不能直视。
中文领域难度在于:词典资源质量不高,不细致。另外缺乏主客观词典。
第二步,就是识别一个句子是积极还是消极,是主观还是客观。
有词典的时候,好办。直接去匹配看一个句子有什么词典里面的词,然后加总就可以计算出句子的情感分值。
但由于不同领域有不同的情感词,比如看上面的例子,“蓝屏”这个词一般不会出现在情感词典之中,但这个词明显表达了不满的情绪。因此需要另外根据具体领域构建针对性的情感词典。
如果不那么麻烦,就可以用有监督的机器学习方法。把一堆评论扔到一个算法里面训练,训练得到分类器之后就可以把评论分成积极消极、主观客观了。
分成积极和消极也好办,还是上面那个例子。5颗星的评论一般来说是积极的,1到2颗星的评论一般是消极的,这样就可以不用人工标注,直接进行训练。但主客观就不行了,一般主客观还是需要人来判断。加上中文主客观词典不给力,这就让机器学习判断主客观更为困难。
中文领域的难度:还是词典太差。还有就是用机器学习方法判断主客观非常麻烦,一般需要人工标注。
另外中文也有找到过资源,比如这个用Python编写的类库:SnowNLP. 就可以计算一句话的积极和消极情感值。但我没用过,具体效果不清楚。
到了第三步,情感挖掘就升级到意见挖掘(Opinion Mining)了。
这一步需要从评论中找出产品的属性。拿手机来说,屏幕、电池、售后等都是它的属性。到这一步就要看评论是如何评价这些属性的。比如说“屏幕不错”,这就是积极的。“电池一天都不够就用完了,坑爹啊”,这就是消极的,而且强度很大。
这就需要在情感分析的基础上,先挖掘出产品的属性,再分析对应属性的情感。
分析完每一条评论的所有属性的情感后,就可以汇总起来,形成消费者对一款产品各个部分的评价。
接下来还可以对比不同产品的评价,并且可视化出来。如图。
这一步的主要在于准确挖掘产品属性(一般用关联规则),并准确分析对应的情感倾向和情感强度。因此这需要情感分析作为基础。首先要找到评论里面的主观句子,再找主观句子里的产品属性,再计算属性对应的情感分。所以前面基础不牢固,后面要准确分析就有难度。
中文这个领域的研究其实很完善了,技术也很成熟。但需要完善前期情感分析的准确度。
总的来说,就是中文词典资源不好,工作做得不是很细很准。前期的一些基础不牢固,后面要得到准确的分析效果就不容易了。
❷ 怎么分析感情呢。
这位朋友,你好!
你今年多大了?你跟你男朋友谈恋爱多长时间了?你男朋友是做什么工作的?
你男朋友自己不去网贷,是因为他的信誉不好。那就说明他以前就参与过网贷,并且不能按时还贷。如果你男朋友有一份比较稳定的工作,有一份比较稳定的收入,他应该是不需要网贷的。
不知道你是否年龄比较小,你把他让你网贷的事告诉了你父母,你父母认为他不可靠。你把这个信息竟然反馈到他那里,从这一点来说,你似乎不太成熟。你是否自己有工作,有收入?不知道你为什么要让他给你买东西?如果这位男士经常网贷,你需要慎重考虑你们之间的感情。如果他不好好工作,靠网贷过日子,你跟他在一起以后怎么办呢?他已经两次要求你帮助他网贷,你现在拒绝了。如果他以后再要求你网贷,你已经花了他不少钱,你以后还能够拒绝吗?如果你答应了,你可能给自己背上巨额债务。希望你慎重考虑。
如果你有什么困惑,还可以交流。祝你幸福快乐!
❸ 电影情感分析怎么分析
人生中不乏这样的人,虽然是短暂相遇,但是对彼此都是有很大的影响,两个音乐家的惺惺相惜,或许不会经常的疯狂的想念,但是总是会偶尔想起的彼此信任珍惜的情感!
❹ 情感分析
你好,我是学心理学的,我帮你分析一下。首先,我觉得你可能在前男友那还有什么遗憾没有了结。具体是什么不太清楚,所以你一直不能释怀,不能让自己彻底的走出来。其次,我觉得你可能还在等待突然有一天,你前男友回来联系你,发现你还是单身,会在次追求你!最后,我觉得你可能在跟追求你的人接触的时候,会时不时的把你前男友的优点拿来跟这个追求者进行比较,结果总觉得他不够好,还不如前男友,所以才会排斥!所以结论是,我觉得你对他感情是淡了,但感觉可能没淡。等到你知道他彻底找到新女友的时候,你会慢慢的淡忘了
❺ 情感分析器的研究方法
监督学习
目前,基于监督学习的情感分析仍然是主流,除了(Li et al.,2009)基于非负矩阵三分解(Non-negative Matrix Tri-factorization),(Abbasi et al.,2008)基于遗传算法(Genetic Algorithm)的情感分析之外,使用的最多的监督学习算法是朴素贝叶斯,k最近邻(k-Nearest Neighbor,k-NN),最大熵和支持向量机的。而对于算法的改进主要在对文本的预处理阶段。
基于规则/无监督学习
和基于监督学习的情感分析相比,基于规则和无监督学习方面的研究不是很多。除了(Turney,2002)之外,(朱嫣岚 et al.,2002)利用HowNet对中文词语语义的进行了情感倾向计算。(娄德成 et al.,2006)利用句法结构和依存关系对中文句子语义进行了情感分析,(Hiroshi et al.,2004)通过改造一个基于规则的机器翻译器实现日文短语级情感分析,(Zagibalov et al.,2008)在(Turney,2002)的SO-PMI算法的基础上通过对于中文文本特征的深入分析以及引入迭代机制从而在很大程度上提高了无监督学习情感分析的准确率。
跨领域情感分析
跨领域情感分析在情感分析中是一个新兴的领域,目前在这方面的研究不是很多,主要原因是目前的研究还没有很好的解决如何寻找两个领域之间的一种映射关系,或者说如何寻找两个领域之间特征权值之间的平衡关系。对于跨领域情感分析的研究开始于(Blitzer et al.,2007)将结构对应学习(Structural Correspondence Learning,SCL)引入跨领域情感分析,SCL是一种应用范围很广的跨领域文本分析算法,SCL的目的是将训练集上的特征尽量对应到测试集中。(Tan et al.,2009)将SCL引入了中文跨领域情感分析中。(Tan2 et al.,2009)提出将朴素贝叶斯和EM算法的一种半监督学习方法应用到了跨领域的情感分析中。(Wu et al.,2009)将基于EM的思想将图排序(Graph Ranking)算法应用到跨领域的情感分析中,图排序算法可以认为是一种迭代的k-NN
❻ 中文情感分析提取情感倾向的评价对象有哪些方法
一、《诗经》中《小雅、采薇》的末章:昔我往矣,杨柳依依,今我来思,雨雪霏霏。下雪之初,先下雪珠,有时降雪也伴随着降雨,所以有“雨雪霏霏”之句。二、晋联句诗 谢太傅寒雪日集儿女讲论文义事,雪下大了,公曰:“大雪纷纷何所似”,兄子曰:“撒盐空中差可拟”,兄女曰:“未若柳絮因风起”,便可以看作是韵同义贯的咏雪联句诗。用“撒盐空中”和“柳絮因风起”来比拟“大雪纷飞”,各有千秋。有人认为“撒盐空中”一喻好,雪的颜色和下落之态跟盐比较接近,而柳絮呈灰白色,在风中往往上扬,甚至飞得更高更远,跟雪的飘舞方式不同。写物必须首先求得形似而后达于神似,形似是基础。有人认为“柳絮因风起”一喻好,它给人以春天即将到来的感觉,有深刻的意蕴。而“撒盐”一喻所缺乏的恰恰是意蕴。好的诗句要有意象,意象是物象和意蕴的统一,“柳絮”一喻就好在有意象。三、南朝梁吴均有一首《咏雪》五言诗,近于律体,是历来传诵的名篇:“微风摇庭树,细雪下帘隙。萦空如雾转,凝阶似花积。不见杨柳春,徒见桂枝白。泪无人道,相思空何益。”全诗前六句写景,后两句抒情,极有韵致,不论是写雪的动态美“如雾转”,还是写雪的静态美“似花积”,都能状难写之景如在目前。四、 (一) 唐?李白《北风行》:燕山雪花大如席,片片吹落轩辕台。[赏析] 燕山一带的雪花大得像席子一样,一片一片吹落在轩辕台上 这是李白描写雪花的名句。燕山在今河北蓟县东南,这里泛指我国北方。轩辕台遗址在今河北怀来县乔山上。句中说“雪大如席”,这是高度的艺术夸张,但又不失其真实。正如鲁迅在《漫谈“漫画”》一文中所说:“‘燕山雪花大如席’是夸张,但燕山究竟有雪花,就含着一点诚实在里面,使我们立刻知道燕山原来有这么冷。如果说广州雪花大如席,那就变成笑话了。”不知道你是哪个咏雪,就都找给你了。
❼ 聊天中的情感分析有多难
判断文字聊天中的感情,可以看作是情感分析。之前已有的一些情感分析的研究,主要有两种方法。一种是基于词典的方法,基于词典的方法主要在于词典的质量的好坏,此外,还有一些本身就带有歧义的词,不能够简单判定是正面的或者负面的。另一种是基于机器学习的方法。基于机器学习的方法主要是有监督学习,即要找一些类似的聊天语料来对机器进行训练,使得机器能够正确地判断文字中的感情。在训练集上达到足够高的准确率,才有可能在实际测试的时候,准确地预测情感。此外,目前机器能够区分的感情并不多,之前研究的区分的情感,大多是正负两极,或者五级(负面、轻微负面、中性、轻微正面、正面)情感。人类情感的复杂程度远超出这五种,因此如何识别人类的复杂情感也是机器需要研究的课题。但是随着算法的不断改进,在不久的将来,相信机器的准确率能够达到比人更高。
❽ 情感分析、、
以我的分析来看这个男人有点表现为传说已久的“失心疯”……完全是前言不搭后语不知所谓,估计要么是在混乱状态下写出的要么就是真实的意思只有他自己才懂得了,说实话我是有点看不懂!
且看依据——
1、“你真的是个好女孩、不是我不答应你的请求,是因为我有自己喜欢的女孩,不是我不在意你,是以为我真的放不下她”——这话后半段似乎应该是“不是我不在意你,是因为我真的放不下她”才对吧?
2、“不是我不理你 是以为现在不允许”——现在不允许?那么什么时候才允许呢?你打算让人家一个女孩子等到什么时候呢?应该这么不负责任的让一个女孩子牺牲青春年华就为了等待你不再喜欢你现在喜欢着且放不下的那个女孩之后才来理她吗?~~有点拗口,但是意思大家能看明白。
3、“能在一起是我们责任,不能在一起是我不懂的珍惜你”——什么叫“能在一起是我们责任”?我尽可能往好里想也只能认为这其中可能还有更多的故事或是背景资料没有完整的告知我们,所以我是真看不懂这句话的意思了!至于“不能在一起是我不懂的珍惜你”这句话里的别字我能容忍,但是意思就更让我晕眩了——你到底应该珍惜谁或是你究竟懂得珍惜谁?我觉得你要是如你所说已经有了自己喜欢的女孩的话那么你该珍惜的是那个女孩才对啊!
鉴于以上让我如坠云里的话语,我感觉这段话更像是一个男人想脚踩两只船却又感觉于心不忍或者是感觉自己驾驭感情的能力有限而力不从心但又颇有不甘心之遗憾综合导致发出自己很累的呐喊,我能从中看到的只有矛盾到极点的复杂情绪,还有一点可以肯定的是写下这段话的男人还是有一定良知的,否则他不会这么纠结!但是请把这点良知再发扬光大一些吧——别让这个可能昵称为“宝”的女子再对你抱有幻想以致浪费大好年华只为等待你不知道概率为多少的将来……你说呢?
❾ 情感分析技术有哪些应用
情感分析(又称为观点挖掘或感情AI)是指使用自然语言处理、文本分析、计算语言学和生物特征识别来系统地识别、提取、量化和研究情感状态和主观信息。情感分析广泛应用于分析客户的心声,如评论和调查回复,在线和社交媒体,以及从市场营销到客户服务再到临床医学的保健材料。
情感分析的一个基本任务是在文档、句子或特征/方面级别对给定文本的极性进行分类,判断在文档、句子或实体特征/方面中表达的意见是积极的、消极的还是中性的。高级的“超越极性”情感分类着眼于诸如“愤怒”、“悲伤”和“快乐”等情绪状态。
进行情感分析的先驱包括“一般询问者”(General Inquirer),它提供了量化文本模式的线索,另外,还提供了基于对人的言语行为进行分析来检查一个人的心理状态的心理学研究。
❿ 目前深度学习在文本情感分析上都有哪些方法
有两大类,一类是主观性:主观、客观、中性;一类是情感倾向:褒义、贬义、中性。 文本分析的话,主要是对词、句子中观点的挖掘。 你所说的机器学习法,现在基本用于对电影观点的打分系统吧。基本上就是利用分类计数