根据这个值来判断该文本的情感类别。Pr(term?Ùterm)1?2?2PMI(term,term)=log(?1?2?)1?2Pr(term)Pr(term)?(1-1)SO(phrase)=PMI(phrase,"excellent")-PMI(phrase,"poor")?(1-2)Taboada在2011年发表的文章[29]中则采用的是第二种基于词库的方法。这个方法最初用于句子级和属性级的情感分类研究中,他的基本思想是用一个情感词和词组的词典,这些词和词组都带有相关的倾向和强度的信息,与此同时,采用集约化的方法来计算每个文本的情感分值,最终确定文本的情感类别。Hu在2004年的文献[30]中提出了基于词库的算法解决情感倾向的问题,该算法采用的是Bootstrapping策略,它的情感倾向最终取决于句子中所有情感词的情感倾向分数之和;2000年的文献[31]中使用了无监督方法处理句子级的主客观分类问题,文献提出使用一些种子,并且通过计算梯度的方法来获得主客观分类的结果,这其中没有任何的学习过程。尽管无监督学习方法可以节省大量的时间和人力,但是研究结果发现,它的准确率却不如有监督学习方法那样令人欣喜。为了在有监督学习方法中的准确率和无监督学习方法中节省资源的优势中取得一个较好的平衡,半监督学习方法应运而生。半监督(Semi-supervised)学习方法训练学习期是有大量的无标记样本和少量的有标记样本来共同实现的,因为这种学习方法能够在节省时间和精力的同时还能够得到具备泛化能力很强的学习系统,这些优点的存在使得半监督学习方法在处理情感分析问题上得到了颇多关注[41]。DmitryDavidov[32]提出了健壮的SASI(semi-supervisedsarcasmidentification)算法来处理主客观信息的分类和提取观点句。SASI算法是第一个比较健壮的-5-