Semi­supervised vs. Cross­domain Graph­based Learning for Sentiment
Classification
Natalia Ponomareva
Statistical Cybermet...
What is sentiment classification?
Task within the research field of Sentiment Analysis.
It concerns classification of docu...
Outline
1
Background
Introduction Main approaches Motivation
2
Graph­based algorithms Label propagation Modifications to...
Outline
3
Data and their characteristics
Preprocessing Baseline results Data characteristics
4 Semi­supervised vs. cross­...
Outline
1
Background
Introduction Main approaches Motivation
Natalia Ponomareva (SCRG, UoW) Semi­supervised vs. Cross­dom...
Why do we need sentiment classification
“What other people think” has always been important for people in their decision­m...
Commercial applications
Understanding customer feedback. What is customer opinions about some specific company
products? B...
Approaches to Sentiment Classification
Lexical approaches;
Supervised;
Semi­supervised and unsupervised;
Cross­domain.
Nat...
Lexical approaches
Use of dictionaries of sentiment words with a given semantic orientation. Dictionaries are built
either...
Supervised machine learning approaches
Learn sentiment phenomena from an annotated corpus.
Different Machine Learning meth...
of 10

Ponomareva

Published on: Mar 4, 2016
Published in: Technology      Education      
Source: www.slideshare.net


Transcripts - Ponomareva

  • 1. Semi­supervised vs. Cross­domain Graph­based Learning for Sentiment Classification Natalia Ponomareva Statistical Cybermetrics Research Group, University of Wolverhampton, UK December 21, 2013 Natalia Ponomareva (SCRG, UoW) Semi­supervised vs. Cross­domain Graphs December 21, 2013 1 / 98
  • 2. What is sentiment classification? Task within the research field of Sentiment Analysis. It concerns classification of documents on the basis of overall sentiments expressed by their authors. Different scales can be used: positive/negative; positive, negative and neutral; rating: 1*, 2*, 3*, 4*, 5*; Example “The film was fun and I enjoyed it.” ⇒ positive “The film lasted too long and I got bored.” ⇒ negative Natalia Ponomareva (SCRG, UoW) Semi­supervised vs. Cross­domain Graphs December 21, 2013 2 / 98
  • 3. Outline 1 Background Introduction Main approaches Motivation 2 Graph­based algorithms Label propagation Modifications to LP Graph construction Natalia Ponomareva (SCRG, UoW) Semi­supervised vs. Cross­domain Graphs December 21, 2013 3 / 98
  • 4. Outline 3 Data and their characteristics Preprocessing Baseline results Data characteristics 4 Semi­supervised vs. cross­domain graph­based learning Semi­supervised experiments Cross­domain experiments Discussion Natalia Ponomareva (SCRG, UoW) Semi­supervised vs. Cross­domain Graphs December 21, 2013 4 / 98
  • 5. Outline 1 Background Introduction Main approaches Motivation Natalia Ponomareva (SCRG, UoW) Semi­supervised vs. Cross­domain Graphs December 21, 2013 5 / 98
  • 6. Why do we need sentiment classification “What other people think” has always been important for people in their decision­making process. Which cell phone to buy? Is it worth watching this movie? Before the development of the Internet technologies, people used to ask friends. Now the Internet contains a huge amount of opinions in forums, blogs, social networks, review sites, etc. However, it is not easy to find and analyse opinions. Natalia Ponomareva (SCRG, UoW) Semi­supervised vs. Cross­domain Graphs December 21, 2013 6 / 98
  • 7. Commercial applications Understanding customer feedback. What is customer opinions about some specific company products? Brand analysis, reputation management. What is customer opinions about the company? Market survey. What do customers think about the products of the competitors? Trend prediction. Will be people satisfied with the products in the future? Natalia Ponomareva (SCRG, UoW) Semi­supervised vs. Cross­domain Graphs December 21, 2013 7 / 98
  • 8. Approaches to Sentiment Classification Lexical approaches; Supervised; Semi­supervised and unsupervised; Cross­domain. Natalia Ponomareva (SCRG, UoW) Semi­supervised vs. Cross­domain Graphs December 21, 2013 8 / 98
  • 9. Lexical approaches Use of dictionaries of sentiment words with a given semantic orientation. Dictionaries are built either manually or (semi­)automatically. A special scoring function is applied in order to calculate the final semantic orientation of a text. Example lightweight +3, good +4, ridiculous ­2 Lightweight, stores a ridiculous amount of books and good battery life. SO SO 1 2 = = max{|3|,|4|,|−2|} 3+4­2 3 = 12 3 ∙ sign(max{|3|,|4|,|−2|})=4 Natalia Ponomareva (SCRG, UoW) Semi­supervised vs. Cross­domain Graphs December 21, 2013 9 / 98
  • 10. Supervised machine learning approaches Learn sentiment phenomena from an annotated corpus. Different Machine Learning methods were tested (NB, SVM, ME). Usually demonstrated relatively high performance even with surface features, e.g. 82.9% on movies reviews [Pang et al., 2002]. For review data ML approach performs better than lexical one when training and test data belong to the same domain. For example, SO­CAL achieves only 76.4% on the same dataset [Taboada et al., 2011]. But it needs substantial amount of annotated data. Natalia Ponomareva (SCRG, UoW) Semi­supervised vs. Cross­domain Graphs December 21, 2013 10 / 98