Извлечение и использование оценочных слов в задаче классификации отзывов на три класса

Авторы

  • Н.В. Лукашевич

Ключевые слова:

извлечение знаний из текстов
извлечение оценочных слов
классификация отзывов
машинное обучение

Аннотация

Предлагается подход к автоматическому извлечению оценочных слов для заданной предметной области на основе порождения признаков из нескольких текстовых коллекций. Полученные оценочные слова применяются в задаче классификации отзывов на три класса, в которой необходимо разделить отзывы на классы: «понравилось», «понравилось, но есть замечания», «не понравилось». В задаче классификации исследуются разные виды весов для слов, учитываются знаки препинания и слова-операторы, которые могут менять тональность следующих за ними слов. Работа частично поддержана грантом РФФИ № 11-07-00588-а.


Загрузки

Опубликован

2011-11-10

Выпуск

Раздел

Раздел 2. Программирование

Автор

Н.В. Лукашевич


Библиографические ссылки

  1. Pang B., Lee L. Thumbs up? Sentiment classification using machine learning techniques // Proc. of the Conference on Empirical Methods in Natural Language Processing (EMNLP). Philadelphia: ACL, 2002. 79-86.
  2. Whitelaw C., Garg N., Argamon S. Using appraisal taxonomies for sentiment analysis // Proc. of CIKM-05, 14th ACM Int. Conf. on Information and Knowledge Management. Bremen: ACM, 2005. 625-631.
  3. Pang B., Lee L. Opinion mining and sentiment analysis. Foundations and trends in information retrieval. Hanover, Massachusetts: Now Publishers, 2008.
  4. Pang B., Lee L. Seeing stars: exploiting class relationships for sentiment categorization with respect of rating scales // Proc. of ACL, 43rd Meeting of the Association for Computational Linguistics. Ann Arbor: ACM, 2005. 115-124.
  5. Tsur O., Davidov D., Rappoport A. ICWSM - a great catchy name: semi-supervised recognition of sarcastic sentences in online product reviews // Int. AAAI Conference on Weblogs and Social Media. Washington, DC: AAAI, 2010.
  6. Hu M., Liu B. Mining and summarizing customer reviews // Proc. of the ACM SIGKDD Conference on Knowledge Discovery and Data Mining. Seattle: ACM, 2004. 168-177.
  7. Esuli A., Sebastiani F. Determining the semantic orientation of terms through gloss classification // Proc. of the 14th ACM Int. Conf. on Information and Knowledge Management (CIKM-05). Bremen: ACM, 2005. 617-624.
  8. Turney P.D. Thumbs up or thumbs down? Semantic orientation applied to unsupervised classification of reviews // Proc. of the 40th Annual Meeting of the Association for Computational Linguistics (ACL). Philadelphia: ACM, 2002. 417-424.
  9. Hatzivassiloglou V., McKeown K. Predicting the semantic orientation of adjectives // Proc. of the 35th Annual Meeting of ACL. Madrid: ACM, 1997. 174-181.
  10. Manning C., Raghavan P., Schütze H. Introduction to information retrieval. Cambridge: Cambridge Univ. Press, 2008.
  11. Агеев М.С., Добров Б.В., Лукашевич Н.В., Сидоров А.В. Экспериментальные алгоритмы поиска/классификации и cравнение с «basic line» // Российский семинар по оценке методов информационного поиска. Санкт-Петербург: НИИ Химии СПбГУ, 2004. 62-89.
  12. Fan R.-E. , Chang K.-W., Hsieh C.-J., Wang X.-R., Lin C.-J. LIBLINEAR: a Library for Large Linear Classification // J. of Machine Learning Research. 2008. 9. 1871-1874. wreflabelbb13
  13. Четверкин И.И., Лукашевич Н.В. Автоматическая классификация отзывов на основе оценочных слов // 12-я Национальная конференция по искусственному интеллекту с международным участием (КИИ-2010). Москва: Физматлит, 2010. 1. 299-307.
  14. Маннинг К., Рагхаван П., Шютце Х. Введение в информационный поиск. М.: Вильямс, 2011.
  15. Kilgarriff A., Rosenzweig J. Framework and results for English Senseval // Computers and Humanities, Special Issue on SENSEVAL. 2000. 34, N 1, 2. 15-48.