Clasificación de polaridad en textos con opiniones en español mediante análisis sintáctico de dependencias

  1. Vilares Calvo, David
  2. Alonso, Miguel Á.
  3. Gómez Rodríguez, Carlos
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2013

Número: 50

Páginas: 13-20

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

En este artículo se describe un sistema de minería de opiniones queclasifica la polaridad de textos en español. Se propone una aproximación o basada en pln que conlleva realizar una segmentación, o tokenización o y etiquetación o de los textos para a continuación o obtener la estructura sintáctica a de las oraciones mediantealgoritmos de análisis de dependencias. La estructura sintáctica a se emplea entoncespara tratar tres de las construcciones lingüísticas ´ más a significativas en el ámbito que nos ocupa: la intensificación, o las oraciones subordinadas adversativas y la negación. Los resultados experimentales muestran una mejora del rendimiento con respectoa los sistemas puramente léxicos y refuerzan la idea de que el análisis a sintáctico a esnecesario para lograr un análisis a del sentimiento robusto y fiable.

Referencias bibliográficas

  • Brooke, J., M. Tofiloski, y M. Taboada. 2009. Cross-Linguistic Sentiment Analysis: From English to Spanish. En Proceedings of the International Conference RANLP-2009, páginas 50–54, Borovets, Bulgaria. ACL.
  • Cruz, F., J. A. Troyano, y J. Ortega. 2008. Clasificación de documentos basada en la opinión: experimentos con un corpus de críticas de cine en espa˜nol. En Procesamiento de lenguaje natural, 41, páginas 81–87.
  • Fernández Anta, A., P. Morere, L. Nú˜nez Chiroque, y A. Santos. 2012. Techniques for Sentiment Analysis and Topic Detection of Spanish Tweets: Preliminary Report. En TASS 2012 Working Notes, Castellón, Spain.
  • Gómez-Rodríguez, C. y J. Nivre. 2010. A transition-based parser for 2-planar dependency structures. En Proceedings of the 48th Annual Meeting of the Association for Computational Linguistics, ACL’10, páginas 1492–1501, Stroudsburg, PA, USA. ACL.
  • Jia, L., C. Yu, y W. Meng. 2009. The effect of negation on sentiment analysis and retrieval effectiveness. En Proceedings of the 18th ACM conference on Information and knowledge management, CIKM’09, páginas 1827–1830, New York, NY, USA. ACM.
  • Kennedy, A. y D. Inkpen. 2006. Sentiment classification of movie reviews using contextual valence shifters. Computational Intelligence, 22(2):110–125.
  • Martínez Cámara, E., M. T. Martín Valdivia, M. A. García Cumbreras, y L. A. Ure˜na López. 2012. SINAI at TASS 2012. En TASS 2012 Working Notes, Castellón, Spain.
  • Nivre, J. 2008. Algorithms for deterministic incremental dependency parsing. Compuational Linguistics, 34(4):513–553.
  • Nivre, J., J. Hall, J. Nilsson, A. Chanev, G. Eryigit, S. K¨ubler, S. Marinov, y E. Marsi. 2007. Maltparser: A languageindependent system for data-driven dependency parsing. Natural Language Engineering, 13(2):95–135.
  • Pang, B. y L. Lee. 2008. Opinion Mining and Sentiment Analysis. now Publishers Inc., Hanover, MA, USA. Pang, B., L. Lee, y S. Vaithyanathan. 2002. Thumbs up? sentiment classification using machine learning techniques. En Proceedings of EMNLP, p´aginas 79–86.
  • Reyes, A. y P. Rosso. 2011. Mining subjective knowledge from customer reviews: a specific case of irony detection. En Proceedings of the 2nd Workshop on Computational Approaches to Subjectivity and Sentiment Analysis, WASSA ’11, páginas 118–124, Stroudsburg, PA, USA. ACL.
  • Saralegi Urizar, X. y I. San Vicente Roncal. 2012. Detecting Sentiments in Spanish Tweets. En TASS 2012 Working Notes, Castellón, Spain.
  • Taboada, M., J. Brooke, M. Tofiloski, K. Voll, y M. Stede. 2011. Lexicon-based methods for sentiment analysis. Computational Linguistics, 37(2):267–307.
  • Taulé, M., M. A. Mart´ı, y M. Recasens. 2008. AnCora: Multilevel Annotated Corpora for Catalan and Spanish. En Nicoletta Calzolari Khalid Choukri Bente Maegaard Joseph Mariani Jan Odjik Stelios Piperidis, y Daniel Tapias, editores, Proceedings of the Sixth International Conference on Language Resources and Evaluation (LREC’08), Marrakech, Morocco.
  • Turney, P. D. 2002. Thumbs up or thumbs down?: semantic orientation applied to unsupervised classification of reviews. En Proceedings of the 40th Annual Meeting on Association for Computational Linguistics, ACL’02, páginas 417–424, Stroudsburg, PA, USA. ACL.
  • Villena-Román, J., S. Lana-Serrano, J.C. González Cristóbal, y E. Martínez-Cámara. 2013. TASS Worshop on Sentiment Analysis at SEPLN. Procesamiento de Lenguaje Natural, 50.
  • Yang, K.. 2008. WIDIT in TREC 2008 blog track: Leveraging multiple sources of opinion evidence. En E. M. Voorhees y Lori P. Buckland, editores, NIST Special Publication 500-277: The Seventeenth Text REtrieval Conference Proceedings (TREC 2008).