Show simple item record

dc.contributor.authorTomanek, Krzysztof
dc.date.accessioned2020-12-22T12:28:56Z
dc.date.available2020-12-22T12:28:56Z
dc.date.issued2014
dc.identifier.citationTomanek Krzysztof (2014) „Analiza sentymentu” – metoda analizy danych jakościowych. Przykład zastosowania oraz ewaluacja słownika RID i metody klasyfikacji Bayesa w analizie danych jakościowych. „Przegląd Socjologii Jakościowej”, t. 10, nr 2, s. 118–136 [dostęp dzień, miesiąc, rok]. Dostępny w Internecie: ‹www.przegladsocjologiijakosciowej.org›.pl_PL
dc.identifier.issn1733-8069
dc.identifier.urihttp://hdl.handle.net/11089/32967
dc.description.abstractCelem artykułu jest prezentacja podstawowych metod klasyfikacji jakościowych danych tekstowych. Metody te korzystają z osiągnięć wypracowanych w takich obszarach, jak przetwarzanie języka naturalnego i analiza danych nieustrukturalizowanych. Przedstawiam i porównuję dwie techniki analityczne stosowane wobec danych tekstowych. Pierwsza to analiza z zastosowaniem słownika tematycznego. Druga technika oparta jest na idei klasyfikacji Bayesa i opiera się na rozwiązaniu zwanym naiwnym klasyfikatorem Bayesa. Porównuję efektywność dwóch wspomnianych technik analitycznych w ramach analizy sentymentu. Akcentuję rozwiązania mające na celu zbudowanie trafnego, w kontekście klasyfikacji tekstów, słownika. Porównuję skuteczność tak zwanych analiz nadzorowanych do skuteczności analiz zautomatyzowanych. Wyniki, które prezentuję, wzmacniają wniosek, którego treść brzmi: słownik, który w przeszłości uzyskał dobrą ocenę jako narzędzie klasyfikacyjne, gdy stosowany jest wobec nowego materiału empirycznego, powinien przejść fazę ewaluacji. Jest to, w proponowanym przeze mnie podejściu, podstawowy proces adaptacji słownika analitycznego, traktowanego jako narzędzie klasyfikacji tekstów.pl_PL
dc.description.abstractThe purpose of this article is to present the basic methods for classifying text data. These methods make use of achievements earned in areas such as: natural language processing, the analysis of unstructured data. I introduce and compare two analytical techniques applied to text data. The first analysis makes use of thematic vocabulary tool (sentiment analysis). The second technique uses the idea of Bayesian classification and applies, so-called, naive Bayes algorithm. My comparison goes towards grading the efficiency of use of these two analytical techniques. I emphasize solutions that are to be used to build dictionary accurate for the task of text classification. Then, I compare supervised classification to automated unsupervised analysis’ effectiveness. These results reinforce the conclusion that a dictionary which has received good evaluation as a tool for classification should be subjected to review and modification procedures if is to be applied to new empirical material. Adaptation procedures used for analytical dictionary become, in my proposed approach, the basic step in the methodology of textual data analysis.pl_PL
dc.language.isoplpl_PL
dc.publisherUniwersytet Łódzkipl_PL
dc.relation.ispartofseriesPrzegląd Socjologii Jakościowej;2
dc.subjectanaliza danych jakościowychpl_PL
dc.subjectanaliza sentymentupl_PL
dc.subjectanaliza treścipl_PL
dc.subjecttext miningpl_PL
dc.subjectkodowanie tekstówpl_PL
dc.subjectprzetwarzanie języka naturalnegopl_PL
dc.subjectsłownik RIDpl_PL
dc.subjectnaiwny klasyfikator Bayesapl_PL
dc.subjectCAQDASpl_PL
dc.subjectqualitative data analysispl_PL
dc.subjectsentiment analysispl_PL
dc.subjectcontent analysispl_PL
dc.subjectcoding techniquespl_PL
dc.subjectnatural language processingpl_PL
dc.subjectRID dictionarypl_PL
dc.subjectnaive Bayespl_PL
dc.titleAnaliza sentymentu – metoda analizy danych jakościowych. Przykład zastosowania oraz ewaluacja słownika RID i metody klasyfikacji Bayesa w analizie danych jakościowychpl_PL
dc.title.alternativeSentiment Analysis. An Example of Application and Evaluation of RID Dictionary and Bayesian Classification Methods in Qualitative Data Analysis Approachpl_PL
dc.typeArticlepl_PL
dc.page.number118–136pl_PL
dc.contributor.authorAffiliationUniwersytet Jagiellońskipl_PL
dc.contributor.authorBiographicalnoteKrzysztof Tomanek, doktorant w Instytucie Socjologii Uniwersytetu Jagiellońskiego. Jego zainteresowania badawcze dotyczą zagadnień lojalności, teorii zaufania, zagadnienia Quality of Life w badaniach społecznych. Najważniejsze zainteresowania metodologiczne obejmują zastosowanie technik text mining do analiz danych jakościowych, analizy danych jakościowych wspierane rozwiązaniami NLP, SVR. Prowadzi grant badawczy MNiSW dotyczący Festiwalu Kultury Żydowskiej w Krakowie (wspólnie z dr Anną Marią Orla-Bukowską). Jest autorem projektów ogólnopolskich badań konsumenckich oraz publikacji dotyczących wykorzystania zaawansowanych technik analizy treści w różnorodnych środowiskach CAQDAS. Adres kontaktowy: Instytut Socjologii Uniwersytet Jagielloński ul. Grodzka 52, 30-962 Krakówpl_PL
dc.referencesAcerbi Alberto i in. (2013) The Expression of Emotions in 20th Century Books. „PLoS ONE”, vol. 8, no. 3, s. 1–6 [dostęp 1 maja 2014 r.]. Dostępny w Internecie: ‹http://www.plosone.org/article/fetchObject.action?uri=info%3Adoi%2F10.1371%2Fjournal. pone.0059030&representation=PDF›.pl_PL
dc.referencesCardie Claire i in. (2003) Combining low-level and summary representations of opinions for multi-perspective question answering [w:] Proceedings of the AAAI Spring Symposium on New Directions in Question Answering, s. 20–27 [dostęp 1 maja 2014 r.]. Dostępny w Internecie: ‹http://www.aaai.org/Papers/Symposia/ Spring/2003/SS-03-07/SS03-07-004.pdf›.pl_PL
dc.referencesDas Sanjiv R., Chen Mike J. (2001) Yahoo! for Amazon: Sentiment Extraction fromSmall Talk on the Web,„Management Science”, Vol. 53, No. 9, s. 1375–1388 [dostęp 1 maja 2014 r.]. Dostępny w Internecie: ‹http://algo.scu.edu/~sanjivdas/chat_FINAL.pdf›.pl_PL
dc.referencesDave Kushal, Lawrence Steve, Pennock David M. (2003) Mining the peanut gallery: Opinion extraction and semantic classification of product reviews [w:] Proceedings of WWW, s. 519–528, [dostęp 1 maja 2014 r.]. Dostępny w Internecie: ‹http://www. kushaldave.com/p451-dave.pdf›.pl_PL
dc.referencesDeWall Nathan C. i in. (2011) Tuning in to psychological change: Linguistic markers of psychological traits and emotions over time in popular U.S. song lyrics. „Psychology of Aesthetics, Creativity, and the Arts”, vol. 5, no. 3, s. 200–207.pl_PL
dc.referencesDini Luca, Mazzini Giampaolo (2002) Opinion classification through information extraction [w:] Proceedings of the Conference on Data Mining Methods and Databases for Engineering, Finance and Other Fields (Data Mining), s. 299–310 [dostęp 1 maja 2014 r.]. Dostępny w Internecie: ‹http://www.google.pl/url?sa=t&rct=j- &q=&esrc=s&source=web&cd=1&ved=0CC8QFjAA&url=htt p%3A%2F%2Fia2010primercuat.googlecode.com%2Fsvn-history%2Fr45%2Ftrunk%2FSEI-GO%2Fdocs%2F10.1.1.109.1736. pdf&ei=D6diU9ahG8ep7AbGu4GYDQ&usg=AFQjCNGlzrqD MZ3aj-M_a-Yv4ITbwdU0KQ&bvm=bv.65788261,d.ZGU&cad=rja›.pl_PL
dc.referencesDomingos Pedro, Pazzani Michael (1997) On the optimality of the simple Bayesian classifier under zero-one loss. Machine Learning”, vol. 29, no. 2/3,s.103–130.pl_PL
dc.referencesEsuli Andrea, Sebastiani Fabrizio (2006) SENTIWORDNET: A Publicly Available Lexical Resource for Opinion Mining [w:] Proceedings of the 5th Conference on Language Resources and Evaluation, LREC’06, s. 417–422 [dostęp 1 maja 2014]. Dostępny w Internecie: ‹http://gandalf.aksis.uib.no/lrec2006/pdf/384_ pdf.pdf›.pl_PL
dc.referencesHogenraad Robert, Orianne Emilie (1986) Imagery, regressive thinking, and verbal performance in internal monologue. „Imagination, Cognition, and Personality”, vol. 5, no. 2, s. 127–145.pl_PL
dc.referencesHopkins Daniel, King Gary (2010) Extracting systematic social science meaning from text. „American Journal of Political Science”, vol. 54, no. 1, s. 229–247.pl_PL
dc.referencesHotho Andreas, Nürnberger Andreas, Paaß Gerhard (2005) ABrief Survey of Text Mining. „German Journal for Computer Linguistics and Speech Technology”, vol. 20, no. 1, s. 19–62pl_PL
dc.referencesJurafsky Dan, Martin James H. (2009) Speech and natural language processing: An introduction to natural language processing, computational linguistics, and speech recognition. Upper Saddle River, NJ: Prentice Hall.pl_PL
dc.referencesLieberman Erez i in. (2007) Quantifying the evolutionary dynamics of language. „Nature”, vol. 449, no. 7163, s. 713–716.pl_PL
dc.referencesLoughran Tim, McDonald Bill (2011) When is a Liability not a Liability? Textual Analysis, Dictionaries, and 10-Ks. „The Journal of Finance”, vol. 66, no. 1, s. 35–65.pl_PL
dc.referencesMartindale Colin (1976) Primitive mentality and the relationship between art and society. „Scientific Aesthetics”, vol. 1, s. 5–18.pl_PL
dc.referencesMartindale Colin (1977) Syntactic and semantic correlates of verbal tics in Gilles de la Tourette’s syndrome: A quantitative case study. „Brain and Language”, vol. 4, s. 231–247.pl_PL
dc.referencesMartindale Colin -(1990) The clockwork muse: The predictability of artistic change. New York: Basic Books.pl_PL
dc.referencesMichel Jean-Baptistei in. (2011) Quantitative Analysis of Culture Using Millions of Digitized Books. „Science”, vol. 331, s. 176–182.pl_PL
dc.referencesNasukawa Tetsuya, Yi Jeonghee (2003) Sentiment analysis: Capturing favorability using natural language processing [w:] Proceedings of the Conference on Knowledge Capture (K-CAP) s. 70–77 [dostęp 1 maja 2014 r.]. Dostępny w Internecie: ‹http://tredocs. com/tw_files2/urls_41/40/d-39217/7z-docs/7.pdf›.pl_PL
dc.referencesNielsen Finn Å. (2011) A new ANEW: Evaluation of a word list for sentiment analysis in microblogs [w:] RoweMatthew i in., eds., Proceedings of the ESWC2011 Workshop on ‘Making Sense of Microposts’: Big things come in small packages 718 in CEUR Workshop Proceedings, Heraklion, s. 93–98 [dostęp 1 maja 2014 r.]. Dostępny w Internecie: ‹http://ceur-ws.org/Vol-718/ msm2011_proceedings.pdf›pl_PL
dc.referencesPagel Mark, Atkinson Quentin D., Meade Andrew (2007) Frequency of word-use predicts rates of lexical evolution throughout IndoEuropean history. „Nature”, vol. 449, s. 717–720.pl_PL
dc.referencesPang Bo, Lee Lillian (2002) Thumbs up? Sentiment Classification using Machine Learning Techniques.„EMNLP ‘02 Proceedings of the ACL-02 conference on Empirical methods in natural language processing”, vol. 10, s. 79–86.pl_PL
dc.referencesPang Bo, Lee Lillian (2008) Opinion Mining and Sentiment Analysis. „Foundations and Trends in Information Retrieval”, vol. 2, s. 1–135.pl_PL
dc.referencesRorty Richard (1996) Przygodność, ironia i solidarność. Przełożył Wacław J. Popowski. Warszawa: Spacja.pl_PL
dc.referencesRorty Richard (1999) Obiektywność, relatywizm i prawda. Przełożył Janusz Margański. Warszawa: Aletheia.pl_PL
dc.referencesTong Richard M. (2001) An operational system for detecting and tracking opinions in on-line discussion [w:] Working Notes of the SIGIR Workshop on Operational Text Classification. New York: ACM, s. 1–6.pl_PL
dc.referencesYi Jeonghee i in. (2003) Sentiment analyzer: Extracting sentiments about a given topic using natural language processing techniques [w:] Proceedings of the Third IEEE International Conference on Data Mining (ICDM’03). Washington: IEEE Computer Society, s. 427–434.pl_PL
dc.contributor.authorEmailk_tomanek@wp.plpl_PL
dc.relation.volume10pl_PL
dc.disciplinenauki socjologicznepl_PL


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record