Metodyka dla analizy treści w projektach stosujących techniki text mining i rozwiązania CAQDAS piątej generacji

Tomanek, Krzysztof

dc.contributor.author	Tomanek, Krzysztof
dc.date.accessioned	2021-02-15T09:07:47Z
dc.date.available	2021-02-15T09:07:47Z
dc.date.issued	2017
dc.identifier.citation	Tomanek Krzysztof (2017) Metodyka dla analizy treści w projektach stosujących techniki textmining i rozwiązania CAQDAS piątej generacji. „Przegląd Socjologii Jakościowej”, t. 13, nr 2, s. 128‒143 [dostęp dzień, miesiąc, rok]. Dostępny w Internecie: ‹www.przegladsocjologiijakosciowej.org›.	pl_PL
dc.identifier.issn	1733-8069
dc.identifier.uri	http://hdl.handle.net/11089/33473
dc.description.abstract	Projekty, w których przychodzi nam pracować z dużymi wolumenami danych tekstowych, pochodzących z rożnych źródeł i zapisanych w różnorodnych formatach, rodzą wiele dylematów natury metodologicznej, wymagają często niestandardowych decyzji i rozwiązań. W szczególności zadanie polegające na opracowaniu danych o różnorodnej jakości, nieustrukturyzowanych typu quan i qual wymagać może pracy, w której dynamicznie zmieniają się strategie analizy danych, sposoby przekształcania danych tekstowych. Artykuł opisuje przykład takiej właśnie „dynamicznej” metodyki. Wykazała ona swoją wartość w zadaniu polegającym na klasyfikacji wypowiedzi pisanych. W tak zarysowanym kontekście autor artykułu mierzy się z następującymi celami: (a) czy można zastosować oprogramowanie klasy CAQDAS do pracy półautomatycznej lub automatycznej zastępującej część manualnej pracy nad klasyfikacją wypowiedzi? (b) jak skonstruować metodykę klasyfikacji dla danych o różnorodnej jakości? (c) kiedy klasyfikacja automatyczna jest przydatna, a kiedy nie ma szans powodzenia? W artykule zaznaczone zostaną momenty, w których analityk sięga po wiedzę typową dla analiz danych jakościowych oraz te, kiedy wiedza z tego obszaru nie jest już wystarczająca do realizacji wskazanych celów (natural language processing, uczenie maszynowe). Przykład projektu będący tłem artykułu wymusił zastosowanie kilku narzędzi i języków wspierających pracę na danych. Praca nad transformacją, klasyfikacją oraz wizualizacją wyników wymagała zastosowania bazy MySQL oraz programów: R, QDA Miner, Wordstat, QlikSense. Roli i ograniczeniom narzędzi klasy CAQDAS poświęconych zostało także kilka uwag.	pl_PL
dc.description.abstract	Projects which we work with—large volumes of text data that are acquired from various sources and stored in a variety of formats—rise many dilemmas of a methodological nature, often require unstandardized decisions and solutions. In particular, compiling data of various quality, unstructured types, and of quan and qual nature requires dynamic strategies, ideas, and ways of analysis. The article describes an example of this approach. It shows its value in classification of written statements. In such context, the author of the article faces the following objectives: (a) can we use CAQDASso that semiautomatic or automatic work would replace some manual work regarding classification of the expressions; (b) how to construct a classification methodology for data of various quality; (c) when the automatic classification is useful and when there is no chance of success? The article will be marked with moments in which the analyst reaches for knowledge typical for qualitative data analysis, and when the knowledge of this area is no longer sufficient to classify content (natural language processing, machine learning). An example of a project being the background of this article forced the use of several tools and languages to support work with the data. Work on the transformation, classification, and visualization of results required applications such as: MySQL, R, QDA Miner, WordStat, Qlik Sense. Role and limits of the computer-assisted qualitative data analysis software tools have also been noted.	pl_PL
dc.language.iso	pl	pl_PL
dc.publisher	Uniwersytet Łódzki	pl_PL
dc.relation.ispartofseries	Przegląd Socjologii Jakościowej;2
dc.subject	analiza treści	pl_PL
dc.subject	Mixed Methods	pl_PL
dc.subject	Big Data	pl_PL
dc.subject	techniki text mining	pl_PL
dc.subject	CAQDAS	pl_PL
dc.subject	Content Analysis	pl_PL
dc.subject	Mixed Methods Approach	pl_PL
dc.subject	Text Mining	pl_PL
dc.title	Metodyka dla analizy treści w projektach stosujących techniki text mining i rozwiązania CAQDAS piątej generacji	pl_PL
dc.title.alternative	Methodology for Content Analysis in Text Mining Projects and Fifth Generation of CAQDAS	pl_PL
dc.type	Article	pl_PL
dc.page.number	128‒143	pl_PL
dc.contributor.authorAffiliation	Uniwersytet Jagielloński	pl_PL
dc.contributor.authorBiographicalnote	Krzysztof Tomanek, napisał doktorat z zakresu nauk społecznych na Uniwersytecie Jagiellońskim. Główne obszary zainteresowania i rozwoju naukowego: metodologia nauk społecznych, big data, data mining, text mining, badania z zakresu zaufania i lojalności, wizualizacja danych oraz interaktywne wizualizacje danych. Autor artykułów naukowych i popularnonaukowych z zakresu praktycznych zastosowań analiz tekstu, sentyment analysis, CAQDAS. Adres kontaktowy: Uniwersytet Jagielloński, Instytut Socjologii ul. Grodzka 52, 31-044 Kraków	pl_PL
dc.references	Acerbi Alberto i in. (2013) The Expression of Emotions in 20th Century Books. „PLoS ONE”, vol. 8, no. 3, s. 1–6.	pl_PL
dc.references	Appel Markus, Richter Tobias (2010) Transportation and Need for Affect in Narrative Persuasion: A Mediated Moderation Model. „Media Psychology”, vol. 13, s. 101–135.	pl_PL
dc.references	Bolasco Sergio, Ratta-Rinaldi della Francesca (2004) Experiments on Semantic Categorisation of Texts: Analysis of Positive and Negative Dimension. „JADT 2004: 7es Journées internationales d’Analyse statistique des Données Textuelles” [dostęp 1 maja 2014 r.]. Dostępny w Internecie‹http://lexicometrica.univ-paris3.fr/jadt/jadt2004/pdf/JADT_018.pdf›.	pl_PL
dc.references	Bolc Leonard, Jerzy Cytowski (1989–1991) Metody przeszukiwania heurystycznego, t. 1–2. Warszawa: PWN.	pl_PL
dc.references	Cichosz Paweł (2000) Systemy uczące się. Warszawa: WNT.	pl_PL
dc.references	Cole Ron i in. (1996) Survey of the State of the Art in Human Language Technology. Cambridge University Press [dostęp 5 maja 2017 r.]. Dostępny w Internecie: ‹http://www.dfki.de/~hansu/ HLT-Survey.pdf›.	pl_PL
dc.references	DeWall Nathan C. i in. (2011) Tuning in to Psychological Change: Linguistic Markers of Psychological Traits and Emotions over Time in Popular U.S. Song Lyrics.„Psychology of Aesthetics, Creativity, and the Arts”, vol. 5, no. 3, s. 200–207.	pl_PL
dc.references	Duch Włodzisław (1997) Fascynujący świat programów komputerowych. Poznań: Wydawnictwo Nakom.	pl_PL
dc.references	Duggleby Wendy (2005) What about Focus Group Interaction Data?„Qualitative Health Research”, vol. 15, no. 6, s. 832–840.	pl_PL
dc.references	Eder Maciej (2014) Metody ścisłe w językoznawstwie i pułapki pozornego obiektywizmu. Przykład stylometrii. „Teksty Drugie”, t. 2, s. 90–105.	pl_PL
dc.references	EderMaciej, Piasecki Maciej (2015) System do klasyfikacji tekstu i analizy stylometrycznej, referat wygłoszony podczas warsztatów CLARIN [dostęp 20 marca 2017 r.]. Dostępny w Internecie: ‹http://clarin-pl.eu/pliki/warsztaty/Stylometria%20i%20klasyfikacja%20-%20warsztaty.ppt›.	pl_PL
dc.references	Forslid Erik, Wiken Niklas (2015) Automatic Irony and Sarcasm Detection in Social Media, UPPTEC F 15045 Examensarbete 30 [dostęp 30 listopada 2016 r.]. Dostępny w Internecie: ‹http://uu.diva-portal.org/smash/get/diva2:852975/FULLTEXT01.pdf›	pl_PL
dc.references	Gonzalez Avelino J., Dankel Douglas D. (1993) The Engineering of Knowledge-Based Systems: Theory and Practice. Upper Saddle River, NJ: Prentice-Hall International.	pl_PL
dc.references	Jordan Joanne i in. (2007) Using Focus Groups to Research Sensitive Issues: Insights from Group Interviews on Nursingin the Northern Ireland “Troubles”. „International Journal of Qualitative Methods”, vol. 6, no. 4 [dostęp 14 kwietnia 2017 r.]. Dostępny w Internecie: ‹http:// citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.533.61&rep=rep1&type=pdf›.	pl_PL
dc.references	Kaplowitz Michael D. (2000) Statistical Analysis of Sensitive Topics inGroup and Individual Interviews. „Quality & Quantity”, vol. 34, s. 419–431	pl_PL
dc.references	Kidd Pamela S., Parshall Mark B. (2000) Getting the Focus and the Group: Enhancing Analytical Rigor in Focus Group Research. „Qualitative Health Research”, vol. 10, no. 3, s. 293–308.	pl_PL
dc.references	Lieberman Erez i in. (2007) Quantifying the Evolutionary Dynamics of Language. „Nature”, vol. 449, no. 7163, s. 713–716.	pl_PL
dc.references	Liu Bing (2012) Sentiment Analysis and Opinion Mining [dostęp 1 maja 2014 r.]. Dostępny w Internecie: ‹www.cs.uic.edu/~liub/ FBS/SentimentAnalysis-and-OpinionMining.pdf›.	pl_PL
dc.references	Michael Jean Baptiste (2011) Quantitative Analysis of Culture Using Millions of Digitized Books. Program for Evolutionary Dynamics. Cambridge: Harvard University.	pl_PL
dc.references	Niedbalski Jakub (2013) CAQDAS – oprogramowanie do komputerowego wspomagania analizy danych jakościowych. Historia, ewolucja i przyszłość. „Przegląd Socjologiczny”, t. 62, nr 1, s. 153–166.	pl_PL
dc.references	Niedbalski Jakub, red. (2014) Metody i techniki odkrywania wiedzy. Narzędzia CAQDAS w procesie analiz danych jakościowych. Łódź: Wydawnictwo Uniwersytetu Łódzkiego.	pl_PL
dc.references	Pagel Mark, Atkinson Quentin D., Meade Andrew (2007) Frequency of Word-Use Predicts Rates of Lexical Evolution Throughout Indoeuropean History. „Nature”, vol. 449, s. 717–720.	pl_PL
dc.references	Piskorski Jakub (2001) Shallow Text Processor for Information Extraction from Free-Text Business Documents. Poznań: Akademia Ekonomiczna w Poznaniu.	pl_PL
dc.references	Rosa Krzysztof (2015) Listy pożegnalne niedoszłych samobójców. Analiza treści. „Przegląd Socjologiczny”, t. 64, nr 4, s. 103–128.	pl_PL
dc.references	Rybicki Jan, Heydel Magdalena (2013) The Stylistics and Stylometry of Collaborative Translation: Woolf’s “Night and Day” in Polish. „Digital Humanities 2012: digital diversity: cultures, languages and methods”, vol. 28, no. nr 4, s. 708–717.	pl_PL
dc.references	Schanie Carrie L., Pinto-Foltz Melissa D., Logsdon Cynthia M. (2008) Analysis of Popular Press Articles Concerning Postpartum Depression: 1998-2006. „Issues Ment. Health Nurs.”, vol. 29, no. 11, s. 1200 –1216.	pl_PL
dc.references	Schwaber Ken (2013) Scrum Gide [dostęp 20 marca 2017 r.]. Dostępny w Internecie: ‹http://www.scrumguides.org/docs/scrumguide/v1/Scrum-Guide-PL.pdf›	pl_PL
dc.references	Smith Marc in. (2009) C&T ’09: Proceedings of the Fourth International Conference on Communities and Technologies [dostęp 5 maja 2017 r.]. Dostępny w Internecie: ‹http://www.connectedaction. net/wp-content/uploads/2009/08/2009-CT-NodeXL-and-SocialQueries-a-social-media-network-analysis-toolkit.pdf›.	pl_PL
dc.references	Sołdacki Przemysław (2006) Zastosowanie metod płytkiej analizy tekstu do przetwarzania dokumentów w języku polskim. Niepublikowana praca doktorska, Politechnika Warszawska, Wydział Elektroniki i Technik Informacyjnych, Instytut Informatyki [dostęp 27 listopada 2017 r.]. Dostępny w Internecie: ‹https://www.google.pl/url?sa=t&rct=j&q=&esrc=s- &source=web&cd=1&ved=0ahUKEwjli7q5iMvQAhXDFSwKHfNPAPwQ FggkMAA&url=https%3A%2F%2Frepo.pw.edu.pl%2Fdocstore%2Fdownload.seam%253Bjsessionid%3DF74241A1317DC5E22F87A22B33BE1F6F%3FfileId%3DWEiTI-b192c072-00cc-41df-9bba-a2b0a211e9bc&usg=AFQjCNH0laWKScvxkvp6FNAqRhpaHuKr0A&bvm=bv.139782543,d.bGg&cad=rja›.	pl_PL
dc.references	Taboada Maite i in. (2011) Lexicon-Based Methods for Sentiment Analysis. „Journal of Computational Linguistics”, vol. 37, no. 2, s. 267–307.	pl_PL
dc.references	Tomanek Krzysztof (2014a) Analiza sentymentu: historia i rozwój metody w ramach CAQDAS [w:] Niedbalski Jakub, red., Metody i techniki odkrywania wiedzy. Narzędzia CAQDAS w procesie analiz danych jakościowych. Łódź: Wydawnictwo Uniwersytetu Łódzkiego, s. 155–172.	pl_PL
dc.references	Tomanek Krzysztof (2014b) Jak nauczyć metodę samodzielności [w:] Niedbalski Jakub, red., Metody i techniki odkrywania wiedzy. Narzędzia CAQDAS w procesie analiz danych jakościowych. Łódź: Wydawnictwo Uniwersytetu Łódzkiego, s. 174.	pl_PL
dc.references	Tomanek Krzysztof (2014c) „Analiza sentymentu” – metoda analizy danych jakościowych. Przykład zastosowania oraz ewaluacja słownika RID i metody klasyfikacji Bayesa w analizie danych jakościowych. „Przegląd Socjologii Jakościowej”, t. 10, nr 2, s. 118–136.	pl_PL
dc.references	Tomanek Krzysztof (2015) Społeczność fanów nauki w świecie wirtualnym. Analiza eksploracyjna treści i aktywności społeczności internetowej skupionej wokół fanpage’a „I fucking love science”. „Edukacja Humanistyczna”, nr 1(32), s. 123–138.	pl_PL
dc.references	Tomanek Krzysztof (2016) Analiza argumentacji. Praktyczne implikacje zastosowania modelu argumentacji Stephena Toulmina do analiz danych tekstowych [w:] Wojciech Doliński i in., red., Rzeczywistość i zapis. Problemy badania tekstów w naukach społecznych i humanistycznych. Łódź: Wydawnictwo Uniwersytetu Łódzkiego, s. 229–242.	pl_PL
dc.references	Tomanek Krzysztof, Bryda Grzegorz (2015) Odkrywanie postaw dydaktyków zawartych w komentarzach studenckich. Analiza treści z zastosowaniem słownika klasyfikacyjnego. „Przegląd Socjologiczny”, t. 64, nr 4, s. 51–81.	pl_PL
dc.references	Weizenbaum Joseph (2008) Moglibyśmy mieć raj. „Forum”, nr 28, s. 28–29.	pl_PL
dc.references	Zaśko-Zielińska Monika (2014) Ślady idiolektów w listach pożegnalnych zgromadzonych w Polskim Korpusie Listów Pożegnalnych Samobójców [w:] R. Cieśla, red., Dokument i jego badania. Wrocław: Katedra Kryminalistyki Wydziału Prawa, Administracji i Ekonomii Uniwersytetu Wrocławskiego, s. 425–435.	pl_PL
dc.contributor.authorEmail	k_tomanek@wp.pl	pl_PL
dc.relation.volume	13	pl_PL
dc.discipline	nauki socjologiczne	pl_PL

Files in this item

Name:: PSJ_13_2_Tomanek.pdf
Size:: 716.7Kb
Format:: PDF

View/Open

This item appears in the following Collection(s)

Przegląd Socjologii Jakościowej 2017 Tom XIII Numer 2 [8]
Big Data i CAQDAS w badaniach jakościowych pod redakcją Macieja Brosza, Grzegorza Brydy oraz Piotra Siudy

Show simple item record