dc.contributor.author | Roszko, Danuta | |
dc.contributor.author | Roszko, Roman | |
dc.contributor.editor | Banasiak, Jakub Lubomir | |
dc.contributor.editor | Kiklewicz, Aleksander | |
dc.contributor.editor | Mazurkiewicz-Sułkowska, Julia | |
dc.date.accessioned | 2021-10-20T11:37:51Z | |
dc.date.available | 2021-10-20T11:37:51Z | |
dc.date.issued | 2021 | |
dc.identifier.citation | Roszko D., Roszko R., Korpusy wielojęzyczne wkładem Instytutu Slawistyki Polskiej Akademii Nauk w rozwój infrastruktury Clarin-PL. Przykłady analizy korpusowej nad wołaczem, [w:] Języki słowiańskie dziś: w kręgu kategorii, struktur i procesów, J. L., Banasiak, A. Kiklewicz, J. Mazurkiewicz-Sułkowska (red.), WUŁ–IS PAN, Łódź–Warszawa 2021, „Prace Slawistyczne. Slavica”, t. 150, s. 281–313. | pl_PL |
dc.identifier.isbn | 978-83-8220-634-0 | |
dc.identifier.uri | http://hdl.handle.net/11089/39486 | |
dc.description.abstract | W artykule opisano budowane przez zespół językoznawców Instytutu Slawistyki Polskiej
Akademii Nauk (dalej IS PAN) korpusy wielojęzyczne z węzłowym językiem polskim.
W pierwszej części artykułu (podpunkty 1–3) przedstawiono przyczyny, które doprowadziły
do rozwoju lingwistyki korpusowej w IS PAN oraz opisano pierwsze powstałe w IS PAN
korpusy. W drugiej części artykułu (podpunkt 4) przybliżono charakter infrastruktury
Clarin oraz konstruowane w IS PAN na rzecz tej infrastruktury wielojęzyczne korpusy
języków słowiańskich i bałtyckich. W części trzeciej artykułu (podpunkt 5) na przykładach
ilustrujących użycie form wołacza w językach polskim, bułgarskim i litewskim zaprezentowano
różne warianty zastosowania korpusów wielojęzycznych w badaniach kontrastywnych.
Omawiane zagadnienia ilustrowano przykładami wyekscerpowanymi z tychże korpusów. | pl_PL |
dc.description.abstract | This article describes multilingual corpora with Polish as the hub language which have
been constructed by a team of linguists from the Institute of Slavic Studies, Polish Academy
of Sciences. The first part (Sections 1–3) outlines the factors which led to the development of
corpus linguistics studies at the Institute and presents its first corpora. Section 4 provides
an overview of the Clarin infrastructure and the multilingual corpora of Slavic and Baltic
languages which were designed under this framework by a team working at the Institute.
Section 5 presents potential applications of multilingual corpora in contrastive studies,
using examples of the vocative case in Polish, Bulgarian and Lithuanian. The issues in focus
are illustrated with examples extracted from the corpora under discussion. | pl_PL |
dc.language.iso | pl | pl_PL |
dc.publisher | Wydawnictwo Uniwersytetu Łódzkiego | pl_PL |
dc.relation.ispartof | Języki słowiańskie dziś: w kręgu kategorii, struktur i procesów; | |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 Międzynarodowe | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
dc.subject | wielojęzyczne korpusy | pl_PL |
dc.subject | badania kontrastywne | pl_PL |
dc.subject | badania korpusowe | pl_PL |
dc.subject | Clarin-PL infrastructure | pl_PL |
dc.subject | multilingual corpora | pl_PL |
dc.subject | contrastive studies | pl_PL |
dc.subject | vocative case | pl_PL |
dc.title | Korpusy wielojęzyczne wkładem Instytutu Slawistyki Polskiej Akademii Nauk w rozwój infrastruktury Clarin-PL. Przykłady analizy korpusowej nad wołaczem | pl_PL |
dc.type | Book chapter | pl_PL |
dc.page.number | 281-313 | pl_PL |
dc.contributor.authorAffiliation | Uniwersytet Warszawski | pl_PL |
dc.contributor.authorAffiliation | Instytut Slawistyki Polskiej Akademii Nauk, Warszawa | pl_PL |
dc.identifier.eisbn | 978-83-8220-635-7 | |
dc.references | Андрейчин, Л. (1952). Към въпроса за аналитичния характер на съвременния бъл- гарски език. Български език, 1952(1–2), 20–35. | pl_PL |
dc.references | Андрейчин, Л. (1978). Към въпроса за аналитичния характер на съвременния бъл- гарски език. W П. Пашов (Red.), Помагало по българска морфология: Имена (ss. 238–254). Наука и изкуство. | pl_PL |
dc.references | Бояджиев, Т., Стоянов, С., & Попов, К. (Red.). (1983). Граматика на съвременния български книжовен език: T. 2. Морфология. Издателство на Българска академия на науките. | pl_PL |
dc.references | Гугуланова, И., Шимански, М., & Баракова, П. (1993). Българско-полска съпостави- телна граматика: T. 4. Семантичната категория комуникант. Издателство на Българска академия на науките. | pl_PL |
dc.references | Косеска-Тошева, В., & Гаргов, Г. (1990). Българско-полска съпоставителна граматика: T. 2. Семантичната категория определеност/неопределеност. Издателство на Българска академия на науките. | pl_PL |
dc.references | Кронгауз, М. А. (1999). Обращения как способ моделирования коммуникативного пространства. W Логический анализ языка: Образ человека в культуре и языке (ss. 130–131). Москва. | pl_PL |
dc.references | Крумова-Цветкова, Л., & Рошко, Р. (1994). Българско-полска съпоставителна грама- тика: T. 3, cz. 1. Семантичната категория количество. Издателство на Българска академия на науките. | pl_PL |
dc.references | Манкова, И. (2016). Употреба на звателни форми като обръщение в чешкия и бъл- гарския език. Съпоставителни изследвания, 41(3), 5–21, | pl_PL |
dc.references | Пашов, П. (1989). Практическа българска граматика. Народна просвета. | pl_PL |
dc.references | Петрова-Вашилевич, А., & Чоролеева, М. (1994). Българско-полска съпоставителна граматика: T. 3, cz. 2. Семантичната категория степен. Издателство на Бъл- гарска академия на науките. | pl_PL |
dc.references | Полонский, А. В. (2002). Эготив, вокатив, номинатив: Cубъект и падежная парадигма. Русский язык за рубежом, 2002(3), 27–35. http://gramota.ru/biblio/magazines/ryzr/rzr2001-03/28_197 | pl_PL |
dc.references | Супрун, В. И. (2001). Антропонимы в вокативном употреблении. Известия Уральского госу- дарственного университета, 20, 92–96. http://www.philology.ru/linguistics2/suprun_v-01.htm | pl_PL |
dc.references | Andreĭchin, L. (1952). Kŭm vŭprosa za analitichniia kharakter na sŭvremenniia bŭlgarski ezik. Bŭlgarski ezik, 1952(1–2), 20–35. | pl_PL |
dc.references | Andreĭchin, L. (1978). Kŭm vŭprosa za analitichniia kharakter na sŭvremenniia bŭlgarski ezik. In P. Pashov (Ed.), Pomagalo po bŭlgarska morfologiia: Imena (pp. 238–254). Nauka i izkustvo. | pl_PL |
dc.references | BgTagger: Тагерът „BgTagger” за български език. (n.d.). Department of Computational Linguistic IBL-BAS http://dcl.bas.bg/dclservices/index.php | pl_PL |
dc.references | Boiadzhiev, Т., Stoianov, С., & Popov, К. (Eds.). (1983). Gramatika na sŭvremenniia bŭlgarski knizhoven ezik: Vol. 2. Morfologiia. Izdatelstvo na Bŭlgarska akademiia na naukite. | pl_PL |
dc.references | BTB-Pipe: BulTreeBank. (b.d.). http://bultreebank.org/en/clark/ | pl_PL |
dc.references | Clarin-PL. (n.d.). Polska infrastruktura Clarin. http://clarin-pl.eu/ | pl_PL |
dc.references | Cvrček, V., & Richterová, O. (Ed.) (2020). Příručka ČNK: Český národní korpus (January 1, 1970, 00:00 GMT). Retrieved June 17, 2020, from http://wiki.korpus.cz/doku.php?id=citation&rev=0 | pl_PL |
dc.references | Dimitrova, L., Koseska-Toszewa, V., Roszko, D., & Roszko, R. (2009a). Bulgarian-Polish- Lithuanian Corpus: Current development. In C. Vertan, S. Piperidis, E. Paskaleva, & M. Slavcheva (Eds.), International workshop: Multilingual resources, technologies and evaluation for Central and Eastern European languages, held in conjunction with the International Conference RANLP-2009: Proceedings (pp. 1–8). Borovets. | pl_PL |
dc.references | Dimitrova, L., Koseska-Toszewa, V., Roszko, D., & Roszko, R. (2009b). Bulgarian-Polish- Lithuanian Corpus: Problems of development and annotation. In T. Erjavec (Ed.), Research infrastructure for digital lexicography: Mondilex Fifth Open Workshop: Ljubljana, Slovenia, October 14–15, 2009, Proceedings of the 12th International Multiconference Information Society 2009 (pp. 72–86). Department of Knowledge Technologies; Jožef Stefan Institute. | pl_PL |
dc.references | Dimitrova, L., Koseska-Toszewa, V., Roszko, D., & Roszko, R. (2010). Application of multilingual corpus in contrastive studies (On the example of the Bulgarian-Polish-Lithuanian Parallel Corpus). Cognitive Studies | Études cognitives, 2010(10), 217–239. https://doi.org /10.11649/cs.2010.013 | pl_PL |
dc.references | Dimitrova, L., Koseska-Toszewa, V., Roszko, D., & Roszko, R. (2014). Trilingual aligned corpus: Current state and new applications. Cognitive Studies | Études cognitives, 2014(14), 13–20. https://doi.org/ | pl_PL |
dc.references | Dimitrova, L., Pavlov, R., Simov, K., & Sinapova, L. (2005). Bulgarian MULTEXT-East Corpus: Structure and content. Cybernetics and Information Technologies, 5(1), 67–73. | pl_PL |
dc.references | Duszkin, M. (2010). Wykładniki przybliżoności adnumeratywnej w języku polskim i rosyjskim. Instytut Slawistyki Polskiej Akademii Nauk. | pl_PL |
dc.references | Gugulanova, I., Shymanski, М., & Barakova, P. (1993). Bŭlgarsko-polska sŭpostavitelna gramatika: Vol. 4. Semantichnata kategoriia komunikant. Izdatelstvo na Bŭlgarska akademiia na naukite. | pl_PL |
dc.references | Karolak, S. (2008). Gramatyka konfrontatywna bułgarsko-polska: Vol. 8. Semantyczna kategoria aspektu. Instytut Slawistyki Polskiej Akademii Nauk. | pl_PL |
dc.references | Kisiel, A., Koseska-Toszewa, V., Kotsyba, N., Satoła-Staśkowiak, J., & Sosnowski, W. (2016). Polish-Bulgarian-Russian Parallel Corpus: CLARIN-PL digital repository. https://clarin-pl .eu/dspace/handle/11321/308 | pl_PL |
dc.references | Koeva, S., & Genov, A. (2011). Bulgarian Language Processing Chain. In Proceedings of the Workshop on the Integration of Multilingual Resources and Tools in Web Applications, 26 September 2011. Association for Computational Linguistics. | pl_PL |
dc.references | KonText. (n.d.). KonText – Corpus Query Interface. https://kontext.clarin-pl.eu/run.cgi/first_form | pl_PL |
dc.references | Korytkowska, M. (1992). Gramatyka konfrontatywna bułgarsko-polska: Vol. 5. Typy pozycji predykatowo-argumentowych. Instytut Slawistyki Polskiej Akademii Nauk. | pl_PL |
dc.references | Korytkowska, M. (2004). Gramatyka konfrontatywna bułgarsko-polska: Vol. 6, pt. 4. Modalność interrogatywna. Instytut Slawistyki Polskiej Akademii Nauk. | pl_PL |
dc.references | Korytkowska, M., & Roszko, R. (1997). Gramatyka konfrontatywna bułgarsko-polska: Vol. 6, pt. 2. Modalność imperceptywna. Instytut Slawistyki Polskiej Akademii Nauk. | pl_PL |
dc.references | Koseska-Тosheva, В., & Gargov, G. (1990). Bŭlgarsko-polska sŭpostavitelna gramatika: Vol. 2. Semantichnata kategoriia opredelenost/neopredelenost. Izdatelstvo na Bŭlgarska akademiia na naukite. | pl_PL |
dc.references | Koseska-Toszewa, V. (2006). Gramatyka konfrontatywna bułgarsko-polska: Vol. 7. Semantyczna kategoria czasu. Instytut Slawistyki Polskiej Akademii Nauk. | pl_PL |
dc.references | Koseska-Toszewa, V., Korytkowska, M., & Roszko, R. (2009). Polsko-bułgarska gramatyka konfrontatywna. Wydawnictwo Akademickie Dialog. | pl_PL |
dc.references | Koseska-Toszewa, V., Maldžieva, V., & Penčev, J. (1995). Gramatyka konfrontatywna bułgarsko- polska: Vol. 6, pt. 1. Modalność: Teoretyczne problemy opisu. Instytut Slawistyki Polskiej Akademii Nauk. | pl_PL |
dc.references | Koseska-Toszewa, V. & Mazurkiewicz, A. (2010). Time flow and tenses. Instytut Slawistyki Polskiej Akademii Nauk. | pl_PL |
dc.references | Koseska-Toszewa, V., & Roszko, R. (2015). On semantic annotation in CLARIN-PL parallel corpora. Cognitive Studies | Études cognitives, 15, 211–236. DOI: https://doi.org/10.11649/cs.2015.016 | pl_PL |
dc.references | Koseska-Toszewa, V., & Roszko, R. (2016). Języki słowiańskie i litewski w korpusach równoległych CLARIN-PL. Studia z Filologii Polskiej i Słowiańskiej, 51, 191–217. DOI: https://doi.org/10.11649/sfps.2016.011 | pl_PL |
dc.references | Krongauz, М. А. (1999). Obrashcheniia kak sposob modelirovaniia kommunikativnogo prostranstva. W Logicheskiĭ analiz iazyka: Obraz cheloveka v kulʹture i iazyke (pp. 130–131). Moskva. | pl_PL |
dc.references | Krumova-TSvetkova, L., & Roshko, R. (1994). Bŭlgarsko-polska sŭpostavitelna gramatika: Vol. 3, pt. 1. Semantichnata kategoriia kolichestvo. Izdatelstvo na Bŭlgarska akademiia na naukite. | pl_PL |
dc.references | Kuryłowicz, J. (1949). Le problème du classement des cas. Biuletyn Polskiego Towarzystwa Językoznawczego, 1949(9), 20–43. | pl_PL |
dc.references | Kuryłowicz, J. (1968). O rozwoju kategorii gramatycznych. Wydawnictwo Naukowe PWN. | pl_PL |
dc.references | LaTeX. (n.d.). LaTeX: A document preparation system. https://www.latex-project.org/ | pl_PL |
dc.references | Linguee. (n.d.). Tłumacz i wyszukiwarka zasobów dwujęzycznych. https://www.linguee.com /?chooseDomain=1 | pl_PL |
dc.references | Ljubešić, N., Osenova, P., & Simov, K. (2020). The CLASSLA-StanfordNLP model for named entity recognition of standard Bulgarian 1.0. https://doi.org/ | pl_PL |
dc.references | Machálek, T. (2020). KonText: Advanced and flexible corpus query interface. In Proceedings of LREC 2020, (pp. 7005–7010). | pl_PL |
dc.references | Maldjieva, V. (2009). Gramatyka konfrontatywna bułgarsko-polska: Vol. 9. Słowotwórstwo. Instytut Slawistyki Polskiej Akademii Nauk. | pl_PL |
dc.references | Maldžieva, V. (2003). Gramatyka konfrontatywna bułgarsko-polska: Vol. 6, pt. 3. Modalność: Hipotetyczność, irrealność, optatywność i imperatywność, warunkowość. Instytut Slawistyki Polskiej Akademii Nauk. | pl_PL |
dc.references | Mankova, I. (2016). Upotreba na zvatelni formi kato obrŭshtenie v cheshkiia i bŭlgarskiia ezik. Sŭpostavitelni izsledvaniia, 41(3), 5–21, | pl_PL |
dc.references | MorfoLema. (n.d.). Analizator morfologiczny języka litewskiego. http://donelaitis.vdu.lt/MorfoLema/Apie.htm | pl_PL |
dc.references | MULTEXT-East. (n.d.). Multilingual Text Tools and Corpora for Central and Eastern European Languages. MULTEXT-East Home Page. http://nl.ijs.si/ME/ | pl_PL |
dc.references | ParaConc. (n.d.). Przeglądarka wielojęzycznych zasobów. http://www.athel.com/para.html | pl_PL |
dc.references | Pashov, P. (1989). Prakticheska bŭlgarska gramatika. Narodna prosveta. | pl_PL |
dc.references | Petrova-Vashilevich, А., & Choroleeva, М. (1994). Bŭlgarsko-polska sŭpostavitelna gramatika: Vol. 3, pt. 2. Semantichnata kategoriia stepen. Izdatelstvo na Bŭlgarska akademiia na naukite. | pl_PL |
dc.references | Polonskiĭ, А. V. (2002). Ėgotiv, vokativ, nominativ: Subʺekt i padezhnaia paradigma. Russkiĭ iazyk za rubezhom, 2002(3), 27–35. http://gramota.ru/biblio/magazines/ryzr/rzr2001-03/28_197 | pl_PL |
dc.references | Roszko, D. (2006). Funkcjonalne odpowiedniki litewskiego perfectum w litewskiej gwarze puńskiej i w języku polskim. Instytut Slawistyki Polskiej Akademii Nauk (Slawistyczny Ośrodek Wydawniczy). | pl_PL |
dc.references | Roszko, D. (2015). Zagadnienia kwantyfikacyjne i modalne w litewskiej gwarze puńskiej: Na tle literackich języków polskiego i litewskiego. Instytut Slawistyki Polskiej Akademii Nauk (Slawistyczny Ośrodek Wydawniczy). | pl_PL |
dc.references | Roszko, D., & Roszko, R. (2009). Morphosyntactic specifications for Polish and Lithuanian: Description of morphosyntactic markers for Polish and Lithuanian nouns within MULTEXT-East morphosyntactic specifications (Version 3.0 May 10th, 2004). In V. Koseska-Toszewa, L. Dimitrova, & R. Roszko (Eds.), Representing semantics in digital lexicography. Innovative solutions for lexical entry content in Slavic lexicography. MONDILEX Fourth Open Workshop. Warszawa, Poland, 29 June – 1 July, 2009 (pp. 145–158). Institute of Slavic Studies, Polish Academy of Sciences. | pl_PL |
dc.references | Roszko, D., & Roszko, R. (2016a). Polsko-litewskie korpusy równoległe: Elementy anotacji semantycznej z zakresu modalności możliwościowej i kwantyfikacji zakresowej. In E. Gruszczyńska & A. Leńko-Szymańska (Eds.), Polskojęzyczne korpusy równoległe / Polish language parallel corpora (pp. 119–132). Instytut Lingwistyki Stosowanej. http://repozytorium.ceon.pl/bitstream/handle/123456789/9717/07_Roszko_Roszko.pdf?sequence=1&isAllowed=y | pl_PL |
dc.references | Roszko, D., & Roszko, R. (2016b). Polish-Lithuanian Parallel Corpus: CLARIN-PL digital repository. http://hdl.handle.net/11321/309 | pl_PL |
dc.references | Roszko, D., & Roszko, R. (2018a). Polsko-litewskie korpusy IS PAN i CLARIN-PL. In N. Birgiel & D. Roszko (Eds.), Prace bałtystyczne: Vol. 7. Język – Literatura – Kultura (pp. 185–205). Uniwersytet Warszawski. | pl_PL |
dc.references | Roszko, D., & Roszko, R. (2018b). Polish-Lithuanian Parallel Corpus „2”: CLARIN-PL digital repository. http://hdl.handle.net/11321/539 | pl_PL |
dc.references | Roszko, D., Roszko, R., & Sosnowski, W. (2018a). Polsko-bułgarskie korpusy IS PAN i CLARIN-PL. Slavica Lodziensia, 2, 59–70. | pl_PL |
dc.references | Roszko, D., Roszko, R., Sosnowski, W., & Satoła-Staśkowiak, J. (2018b). Polish-Bulgarian Parallel Corpus: CLARIN-PL digital repository. http://hdl.handle.net/11321/536 | pl_PL |
dc.references | Roszko, R. (2004). Semantyczna kategoria określoności/nieokreśloności w języku litewskim (w zestawieniu z językiem polskim). Instytut Slawistyki Polskiej Akademii Nauk (Slawistyczny Ośrodek Wydawniczy). | pl_PL |
dc.references | Roszko, R. (2009). Morphosyntactic specifications for Polish. Theoretical foundations. Description of morphosyntactic markers for Polish nouns within MULTEXT-East morphosyntactic specifications (Version 3.0 May 10th, 2004). In L. Dimitrova & R. Garabik (Eds.), Metalanguage and encoding scheme design for digital lexicography. MONDILEX Third Open Workshop. Bratislava, Slovakia, 15–16 April, 2009. Proceedings (pp. 140–149). L’. Štúr Institute of Linguistics. | pl_PL |
dc.references | Roszko, R. (2019). Korpusy wielojęzyczne + przeglądarka korpusowa Kontext. In Warsztaty CLARIN-PL w praktyce badawczej (UMCS LUBLIN). https://nextcloud.clarin-pl.eu/ index.php/s/bL6hAv4RyB811F5#pdfviewer | pl_PL |
dc.references | Roszko, R. (2020). Korpusy wielojęzyczne: polsko-slawistyczno-bałtystyczne. https://www.youtube.com/watch?v=LcDuZD57mto | pl_PL |
dc.references | Satoła-Staśkowiak, J. (2010). Polsko-bułgarskie odpowiedniości przekładowe czasów przeszłych. Instytut Slawistyki Polskiej Akademii Nauk (Slawistyczny Ośrodek Wydawniczy). | pl_PL |
dc.references | Satoła-Staśkowiak, J. & Koseska-Toszewa, V. (2014). Współczesny słownik bułgarsko‑polski – zeszyt I. Instytut Slawistyki Polskiej Akademii Nauk (Slawistyczny Ośrodek Wydawniczy). | pl_PL |
dc.references | Suprun,V. I. (2001). Antroponimy v vokativnom upotreblenii. Izvestiya Ural’skogo gosudarstvennogo universiteta, 20, 92–96. http://www.philology.ru/linguistics2/suprun_v-01.htm | pl_PL |
dc.references | Suprun,V. I. (2001). Antroponimy v vokativnom upotreblenii. Izvestiya Ural’skogo gosudarstvennogo universiteta, 20, 92–96. http://www.philology.ru/linguistics2 /suprun_v-01.htm Wstęp. (1984). Projekt gramatyki konfrontatywnej bułgarsko-polskiej i serbsko-chorwacko- polskiej: Wstęp. In K. Polański (Ed.), Studia polsko-południowosłowiańskie. Zakład Narodowy im. Ossolińskich. | pl_PL |
dc.contributor.authorEmail | d.roszko@uw.edu.pl | pl_PL |
dc.contributor.authorEmail | roman.roszko@ispan.waw.pl | pl_PL |