1. bookVolume 70 (2019): Issue 2 (December 2019)
Journal Details
License
Format
Journal
First Published
05 Mar 2010
Publication timeframe
2 times per year
Languages
English
access type Open Access

The Dialekt Corpus and Its Possibilities

Published Online: 21 Dec 2019
Page range: 336 - 344
Journal Details
License
Format
Journal
First Published
05 Mar 2010
Publication timeframe
2 times per year
Languages
English

DIALEKT, a corpus of Czech dialects, has been continuously curated and expanded by the Spoken Corpora section of the Institute of the Czech National Corpus. The following paper aims first to give a concise characteristic of the corpus, addressing its sociolinguistic parameters and possible subcorpora derivable thereof, its two-layer approach to the transcription of dialect recordings, and lemmatization & morphological tagging of the corpus. Subsequently, we move on to examples of how linguists can use the corpus and discuss two related projects which expand upon currently available possibilities: an archive of dialect-specific differential phones of the Czech language (completed) and an interactive web environment for spatial map-based visualization of data from all kinds of spoken corpora (in preparation). Thanks in part also to these additional tools, the DIALEKT corpus should serve both experts in the field as well as the general public.

Keywords

[1] Goláňová, H., Waclawičová, M., Komrsková, Z., Lukeš, D., Kopřivová, M., and Poukarová, P. (2017). DIALEKT: nářeční korpus, verze 1 z 2. 6. 2017. Praha, Ústav Českého národního korpusu FF UK. Accessible at: http://www.korpus.czSearch in Google Scholar

[2] Goláňová, H. – Waclawičová, M. (2018). Co je v ČNK nového IX (Zprávy z českého národního korpusu). Korpus – gramatika – axiologie, 2018 (17), pages 78–82.Search in Google Scholar

[3] Waclawičová, M., and Goláňová, H. (2019). Nářeční korpus DIALEKT a jeho použití ve výuce češtiny. Český jazyk a literatura, 69(3), pages 127–133.Search in Google Scholar

[4] Balhar, J. et al. (2011). Český jazykový atlas Dodatky. Praha, Academia.Search in Google Scholar

[5] Kopřivová, M., Komrsková, Z., Lukeš, D., Poukarová, P., and Škarpová, M. (2017). ORTOFON: Korpus neformální mluvené češtiny s víceúrovňovým přepisem. Praha, Ústav Českého národního korpusu FF UK. Accessible at: http://www.korpus.czSearch in Google Scholar

[6] Dialektologická komise České akademie věd a umění (1951). Pravidla pro vědecký přepis dialektických zápisů českých a slovenských. Praha, Česká akademie věd a umění.Search in Google Scholar

[7] Lamprecht, A., and Michálková, V. et al. (1976). České nářeční texty. Praha, Státní pedagogické nakladatelství.Search in Google Scholar

[8] Kopřivová, M., Lukeš, D., Komrsková, Z., Poukarová, P., Waclawičová, M., Benešová, L. and Křen, M. (2017). ORAL: korpus neformální mluvené češtiny, version 1 as of 2 June 2017. Praha, Ústav Českého národního korpusu FF UK. Accessible at: http://www.korpus.czSearch in Google Scholar

[9] Goláňová, H., and Waclawičová, M. (2019). Archiv diferenčních hlásek nářečí českého jazyka. Version as of 26 February 2019. Praha, Ústav Českého národního korpusu FF UK. Accessible at: http://www.korpus.cz.Search in Google Scholar

[10] Goláňová, H. (2015). A new dialect corpus: DIALEKT. In Gajdošová, K., and Žáková, A. (eds.). Proceedings of the Eight International Conference Slovko 2015 (Natural Language Processing, Corpus Linguistics, Lexicography). Lüdenscheid, RAM-Verlag, pages 36–44.Search in Google Scholar

[11] Goláňová, H., and Kupka, K. (2019). Mapa nářečí českého jazyka. Version as of 9 January 2019. Praha, Ústav Českého národního korpusu FF UK. Accessible at: http://www.korpus.czSearch in Google Scholar

[12] Goláňová, H., Kopřivová, M., Lukeš, D., and Štěpán, M. (2015). Kartografické a geografické zpracování dat z mluvených korpusů. Korpus – gramatika – axiologie, 2015 (11), pages 42–54.Search in Google Scholar

[13] Balhar, J. et al. (1999, 2002, 2005). Český jazykový atlas 3, 4, 5. Praha, Academia.Search in Google Scholar

[14] Balhar, J., and Jančák, P. et al. (1992, 1997). Český jazykový atlas 1, 2. Praha, Academia.Search in Google Scholar

Recommended articles from Trend MD

Plan your remote conference with Sciendo