Please use this identifier to cite or link to this item: https://elib.psu.by/handle/123456789/23393
Title: Графічныя маркёры для аўтаматызаванай ідэнтыфікацыі для ўваходжання беларускамоўных фрагментаў у змешаны беларуска-рускі тэкст
Authors: Станкевіч, А. Ю.
Бубновіч, І. І.
Issue Date: 2019
Publisher: Полоцкий государственный университет
Citation: Вестник Полоцкого государственного университета. Серия A, Гуманитарные науки. - 2019. - № 2 – C. 104-110.
Abstract: На падставе лінгвастатыстычнага аналізу вызначаецца комплекс графічных маркёраў- ідэнтыфікатараў уключэнняў беларускамоўных фрагментаў у змешаны беларуска-рускі тэкст. Прыводзяцца алгарытм вызначэння тэставых масіваў для рускай і беларускай моў, а таксама схемы графічных маркёраў. Вызначаны комплекс графічных маркёраў можа быць выкарыстаны для аўтаматызацыі разметкі беларускамоўных украпленняў пры стварэнні паўнатэкставых электронных моўных рэсурсаў.= The linguostatistically defined complex of graphical markers for automated identification of Belarusian inclusions in a mixed Belarusian-Russian text is described. The algorithm of compiling the test corpora of Belarusian and Russian languages and the schemas of graphical markers are provided in the appendix to the article. The revealed complex of the graphical markers can be widely used as a component of linguistic support for creation of diverse full-text language resources in conditions of the Republic of Belarus.
Keywords: Государственный рубрикатор НТИ - ВИНИТИ::ОБЩЕСТВЕННЫЕ НАУКИ::Языкознание
Электронныя моўныя рэсурсы
Корпусныя тэхналогіі
Разметка
Лінгвістычнае забеспячэнне
Графічны маркёр
Беларуска-рускае двухмоўе
Беларускамоўныя ўкрапленні
Змешаны беларуска-рускій тэкст
URI: https://elib.psu.by/handle/123456789/23393
metadata.dc.rights: open access
Appears in Collections:2019, № 2

Files in This Item:
File Description SizeFormat 
104-110.pdf224.05 kBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.