Правопис

Розміщення в корпусі текстів ХІХ – початку ХХ ст. передбачає вирішення певних проблем, основні з яких проблема сучасних видань старих текстів, де можна часом знайти виправлення, які стосуються не тільки правопису, і проблема різних правописів у старих виданнях. Більшість текстів подано в корпусі за сучасними чи радянськими виданнями, це зазначено в паспорті тексту (якщо відомо) і видно в корпусі; під час роботи з такими текстами треба пам’ятати, що там могли бути не лише орфографічні, а й граматичні  і лексичні виправлення. У тих випадках, коли редакторські втручання точно були і зафіксовані, дата редагування вказується після назви твору, причому основною датою твору в корпусі залишається рік написання, наприклад: Дмитро Бузько, Льоля [редакція 2016-2018 р.], 1924. Меншу частину текстів ХІХ-початку ХХ ст. подано за старими виданнями, причому правопис їх збережено. ГРАК містить тексти скрипниківкою і желехівкою, а також окремі тексти єрижкою, наприклад, найстарший текст у корпусі — п’єсу Миколи Гнідича (1816).

 

Вибрати правопис можна на сторінці пошуку за атрибутом DOC.ORTHOGRAPHY. Скорочення для орфографічних систем:

 

CONT — сучасний правопис

ZHEL — желехівка

SKRY — скрипниківка

 

Морфологічний аналіз текстів желехівкою ГРАК здійснює поки що лише частково. Програма правильно лематизує :

1. Написання типу "називати ся"

[Замітка], 1892, Народна Часопись

— Арештовано тут якогось чоловіка , котрий має називати /|називатися| ся Лускіна і єсть Нїмцем, яко підозріного о шпігуньство і забрано у него численну кореспонденцію.

2. Написання типу "цїлком"

[Замітка], 1917, Дїло

Не маємо цїлком /|цілком| власної причини до жалоби

3. Написання типу "мякий"

О. Богумил, Павло Житецький, Начерк історії літературної української мови. До Ів. Котляревського, 1914

...ствердненнє губних перед мякими /|м'який| голосовими і в кінцї слів

4. Написання типу "сьвіт"

Орест Авдикович, Метаморфози, 1901

У морі сивого туману купаєть ся парний сьвіт /|світ| дрімучої днини

Інші випадки, які не відповідають сучасному правопису (наприклад, "моглиб", "жити меш" та ін.), у ГРАК.5 не розпізнаються, вони не мають лем, їх можна знайти лише через пошук за словоформою (word).

Працюючи з ГРАКом, треба враховувати, що у текстах можуть бути різні правописні варіанти і програма не завжди всі їх впізнає.

Maria Shvedova, Andriy Rysin, Vasyl Starko. Handling of Nonstandard Spelling in GRAC. IEEE 16th International Conference on Computer Science and Information Technologies; Preprint. 2021

Yurii Chemerys, Olesia Nakhlik, Andriy Rysin, Maria Shvedova. Normalization of a Historic Western Ukrainian orthographic system Zhelekhivka in the Ukrainian Language Reference Corpus (GRAC). In Proceedings of the IEEE 18th International Conference on Computer Sciences and Information Technologies (CSIT). 20 Oct. 2023. LVIV, Ukraine. 

How to use this theme

Every part of this theme can be translated to another language. Even this content you are reading now!

The drop-down in the main menu is called a Locale Picker. It lets you quickly switch between any of the available languages when browsing this website.

For help on setting up more languages, close this popup and click the Languages menu item.