Правопис

Розміщення в корпусі текстів ХІХ – початку ХХ ст. передбачає вирішення певних проблем, основні з яких проблема сучасних видань старих текстів, де можна часом знайти виправлення, які стосуються не тільки правопису, і проблема різних правописів у старих виданнях. Більшість текстів подано в корпусі за сучасними чи радянськими виданнями, це зазначено в паспорті тексту (якщо відомо) і видно в корпусі; під час роботи з такими текстами треба пам’ятати, що там могли бути не лише орфографічні, а й граматичні  і лексичні виправлення. У тих випадках, коли редакторські втручання точно були і зафіксовані, дата редагування вказується після назви твору, причому основною датою твору в корпусі залишається рік написання, наприклад: Дмитро Бузько, Льоля [редакція 2016-2018 р.], 1924. Меншу частину текстів ХІХ-початку ХХ ст. подано за старими виданнями, причому правопис їх збережено. ГРАК містить тексти скрипниківкою і желехівкою, а також окремі тексти ярижкою, наприклад, найстарший текст у корпусі — п’єсу Миколи Гнідича (1816).

Обрати правопис можна на сторінці пошуку за атрибутом DOC.ORTHOGRAPHY. Скорочення для орфографічних систем:

CONT — сучасний правопис

ZHEL — желехівка

SKRY — скрипниківка

 Морфологічний аналіз текстів желехівкою у ГРАКу здійснено частково. Працюючи з ГРАКом, треба враховувати, що у текстах можуть бути різні правописні варіанти і програма не завжди всі їх коректно розпізнає. Докладніше про опрацювання різних варіантних написань у ГРАКу див. у публікаціях:

Maria Shvedova, Andriy Rysin, Vasyl Starko. Handling of Nonstandard Spelling in GRAC. IEEE 16th International Conference on Computer Science and Information Technologies; Preprint. 2021

Maria Shvedova, Nataliia Prydvorova, and Ilona Skibina. Normalization of Early Modern Ukrainian in GRAC: the Case of Lesia Ukrainka's Works. Proceedings of the 6th International Conference on Computational Linguistics and Intelligent Systems (COLINS 2022). Volume I: Main Conference. Gliwice, Poland, May 12-13, 2022.

Yurii Chemerys, Olesia Nakhlik, Andriy Rysin, Maria Shvedova. Normalization of a Historic Western Ukrainian orthographic system Zhelekhivka in the Ukrainian Language Reference Corpus (GRAC). In Proceedings of the IEEE 18th International Conference on Computer Sciences and Information Technologies (CSIT). 20 Oct. 2023. LVIV, Ukraine.