ГРАК

Генеральний регіонально анотований корпус української мови (ГРАК) — це велика репрезентативна добірка текстів, написаних українською мовою, доступна через складний інтерфейс. За допомогою цього інтерфейсу користувачі можуть шукати слова, граматичні форми та їх поєднання. Використовуючи підкорпуси, можна звузити пошук до певних періодів, регістрів, типів тексту, регіонів тощо. Користувачі мають змогу сортувати результати пошукового запиту, створювати репрезентативні вибірки й отримувати різну статистичну інформацію.

ГРАК охоплює фактичний вжиток за великий часовий проміжок у широкому діапазоні регістрів та призначений для лінгвістичних досліджень граматики, лексики, історії та соціолінгвістичних аспектів української мови, а також для використання в укладанні словників і граматик. Регіональна анотація полягає в тому, що до більшості текстів подано інформацію про місце публікації чи написання й регіон походження автора. На нашу думку, ця інформація дуже важлива з огляду на складну історію сучасної української мови, наявність різних історичних стандартів та їх мінливість.

Корпус можна використовувати як для поглибленого вивчання мови, так і для написання підручників, укладання навчальних словників і створення вправ на основі прикладів із реальних текстів, враховуючи частотність, сполучуваність тощо.

У ГРАКу подано реальний вжиток сучасної української мови за широкий проміжок часу з охопленням розлогого діапазону географічних, стилістичних та інших варіацій. Корпус містить понад 150 тисяч текстів, що їх написали близько 35 тисяч авторів за період від 1816 року до наших днів.

Просимо посилатися на ГРАК:

Генеральний регіонально анотований корпус української мови (ГРАК) / М. Шведова, Р. фон Вальденфельс, С. Яригін, А. Рисін, В. Старко, Т. Ніколаєнко та ін. — Київ, Львів, Єна, 2017–2025. — uacorpus.org.