ParaRook

ParaRook - паралельні корпуси на основі ГРАКу


Німецько-український / українсько-німецький 8,875,783 / 7,805,822
Англійсько-український / українсько-англійський 975,969 / 812,126
Французько-український / українсько-французький 901,445 / 708,650
Іспансько-український / українсько-іспанський 423,627 / 344,615
Китайсько-український / українсько-китайський 40,101 / 36,011
Персько-український / українсько-перський 8,495 / 7,410
Японсько-український / українсько-японський 7,343 / 5,201


Вирівнювання вручну з застосуванням програми InterText

Морфосинтаксична анотація: UDPipe2

ПОШУК через NoSketch Engine

Демонстрація (відео)

2023-2024


Рисунок Едварда Ліра


РОЗРОБНИКИ

Координація і технічна підтримка корпусів ParaRook: Арсеній Лукашевський (Національний університет «Харківський політехнічний інститут», кафедра інтелектуальних комп'ютерних систем), Марія Шведова

ParaRook||DE→UK

Організація колекції і вирівнювання: Марія Шведова (Національний університет «Харківський політехнічний інститут», Єнський університет)

Також брали участь у вирівнюванні текстів

Тетяна Шарма (Київський національний університет імені Тараса Шевченка)

Студенти Національного університету «Харківський політехнічний інститут»: Олександр Єна, Анастасія Брильова, Руслан Коротких, Марія Кечева, Ксенія Михайлюк, Уляна Слободенко, Діна Байдалова, Богдан Колесніков, Анастасія Тарасова, Марина Попова, Анастасія Троцька, Євгенія Донець, Діана Клименко, Ілля Динкін, Ліка Тушева, Олексій Чорнобровкін.

Слухачі онлайн-курсу "Корпусна лінгвістика" (Національний університет «Харківський політехнічний інститут», Єнський університет, за підтримки фонду DAAD): Дар'я Лапіна, Дарина Власенко, Арсеній Огурцов, Олександра Караван, Дар'я Темна (Національний аерокосмічний університет імені М. Є. Жуковського «Харківський авіаційний інститут»), Юлія Грицек, Станіслав Бушель, Анастасія Савушкіна (Національний університет кораблебудування ім. адмірала Макарова), Кира Крижановська (Херсонський національний технічний університет), Ольга Попова (Київський столичний університет імені Бориса Грінченка), Катерина Осипенко, Ірина Гамєза (Національний університет «Києво-Могилянська академія»), Віталіна Скалига (Київський національний університет імені Тараса Шевченка), Вероніка Пилипенко (Донецький національний університет імені Василя Стуса).

ParaRook||EN→UK

Впорядкування колекції: Михайло Назаренко (Київський національний університет імені Тараса Шевченка)

Організація роботи і вирівнювання: Аліса Корольова (Горлівський інститут іноземних мов «Донбаський державний педагогічний університет»), Дмитро Решетніков (Криворізький державний педагогічний університет)

Також брали участь у вирівнюванні текстів

Слухачі онлайн-курсу "Корпусна лінгвістика" (Національний університет «Харківський політехнічний інститут», Єнський університет, за підтримки фонду DAAD): Валерія Хоретлєва, Мілана Адут, Тетяна Чапленко (Криворізький державний педагогічний університет), Анастасія Воронова (Київський національний університет імені Тараса Шевченка), Олександра Ларіонова, Альона Хмель (Донецький національний університет імені Василя Стуса), Богдан Мудрієвський, Олександра Німець (Житомирський державний університет імені Івана Франка), Станіслав Бушель (Національний університет кораблебудування ім. адмірала Макарова).

ParaRook||FR→UK

Вирівнювання текстів

Студенти Національного університету «Харківський політехнічний інститут»: Олена Заікіна, Тетяна Селезньова, Марія Молошна, Олександра Ісаєва, Ольга Перова, Крістіна Сідненко , Катерина Калашникова, Юрій Повесьма, Дмитро Петрушов, Єлизавета Лубенець, Дана Баканова, Вікторія Середа, Аліна Шмідт.

ParaRook||ES→UK

Організація колекції і вирівнювання: Мілад Зікрань, Софія Павленко (Київський національний університет імені Тараса Шевченка)

ParaRook||ZH→UK

Організація колекції і вирівнювання: Богдан Сачук (Київський національний університет імені Тараса Шевченка)

ParaRook||FA→UK

Організація колекції і вирівнювання: Олексій Кашмарчук (Львівський національний університет імені Івана Франка)

ParaRook||JA→UK

Організація колекції і вирівнювання: Назар Коцур, Богдан Лаба (Львівський національний університет імені Івана Франка)


Публікації на основі ParaRook:

Maria Shvedova and Arsenii Lukashevskyi. 2024. Creating Parallel Corpora for Ukrainian: A German-Ukrainian Parallel Corpus (ParaRook||DE-UK). In Proceedings of the Third Ukrainian Natural Language Processing Workshop (UNLP) @ LREC-COLING 2024, pages 14–22, Torino, Italia. ELRA and ICCL.


How to use this theme

Every part of this theme can be translated to another language. Even this content you are reading now!

The drop-down in the main menu is called a Locale Picker. It lets you quickly switch between any of the available languages when browsing this website.

For help on setting up more languages, close this popup and click the Languages menu item.