Німецько-український / українсько-німецький | 10,297,721 words / 9,050,291 words |
Англійсько-український / українсько-англійський | 2,453,810 words / 2,020,907 words |
Французько-український / українсько-французький | 994,024 words / 784,027 words |
Іспансько-український / українсько-іспанський | 823,585 words / 680,869 words |
Японсько-український / українсько-японський | 211,504 words / 116,993 words |
Китайсько-український / українсько-китайський | 131,872 words / 113,824 words |
Персько-український / українсько-перський | 8,495 words / 7,410 words |
Вирівнювання вручну з застосуванням програми InterText
Морфосинтаксична анотація: UDPipe2
ПОШУК через NoSketch Engine
Демонстрація (відео)
2023-2024
Рисунок Едварда Ліра
РОЗРОБНИКИ
Координація і технічна підтримка корпусів ParaRook: Арсеній Лукашевський (Національний університет «Харківський політехнічний інститут», кафедра інтелектуальних комп'ютерних систем), Марія Шведова
ParaRook||DE→UK
Організація колекції і вирівнювання: Марія Шведова (Національний університет «Харківський політехнічний інститут», Єнський університет)
Також брали участь у вирівнюванні текстів
Тетяна Шарма (Київський національний університет імені Тараса Шевченка)
Студенти Національного університету «Харківський політехнічний інститут»: Олександр Єна, Анастасія Брильова, Руслан Коротких, Марія Кечева, Ксенія Михайлюк, Уляна Слободенко, Діна Байдалова, Богдан Колесніков, Анастасія Тарасова, Марина Попова, Анастасія Троцька, Євгенія Донець, Діана Клименко, Ілля Динкін, Ліка Тушева, Олексій Чорнобровкін.
Слухачі онлайн-курсу "Корпусна лінгвістика" (Національний університет «Харківський політехнічний інститут», Єнський університет, за підтримки фонду DAAD): Дар'я Лапіна, Дарина Власенко, Арсеній Огурцов, Олександра Караван, Дар'я Темна (Національний аерокосмічний університет імені М. Є. Жуковського «Харківський авіаційний інститут»), Юлія Грицек, Станіслав Бушель, Анастасія Савушкіна (Національний університет кораблебудування ім. адмірала Макарова), Кира Крижановська (Херсонський національний технічний університет), Ольга Попова (Київський столичний університет імені Бориса Грінченка), Катерина Осипенко, Ірина Гамєза (Національний університет «Києво-Могилянська академія»), Віталіна Скалига (Київський національний університет імені Тараса Шевченка), Вероніка Пилипенко (Донецький національний університет імені Василя Стуса).
ParaRook||EN→UK
Впорядкування колекції: Михайло Назаренко (Київський національний університет імені Тараса Шевченка)
Організація роботи і вирівнювання: Аліса Корольова (Горлівський інститут іноземних мов «Донбаський державний педагогічний університет»)
Також брали участь у вирівнюванні текстів
Слухачі онлайн-курсу "Корпусна лінгвістика" (Національний університет «Харківський політехнічний інститут», Єнський університет, за підтримки фонду DAAD): Дмитро Решетніков, Валерія Хоретлєва, Мілана Адут, Тетяна Чапленко (Криворізький державний педагогічний університет), Анастасія Воронова (Київський національний університет імені Тараса Шевченка), Олександра Ларіонова, Альона Хмель (Донецький національний університет імені Василя Стуса), Богдан Мудрієвський, Олександра Німець (Житомирський державний університет імені Івана Франка), Станіслав Бушель (Національний університет кораблебудування ім. адмірала Макарова).
Студенти Донецького національного університету імені Василя Стуса: Анастасія Бондар, Анатолій Дидь, Марія Ковтун, Анастасія Козанчук, Вікторія Костюк, Вероніка Кроль, Олександра Ларіонова, Анастасія Музика, Анастасія Політанська, Ірина Салик, Марта Таран, Дар'я Шайдовська.
ParaRook||FR→UK
Вирівнювання текстів
Студенти Національного університету «Харківський політехнічний інститут»: Олена Заікіна, Тетяна Селезньова, Марія Молошна, Олександра Ісаєва, Ольга Перова, Крістіна Сідненко , Катерина Калашникова, Юрій Повесьма, Дмитро Петрушов, Єлизавета Лубенець, Дана Баканова, Вікторія Середа, Аліна Шмідт.
ParaRook||ES→UK
Організація колекції і вирівнювання: Мілад Зікрань, Софія Павленко (Київський національний університет імені Тараса Шевченка)
ParaRook||ZH→UK
Організація колекції і вирівнювання: Богдан Сачук (Київський національний університет імені Тараса Шевченка)
ParaRook||FA→UK
Організація колекції і вирівнювання: Олексій Кашмарчук (Львівський національний університет імені Івана Франка)
ParaRook||JA→UK
Організація колекції і вирівнювання: Назар Коцур, Богдан Лаба (Львівський національний університет імені Івана Франка)
Просимо посилатися на наші публікації:
Maria Shvedova and Arsenii Lukashevskyi. 2024. Creating Parallel Corpora for Ukrainian: A German-Ukrainian Parallel Corpus (ParaRook||DE-UK). In Proceedings of the Third Ukrainian Natural Language Processing Workshop (UNLP) @ LREC-COLING 2024, pages 14–22, Torino, Italia. ELRA and ICCL.