Частотний список

Щоб побудувати частотний список, треба на сторінці конкордансу натиснути "Частота" (у меню зліва). Відкриється сторінка, де треба вибрати атрибут: або word (якщо потрібен частотний список словоформ), або lemma (тоді буде частотний список лексем). І натиснути "Побудувати частотний список".

Наприклад, треба визначити, яка форма частотніша у сполученні: "дати братові" чи "дати брату". Треба шукати [lemma="дати"] [lemma="брат" & tag=".*:m:.*v_dav.*" ] і робити частотний список за атрибутом word, результат:

✓ | ✗ дав братові 7

✓ | ✗ дати братові 6

✓ | ✗ дала братові 4

✓ | ✗ дам брату 1

✓ | ✗ дав брату 1

✓ | ✗ Дай братові 1

А щоб знайти сполучуваність лексем, треба зробити частотний список за атрибутом lemma. Наприклад, які іменники найчастіше вживаються у формі знах. відм. після дієслова “дати” (запит CQL: [lemma="дати"] [tag="noun.*v_zna.*"]),

✓ | ✗ |дати| |змога| 1,769

✓ | ✗ |дати| |можливість| 1,473

✓ | ✗ |дати| |наказ| 821

✓ | ✗ |дати| |згода| 714

✓ | ✗ |дати| |спокій| 590

✓ | ✗ |дати| |відповідь| 584

✓ | ✗ |дати| |слово| 564

✓ | ✗ |дати| |знак| 540

тощо

Щоб побачити контексти, де вжито кожне сполучення з частотного списку, треба натиснути на позначку ✓ зліва.

 

Якщо треба зробити частотний список за якоюсь частиною багатослівного запиту, є команда within.

Наприклад, потрібен частотний список перехідних дієслів. Можна пошукати дієслово, за яким іде іменник у знахідному (але не називному) відмінку, і створити частотний список лише дієслів із цих сполучень. Для цього треба написати запит CQL:

[tag="verb.*"] within [tag="verb.*"] [tag="noun.*v_zna"&tag!=".*v_naz"]

І зробити частотний список самих дієслів:

✓ | ✗ |мати| 28,243

✓ | ✗ |давати| 10,226

✓ | ✗ |знайти| 9,512

✓ | ✗ |дати| 9,219

тощо

 

Частотний список словоформ або лем одного твору певного письменника

можна створити так:

1) на сторінці пошуку вибрати текст: написати у рядку DOC.AUTHOR автора, а в рядку DOC.TITLE назву (якщо автор і текст є у корпусі, там з'являться підказки),

2) у рядку "Словоформа" написати [[:alpha:]].* (так ми знайдемо всі слова, що складаються із літер, навіть ті, яких немає в словнику, а також слова іншими мовами),

3) побудувати конкорданс,

4) зробити частотний список лем або словоформ ("Частота" в меню зліва),

5) завантажити список, для цього в меню зліва вибрати "Стягнути" -> Стягнути список частот як: XML; кількість рядків встановити максимальну (100000), щоб завантажився весь словник. Файл можна відкрити через Excel.

NB! У список лем потраплять лише слова, які є в словнику; у список словоформ потраплять всі словоформи, які є в тексті.

 

Докладніше про пошук і обробку результатів – в інструкції (англ.): https://www.sketchengine.eu/documentation/



How to use this theme

Every part of this theme can be translated to another language. Even this content you are reading now!

The drop-down in the main menu is called a Locale Picker. It lets you quickly switch between any of the available languages when browsing this website.

For help on setting up more languages, close this popup and click the Languages menu item.