Частотний список

Щоб побудувати частотний список, треба на сторінці конкордансу натиснути "Частота" (у меню зліва). Відкриється сторінка, де треба вибрати атрибут: або word (якщо потрібен частотний список словоформ), або lemma (тоді буде частотний список лексем). І натиснути "Побудувати частотний список".

Наприклад, треба визначити, яка форма частотніша у сполученні: "дати братові" чи "дати брату". Треба шукати [lemma="дати"] [lemma="брат" & tag=".*:m:.*v_dav.*" ] і робити частотний список за атрибутом word, результат:

✓ | ✗ дав братові 7

✓ | ✗ дати братові 6

✓ | ✗ дала братові 4

✓ | ✗ дам брату 1

✓ | ✗ дав брату 1

✓ | ✗ Дай братові 1

А щоб знайти сполучуваність лексем, треба зробити частотний список за атрибутом lemma. Наприклад, які іменники найчастіше вживаються у формі знах. відм. після дієслова “дати” (запит CQL: [lemma="дати"] [tag="noun.*v_zna.*"]),

✓ | ✗ |дати| |змога| 1,769

✓ | ✗ |дати| |можливість| 1,473

✓ | ✗ |дати| |наказ| 821

✓ | ✗ |дати| |згода| 714

✓ | ✗ |дати| |спокій| 590

✓ | ✗ |дати| |відповідь| 584

✓ | ✗ |дати| |слово| 564

✓ | ✗ |дати| |знак| 540

тощо

Щоб побачити контексти, де вжито кожне сполучення з частотного списку, треба натиснути на позначку ✓ зліва.

Якщо треба зробити частотний список за якоюсь частиною багатослівного запиту, є команда within.

Наприклад, потрібен частотний список перехідних дієслів. Можна пошукати дієслово, за яким іде іменник у знахідному (але не називному) відмінку, і створити частотний список лише дієслів із цих сполучень. Для цього треба написати запит CQL:

[tag="verb.*"] within [tag="verb.*"] [tag="noun.*v_zna"&tag!=".*v_naz"]

І зробити частотний список самих дієслів:

✓ | ✗ |мати| 28,243

✓ | ✗ |давати| 10,226

✓ | ✗ |знайти| 9,512

✓ | ✗ |дати| 9,219

тощо

Частотний список словоформ або лем одного твору певного письменника

можна створити так:

1) на сторінці пошуку вибрати текст: написати у рядку DOC.AUTHOR автора, а в рядку DOC.TITLE назву (якщо автор і текст є у корпусі, там з'являться підказки),

2) у рядку "Словоформа" написати [[:alpha:]].* (так ми знайдемо всі слова, що складаються із літер, навіть ті, яких немає в словнику, а також слова іншими мовами),

3) побудувати конкорданс,

4) зробити частотний список лем або словоформ ("Частота" в меню зліва),

5) завантажити список, для цього в меню зліва вибрати "Стягнути" -> Стягнути список частот як: XML; кількість рядків встановити максимальну (100000), щоб завантажився весь словник. Файл можна відкрити через Excel.

NB! У список лем потраплять лише слова, які є в словнику; у список словоформ потраплять всі словоформи, які є в тексті.

Докладніше про пошук і обробку результатів – в інструкції (англ.): https://www.sketchengine.eu/documentation/

Частотний список

How to use this theme