Пошук у ГРАКу

Пошук через інтерфейс NoSketch Engine

ГРАК-18

Для пошуку в корпусі оберіть в меню потрібний корпус (1) і натисніть "Concordance" (2):


Для пошуку важливо знати, що ГРАК має морфологічну розмітку. Кожному токену в корпусі приписано лему і теги. 

Наприклад, речення  Пан Марое приїхав миритися. розмічено так:

(Слова Марое немає в словнику, тому цей токен має тег unknown.)

Відповідно можна шукати в корпусі — 

  • за словоформою (word) — для пошуку слова в точній граматичній формі або для пошуку нелематизованого слова (наприклад, Турманов), 
  • за лемою (lemma)  — для пошуку слова в усіх граматичних формах, 
  • за фразою (точною послідовністю симоволів з пробілами; phrase) — для пошуку сполучень з кількох слів у точній граматичній формі, 
  • а також використовувати теги під час складнішого пошуку за допомогою CQL.
    CQL: інструкція українською мовою

Потрібний атрибут для пошуку оберіть в меню:


Простий запит (simple) працює не зовсім прозоро: для лематизованих слів він спрацьовує як пошук за лемою, а для нелематизованих — як пошук за словоформою. Сполучення кількох лематизованих слів опрацьовує як послідовність лем.

У рядку пошуку simple працюють шаблони пошуку (англ. wildcard). Зірочку (*), знак питання (?) та подвійний дефіс (--) можна використовувати таким чином:

1) зірочка (*) для 0 або більшої кількості символів, наприклад,
шука* дасть результат
шука, шукати, шукають, шукання...
я*к дасть результат
як, язик, ярмарок...

2) знак питання (?) означає лише один символ, наприклад,
сто? дасть результат
стою, стоп
але не знайде
сто

к?т знайде такі леми
кіт, кат, кут

Щоб шукати зірочку і знак питання, використовуйте знак (\): наприклад, \* та \?

3) подвійний дефіс (--) позначає дефіс, пробіл або відсутність символа, наприклад,
пів--села дасть результат
пів села, півсела, пів-села