Генеральний регіонально анотований корпус української мови (ГРАК)
Thread poster: Jarema
Jarema
Jarema  Identity Verified
Ukraine
Local time: 11:33
Member (2003)
German to Russian
+ ...

Moderator of this forum
Aug 24, 2019

Генеральний регіонально анотований корпус української мови (ГРАК) – це велика, репрезентативна, структурована колекція текстів українською мовою у супроводі програми, яка дозволяє будувати на базі корпусу власні підкорпуси, шукати слова, граматичні форми та їх сполучен�... See more
Генеральний регіонально анотований корпус української мови (ГРАК) – це велика, репрезентативна, структурована колекція текстів українською мовою у супроводі програми, яка дозволяє будувати на базі корпусу власні підкорпуси, шукати слова, граматичні форми та їх сполучення, а також обробляти результати пошуку, сортувати, робити збалансовані вибірки і одержувати різну статистичну інформацію.

Корпус призначений для здійснення лінгвістичних досліджень з граматики, лексики, історії української літературної мови, а також для використання під час укладання словників та граматик.

Корпус може бути використаний для вивчання мови на високому рівні, також при підготовці навчальних матеріалів, підручників, навчальних словників та вправ з використанням прикладів з реальних текстів, з урахуванням частотної сполучуваності тощо.

Корпус не є взірцем нормативної української мови, в ньому можуть трапитись слова і сполучення, які не відповідають сучасним нормам літературної мови.

Корпус охоплює період з 1816 по 2019 р. і містить понад 40 тисяч текстів різних жанрів, близько 15 тисяч авторів.

Адреса: http://uacorpus.org/

ГРАК у Facebook

https://www.facebook.com/groups/488552241633414/

Генеральний регіонально анотований корпус української мови (ГРАК; англ. General Regionally Annotated Corpus of Ukrainian, GRAC http://uacorpus.org/) — це корпус української мови обсягом понад 290 млн токенів, розмічений за регіонами, призначений для здійснення лінгвістичних досліджень з граматики, лексики, історії української літературної мови, а також для використання під час укладання словників та граматик.

Групу ГРАК створено для публікації

1) новин про ГРАК і про інші корпуси української мови,

2) питань, як користуватися корпусом і що там можна знайти (тут можна просто написати тему дослідження або курсової роботи, найпевніше, що ми знайдемо у корпусі потрібний матеріал, ми просто любимо шукати будь-що у корпусі),

3) власних корпусних розвідок,

4) посилань на дослідження, зроблені на базі ГРАК.
Collapse


Andriy Bublikov
Alexander Matsyuk
 
Jarema
Jarema  Identity Verified
Ukraine
Local time: 11:33
Member (2003)
German to Russian
+ ...

Moderator of this forum
TOPIC STARTER
Інші корпуси української мови Aug 24, 2019

У розділі "Інші корпуси української мови" наведені адреси інших корпусів української мови.

 
Jarema
Jarema  Identity Verified
Ukraine
Local time: 11:33
Member (2003)
German to Russian
+ ...

Moderator of this forum
TOPIC STARTER
ГРАК-7 Dec 12, 2019

ГРАК-7 уже на сайті, виріс на 10%, обсяг корпусу тепер - 437 млн токенів.

Додано, з цікавого, романи Б. Грінченка, вичитані за старими виданнями (Dmytro Yesypenko), кілька номерів газети "Молоде життя: часопис українського пласту" 1925-1929 років (Oksana Taran і студенти спеціальності "Прикла�
... See more
ГРАК-7 уже на сайті, виріс на 10%, обсяг корпусу тепер - 437 млн токенів.

Додано, з цікавого, романи Б. Грінченка, вичитані за старими виданнями (Dmytro Yesypenko), кілька номерів газети "Молоде життя: часопис українського пласту" 1925-1929 років (Oksana Taran і студенти спеціальності "Прикладна лінгвістика" НУ ЛП), твори Михайла Жука (Alena Yavorskaya), колекцію радянських газетних матеріалів 1986-1991 років про Чорнобиль (Микола Жарких), колекцію сучасної драматургії (Ольга Сахарова), газету "Україна молода" 2010-2019 рр. (Vasyl Starko). І майже сто номерів журналу "Всесвіт" (1958-1983), які підготували студенти спеціальності "Прикладна лінгвістика" НУ Львівська "Політехніка" (дякуємо Olena Levchenko, Oksana Taran) і ЛНУ імені Івана Франка (дякуємо Solomija Buk). Другу частину готових журналів ще не встигла додати, чекають. Корпус родинних листів силами студентів збільшився вдвічі, тепер там близько 600 текстів, є і зображення листів, які поки що не доступні онлайн. Додали рукописні щоденники. Всі студенти, які готували матеріали для корпусу, можуть пошукати себе на сайті на сторінці "Розробники".

https://www.facebook.com/groups/488552241633414/
Collapse


Oksana Weiss
 
Jarema
Jarema  Identity Verified
Ukraine
Local time: 11:33
Member (2003)
German to Russian
+ ...

Moderator of this forum
TOPIC STARTER
Пошук Feb 18, 2020

На сайтах https://r2u.org.ua/ та https://e2u.org.ua/ зреалізовано перехід від українських слів у словниках до корпусу: виділіть слово в результатах пошуку, натисніть комбінацію клавіш Ctrl+Shift+4 і побачите �... See more
На сайтах https://r2u.org.ua/ та https://e2u.org.ua/ зреалізовано перехід від українських слів у словниках до корпусу: виділіть слово в результатах пошуку, натисніть комбінацію клавіш Ctrl+Shift+4 і побачите результати (простого) пошуку цього слова в корпусі ГРАК (http://uacorpus.org/).
NB: якщо ви раніше заходили на наші сайти, варто жорстко оновити сторінку (Ctrl+F5 для "Хрому"). Інакше браузер підтягне стару версію сторінки з кешу й ця нова комбінація клавіш не працюватиме.
Collapse


 


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

Генеральний регіонально анотований корпус української мови (ГРАК)







Protemos translation business management system
Create your account in minutes, and start working! 3-month trial for agencies, and free for freelancers!

The system lets you keep client/vendor database, with contacts and rates, manage projects and assign jobs to vendors, issue invoices, track payments, store and manage project files, generate business reports on turnover profit per client/manager etc.

More info »
CafeTran Espresso
You've never met a CAT tool this clever!

Translate faster & easier, using a sophisticated CAT tool built by a translator / developer. Accept jobs from clients who use Trados, MemoQ, Wordfast & major CAT tools. Download and start using CafeTran Espresso -- for free

Buy now! »