Генеральний регіонально анотований корпус української мови (ГРАК) Thread poster: Jarema
| Jarema Ukraine Local time: 11:33 Member (2003) German to Russian + ... Moderator of this forum
Генеральний регіонально анотований корпус української мови (ГРАК) – це велика, репрезентативна, структурована колекція текстів українською мовою у супроводі програми, яка дозволяє будувати на базі корпусу власні підкорпуси, шукати слова, граматичні форми та їх сполучен�... See more Генеральний регіонально анотований корпус української мови (ГРАК) – це велика, репрезентативна, структурована колекція текстів українською мовою у супроводі програми, яка дозволяє будувати на базі корпусу власні підкорпуси, шукати слова, граматичні форми та їх сполучення, а також обробляти результати пошуку, сортувати, робити збалансовані вибірки і одержувати різну статистичну інформацію. Корпус призначений для здійснення лінгвістичних досліджень з граматики, лексики, історії української літературної мови, а також для використання під час укладання словників та граматик. Корпус може бути використаний для вивчання мови на високому рівні, також при підготовці навчальних матеріалів, підручників, навчальних словників та вправ з використанням прикладів з реальних текстів, з урахуванням частотної сполучуваності тощо. Корпус не є взірцем нормативної української мови, в ньому можуть трапитись слова і сполучення, які не відповідають сучасним нормам літературної мови. Корпус охоплює період з 1816 по 2019 р. і містить понад 40 тисяч текстів різних жанрів, близько 15 тисяч авторів. Адреса: http://uacorpus.org/ ГРАК у Facebook https://www.facebook.com/groups/488552241633414/ Генеральний регіонально анотований корпус української мови (ГРАК; англ. General Regionally Annotated Corpus of Ukrainian, GRAC http://uacorpus.org/) — це корпус української мови обсягом понад 290 млн токенів, розмічений за регіонами, призначений для здійснення лінгвістичних досліджень з граматики, лексики, історії української літературної мови, а також для використання під час укладання словників та граматик. Групу ГРАК створено для публікації 1) новин про ГРАК і про інші корпуси української мови, 2) питань, як користуватися корпусом і що там можна знайти (тут можна просто написати тему дослідження або курсової роботи, найпевніше, що ми знайдемо у корпусі потрібний матеріал, ми просто любимо шукати будь-що у корпусі), 3) власних корпусних розвідок, 4) посилань на дослідження, зроблені на базі ГРАК. ▲ Collapse | | | Jarema Ukraine Local time: 11:33 Member (2003) German to Russian + ... Moderator of this forum TOPIC STARTER Інші корпуси української мови | Aug 24, 2019 |
У розділі "Інші корпуси української мови" наведені адреси інших корпусів української мови. | | | Jarema Ukraine Local time: 11:33 Member (2003) German to Russian + ... Moderator of this forum TOPIC STARTER
ГРАК-7 уже на сайті, виріс на 10%, обсяг корпусу тепер - 437 млн токенів. Додано, з цікавого, романи Б. Грінченка, вичитані за старими виданнями (Dmytro Yesypenko), кілька номерів газети "Молоде життя: часопис українського пласту" 1925-1929 років (Oksana Taran і студенти спеціальності "Прикла�... See more ГРАК-7 уже на сайті, виріс на 10%, обсяг корпусу тепер - 437 млн токенів. Додано, з цікавого, романи Б. Грінченка, вичитані за старими виданнями (Dmytro Yesypenko), кілька номерів газети "Молоде життя: часопис українського пласту" 1925-1929 років (Oksana Taran і студенти спеціальності "Прикладна лінгвістика" НУ ЛП), твори Михайла Жука (Alena Yavorskaya), колекцію радянських газетних матеріалів 1986-1991 років про Чорнобиль (Микола Жарких), колекцію сучасної драматургії (Ольга Сахарова), газету "Україна молода" 2010-2019 рр. (Vasyl Starko). І майже сто номерів журналу "Всесвіт" (1958-1983), які підготували студенти спеціальності "Прикладна лінгвістика" НУ Львівська "Політехніка" (дякуємо Olena Levchenko, Oksana Taran) і ЛНУ імені Івана Франка (дякуємо Solomija Buk). Другу частину готових журналів ще не встигла додати, чекають. Корпус родинних листів силами студентів збільшився вдвічі, тепер там близько 600 текстів, є і зображення листів, які поки що не доступні онлайн. Додали рукописні щоденники. Всі студенти, які готували матеріали для корпусу, можуть пошукати себе на сайті на сторінці "Розробники". https://www.facebook.com/groups/488552241633414/ ▲ Collapse | | | Jarema Ukraine Local time: 11:33 Member (2003) German to Russian + ... Moderator of this forum TOPIC STARTER
На сайтах https://r2u.org.ua/ та https://e2u.org.ua/ зреалізовано перехід від українських слів у словниках до корпусу: виділіть слово в результатах пошуку, натисніть комбінацію клавіш Ctrl+Shift+4 і побачите �... See more На сайтах https://r2u.org.ua/ та https://e2u.org.ua/ зреалізовано перехід від українських слів у словниках до корпусу: виділіть слово в результатах пошуку, натисніть комбінацію клавіш Ctrl+Shift+4 і побачите результати (простого) пошуку цього слова в корпусі ГРАК (http://uacorpus.org/). NB: якщо ви раніше заходили на наші сайти, варто жорстко оновити сторінку (Ctrl+F5 для "Хрому"). Інакше браузер підтягне стару версію сторінки з кешу й ця нова комбінація клавіш не працюватиме. ▲ Collapse | | | To report site rules violations or get help, contact a site moderator: You can also contact site staff by submitting a support request » Генеральний регіонально анотований корпус української мови (ГРАК) Protemos translation business management system | Create your account in minutes, and start working! 3-month trial for agencies, and free for freelancers!
The system lets you keep client/vendor database, with contacts and rates, manage projects and assign jobs to vendors, issue invoices, track payments, store and manage project files, generate business reports on turnover profit per client/manager etc.
More info » |
| CafeTran Espresso | You've never met a CAT tool this clever!
Translate faster & easier, using a sophisticated CAT tool built by a translator / developer.
Accept jobs from clients who use Trados, MemoQ, Wordfast & major CAT tools.
Download and start using CafeTran Espresso -- for free
Buy now! » |
|
| | | | X Sign in to your ProZ.com account... | | | | | |