В Україні запустили Національний корпус кримськотатарської мови

В Україні запустили Національний корпус кримськотатарської мови

12:16,
28 Листопада 2023
1048

В Україні запустили Національний корпус кримськотатарської мови

12:16,
28 Листопада 2023
1048
В Україні запустили Національний корпус кримськотатарської мови
В Україні запустили Національний корпус кримськотатарської мови
Створено найбільшу електронну колекцію текстів кримськотатарською.

В Україні запустили Національний корпус кримськотатарської мови (НККМ) — найбільшу електронну колекцію текстів кримськотатарською, що охоплюють різні жанри та історичні епохи. Електронна база сприятиме розвитку філологічних досліджень та проєктів з використанням кримськотатарської мови, повідомила пресслужба Мінреінтеграції.

«Корпус є комплексним інструментом дослідження мови, а також фундаментом для впровадження кримськотатарської в операційних системах, онлайн-перекладачах, програмах перевірки правопису. Це практичний інструмент для лінгвістів, студентів, а також розробників, які створюватимуть системи та проєкти з використанням кримськотатарської мови», зазначили в Мінреінтеграції.

Створення НККМ було ініційовано Мінреінтеграції у межах реалізації Стратегії розвитку кримськотатарської мови на 2022–2032 роки. Проєкт реалізовує громадська організація QIRI’M Young за підтримки швейцарсько-української Програми EGAP, що виконується Фондом Східна Європа, та Київського національного університету ім. Тараса Шевченка.

Робота над створенням Корпусу тривала рік та об’єднала близько 30 учасників у різних куточках України та світу. Було проаналізовано понад 900 матеріалів, зокрема художня й наукова література, періодичні видання.

«Даний проєкт покликаний стати важливим кроком для збереження та розвитку кримськотатарської мови. За допомогою бази даних НККМ можуть створюватися нові електронні словники, а також програми для виправлення та машинного перекладу текстів кримськотатарською мовою. Такі напрацювання сприятимуть популяризації мови як у повсякденному житті, так і у науковій, літературній сферах. Крім того, лінгвістична база НККМ розширить можливості кримськотатарської мови на міжнародних технічних та освітніх майданчиках», зазначили в Національному корпусі кримськотатарської мови.

Завдяки Національному корпусу кримськотатарської мови користувачі можуть:

  • дослідити контекст використання слів;
  • знайти архаїзми/неологізми;
  • дослідити найпоширеніші та найрідкісніші колокації;
  • проаналізувати особливості мови конкретного автора і багато іншого.

Крім того, НККМ є потужним інструментом розвитку лексикографії. Його можна використовувати:

  • для пошуку найбільш ілюстративних прикладів вживання слів при створенні тлумачних словників;
  • для аналізу вживаності слів у різні епохи при створенні історичних словників;
  • для автоматичного визначення і опрацювання мови системами машинного перекладу та перевірки правопису.

Фото: НККМ

Читайте також
ГО «Детектор медіа» понад 20 років бореться за кращу українську журналістику. Ми стежимо за дотриманням стандартів у медіа. Захищаємо права аудиторії на якісну інформацію. І допомагаємо читачам відрізняти правду від брехні.
До 22-річчя з дня народження видання ми відновлюємо нашу Спільноту! Це коло активних людей, які хочуть та можуть фінансово підтримати наше видання, долучитися до генерування ідей та створення якісних матеріалів, просувати свідоме медіаспоживання і разом протистояти російській дезінформації.
* Знайшовши помилку, виділіть її та натисніть Ctrl+Enter.
Коментарі
оновити
Код:
Ім'я:
Текст:
2019 — 2024 Dev.
Andrey U. Chulkov
Develop
Використовуючи наш сайт ви даєте нам згоду на використання файлів cookie на вашому пристрої.
Даю згоду