Мінцифри збирає дані для тренування української LLM

12:30,

28 Січня 2026

1634

Версія для друку

Тренди

Що нового

30 Березня 2026

Індонезія запровадила заборону соцмереж для дітей до 16 років

29 Березня 2026

США пропонують 10 млн доларів за інформацію про іранських хакерів, що зламали пошту директора ФБР

29 Березня 2026

Укрпошта випустить марку на честь вистави театра Франка «Конотопська відьма»

29 Березня 2026

Трейлер нового «Гаррі Поттера» став найпопулярнішим в історії HBO

28 Березня 2026

Вебсайт Єврокомісії зазнав кібератаки

Що нового

Помітили помилку?
Виділіть її та натисніть Ctrl + Enter —
ми виправимo

Мінцифри збирає дані для тренування української LLM

Валерія Буняк

12:30,

28 Січня 2026

1634

Версія для друку

Автори:

Валерія Буняк

Інтегрувати свої знання можуть представники медіа, наукової і освітньої сфери, бізнесу та інші.

Міністерство цифрової трансформації збирає дані для тренування національної великої мовної моделі LLM. Поділитися своїми текстами закликають представників медіа, наукової і освітньої сфери, бізнесу та інших. Про це повідомили на сайті Мінцифри.

«Національна LLM стане базою для створення ШІ-помічників у держсекторі та бізнесі. Це будуть українські аналоги Gemini та ChatGPT: такі ж зручні та технологічні, але навчені на наших реаліях і контексті.

Чекаємо на партнерів із різних сфер — бізнесу, освіти, науки та культури. Якщо у вас є якісні тексти українською — ви нам потрібні. Ваш контент стане фундаментом для національного ШІ, який даватиме відповіді мільйонам українців», — ідеться в повідомленні.

Для тренування моделі потрібні такі дані:

Медіа: новини, інтерв’ю, блоги, публіцистика.
Наука та освіта: контент курсів, підручники, наукові роботи, дисертації.
Література: художні твори, критика, рецензії.
Історія: оцифровані архівні матеріали.
Бізнес-дані: технічна документація, описи товарів, відкриті відгуки, матеріали корпоративних блогів.

Для захисту інтелектуальної власності Мінцифри підготувало прозорі юридичні умови. Усіх партнерів, які зроблять внесок у розвиток технології, офіційно відзначать в підсумковому звіті про розробку національної моделі.

Охочі інтегрувати свої знання в українську LLM можуть залишити заявку в короткій формі за посиланням.

Нагадаємо, в липні 2025 року Мінцифри разом із «Київстаром» розпочали розробку національної великої мовної моделі — штучного інтелекту, що має стати українською відповіддю ChatGPT.

У серпні міністерство повідомило, що розробляє AI Factory — перший державний проєкт для запуску та масштабування продуктів зі штучним інтелектом в Україні. Михайло Федоров тоді казав, що ціль України — до 2030 року ввійти до трійки світових лідерів у сфері ШІ.

Мінцифри спільно з Nvidia працюватимуть над розбудовою в Україні суверенного штучного інтелекту. Першим проєктом стане розробка мовної моделі Diia AI LLM.

У грудні стало відомо, що національну велику мовну модель тренуватимуть на моделі Gemma 3 від Google. Вибрану модель адаптують до української мови.

Ілюстрація: Мінцифри

Читайте також

Мінцифри не планує впроваджувати повістки в «Дії»

Кухар, коуч і редактор: у вайбері запустили п'ять тематичних ШІ-асистентів

МЗС припинило використання ШІ-аватара Вікторії через низьку зацікавленість медіа

У Львові запустили пілотний 5G-зв’язок

В Україні стартувала реєстрація на техатон Teens in AI 2026

У 2026 році у трьох містах України планується пілотний запуск 5G, — Мінцифри

Україна піднялася на 14 сходинок за рік у світовому рейтингу з ШІ

Українську LLM тренуватимуть на моделі Gemma від Google

ГО «Детектор медіа» понад 20 років бореться за кращу українську журналістику. Ми стежимо за дотриманням стандартів у медіа. Захищаємо права аудиторії на якісну інформацію. І допомагаємо читачам відрізняти правду від брехні.
До 22-річчя з дня народження видання ми відновлюємо нашу Спільноту! Це коло активних людей, які хочуть та можуть фінансово підтримати наше видання, долучитися до генерування ідей та створення якісних матеріалів, просувати свідоме медіаспоживання і разом протистояти російській дезінформації.

Долучитись

* Знайшовши помилку, виділіть її та натисніть Ctrl+Enter.

Теги: