ms.detector.media
Валерія Буняк
28.01.2026 12:30
Мінцифри збирає дані для тренування української LLM
Мінцифри збирає дані для тренування української LLM
Інтегрувати свої знання можуть представники медіа, наукової і освітньої сфери, бізнесу та інші.

Міністерство цифрової трансформації збирає дані для тренування національної великої мовної моделі LLM. Поділитися своїми текстами закликають представників медіа, наукової і освітньої сфери, бізнесу та інших. Про це повідомили на сайті Мінцифри. 

«Національна LLM стане базою для створення ШІ-помічників у держсекторі та бізнесі. Це будуть українські аналоги Gemini та ChatGPT: такі ж зручні та технологічні, але навчені на наших реаліях і контексті.

Чекаємо на партнерів із різних сфер — бізнесу, освіти, науки та культури. Якщо у вас є якісні тексти українською — ви нам потрібні. Ваш контент стане фундаментом для національного ШІ, який даватиме відповіді мільйонам українців», — ідеться в повідомленні. 

Для тренування моделі потрібні такі дані:

Для захисту інтелектуальної власності Мінцифри підготувало прозорі юридичні умови. Усіх партнерів, які зроблять внесок у розвиток технології, офіційно відзначать в підсумковому звіті про розробку національної моделі.

Охочі інтегрувати свої знання в українську LLM можуть залишити заявку в короткій формі за посиланням.

Нагадаємо, в липні 2025 року Мінцифри разом із «Київстаром» розпочали розробку національної великої мовної моделі — штучного інтелекту, що має стати українською відповіддю ChatGPT.

У серпні міністерство повідомило, що розробляє AI Factory — перший державний проєкт для запуску та масштабування продуктів зі штучним інтелектом в Україні. Михайло Федоров тоді казав, що ціль України — до 2030 року ввійти до трійки світових лідерів у сфері ШІ.

Мінцифри спільно з Nvidia працюватимуть над розбудовою в Україні суверенного штучного інтелекту. Першим проєктом стане розробка мовної моделі Diia AI LLM.

У грудні стало відомо, що національну велику мовну модель тренуватимуть на моделі Gemma 3 від Google. Вибрану модель адаптують до української мови.

Ілюстрація: Мінцифри

ms.detector.media