Українську мовну модель LLM натренують на моделі Gemma від Google

14:23, 01.12.2025

Вибрану модель адаптують до української мови. (Фото: Мінцифри)

На моделі Gemma-3 від Google тренуватимуть нацональну велику мовну модель (LLM).

 

Як інформує УМ, про це повідомило Міністерство цифрової трансформації.

 

«Разом з «Київстар» обрали велику мовну модель, на якій тренуватимуть національну українську LLM, — нею стане Gemma 3 від Google», - йдеться, зокрема, в повідомленні.

 

Як наголошують у Мінцифри, серед ключових переваг обраної моделі - оптимальний баланс продуктивності та ресурсів (Gemma – одна з найкращих серед відкритих моделей з погляду співвідношення розміру та якості), її багатомовність (вона вже має українську мову у своєму діапазоні та легко адаптується через донавчання), мультимодальність (вміння сприймати й аналізувати не лише текст, а й зображення), розширений токенайзер (Gemma має довге контекстне вікно — це 128 тисяч токенів) тощо.

 

Щоб покращить роботу моделі від Google з українською мовою, зменшити помилки при створенні україномовних текстів, планується вдосконалити український токенайзер, донавчити її на унікальних україномовних текстах, створити тести для більш точного налаштування для подальшого використання.

 

Додамо, що Мінцифри починає роботу над створенням AI Factory – інфраструктури, на якій працюватимуть ключові державні сервіси зі штучним інтелектом.

 

Як повідомляла УМ, Перший словник термінів зі сфери ШІ створили в Україні – Мінцифри.