Українську мовну модель LLM натренують на моделі Gemma від Google

14:23, 01.12.2025

Вибрану модель адаптують до української мови. (Фото: Мінцифри)

На моделі Gemma-3 від Google тренуватимуть нацональну велику мовну модель (LLM).

Як інформує УМ, про це повідомило Міністерство цифрової трансформації.

«Разом з «Київстар» обрали велику мовну модель, на якій тренуватимуть національну українську LLM, — нею стане Gemma 3 від Google», - йдеться, зокрема, в повідомленні.

Як наголошують у Мінцифри, серед ключових переваг обраної моделі - оптимальний баланс продуктивності та ресурсів (Gemma – одна з найкращих серед відкритих моделей з погляду співвідношення розміру та якості), її багатомовність (вона вже має українську мову у своєму діапазоні та легко адаптується через донавчання), мультимодальність (вміння сприймати й аналізувати не лише текст, а й зображення), розширений токенайзер (Gemma має довге контекстне вікно — це 128 тисяч токенів) тощо.

Щоб покращить роботу моделі від Google з українською мовою, зменшити помилки при створенні україномовних текстів, планується вдосконалити український токенайзер, донавчити її на унікальних україномовних текстах, створити тести для більш точного налаштування для подальшого використання.

Додамо, що Мінцифри починає роботу над створенням AI Factory – інфраструктури, на якій працюватимуть ключові державні сервіси зі штучним інтелектом.

Як повідомляла УМ, Перший словник термінів зі сфери ШІ створили в Україні – Мінцифри.

Теги:
мова

наука

Україна

Cтатті по темі

Позиції України у війні зараз найміцніші - президент Фінляндії

На його переконання, Україна готова до миру на відміну від росії. >>
Росія знищує українські книжки: за липень втрачено понад 1,5 млн примірників, фото

Атакуючи друкарні, склади з видавничою продукцією, росія знищує українські книжки, тому відновлення друкарень і підтримка видавничої галузі — питання культурної стійкості та національної безпеки. >>
Канали низки підсанкційних РНБО російських та проросійських артистів заблоковано в Україні

На території України Ютуб заблокував канали низки підсанкційних РНБО російських та проросійських артистів. >>
Десятки загиблих і поранених: на Київщині ракети влучили по виставці озброєння, фото

Російські окупаційні війська вдень 24 липня завдали удару по Київщині, в результаті чого загинули щонайменше десятеро людей і є десятки постраждалих. Під удар потрапила виставка озброєння. >>
Правда, якої не знає президент Польщі Навроцький

11 липня 2026 року, у польський день пам’яті жертв Волинської трагедії, президент Польщі Кароль Навроцький виступив у прикордонному селі Радруж і заявив, що домагатиметься законодавчої заборони червоно-чорного прапора на території Польщі. >>
Невтішна статистика: смертність в Україні у чотири рази перевищує народжуваність

В Україні за перші 6 місяців 2026 року народилися 73 292 дитини, тоді як померли 259 853 людини. Таким чином, смертність майже вчетверо перевищує народжуваність. >>