У червні Міністерство цифрової трансформації України та оператор мобільного зв’язку «Київстар» уклали меморандум про співпрацю, який передбачає розробку національної великої мовної моделі (LLM). За словами віцепрем’єр-міністра з інновацій Михайла Федорова, це завдання підтвердить технологічні амбіції України та її місце серед лідерів у галузі штучного інтелекту. Міністерство виконуватиме координацію розробки, формуючи технологічні та етичні принципи, а також займатиметься збором даних для навчання моделі.
Під час презентації проєкту представники Укрінформу поспілкувались з керівником центру розвитку та впровадження рішень у сфері штучного інтелекту Міністерства цифрової трансформації, Данилом Цьвоком, стосовно особливостей національної LLM, даних для її навчання та реальних вигод від її впровадження для українців.
— Не так давно Мінцифри оприлюднило інформацію про початок розробки національної великої мовної моделі (LLM). Чому цей проєкт є важливим для України і в чому полягає перевага наявності власної моделі для розвитку AI-рішень?
Вітчизняна LLM враховуватиме особливості української історії, діалектів, культурних аспектів тощо.
— Велика мовна модель (LLM) стане основою для широкого впровадження AI-продуктів в державному секторі та бізнесі: AI-допоміжників, чат-ботів і так далі. За своїм функціонуванням LLM – це “інтелектуальний механізм”, що відповідає на запити користувача. Здатність моделі писати, редагувати тексти та програмний код подібна до роботи людського мислення. Вона навчається з різних джерел даних, і наявна інформація впливає на результати її роботи.
Сьогодні багато країн, прагнучи створити національні моделі, конкурують з глобальними комерційними аналогами. Наразі налічується понад 25 таких моделей. Для України переваги створення власної версії полягають у якості, безпеці та економічності.
Використання української моделі буде більш економним в порівнянні з іноземними варіантами.
На даний час в Україні не існує великої мовної моделі, адаптованої до національних умов. Наша модель буде більш якісною за англомовні аналоги. По-перше, ми плануємо зібрати та структурувати українські дані, що становитимуть основний контекст для навчання. Наша модель зможе враховувати українську культуру, традиції та історію. Наприклад, вона однозначно відповідатиме на питання «Чий Крим?», закладаючи основи національної цифрової ідентичності в галузі AI.
По-друге, питання безпеки. Всі дані, які буде обробляти українська LLM, залишатимуться в межах держави, не потрапляючи за кордон. У сучасному цифровому середовищі, особливо в сфері штучного інтелекту, неможливо забезпечити незалежність без створення власної суверенної AI-моделі.
По-третє, економічна ефективність – використання національної моделі обійдеться дешевше, ніж співпраця з іноземними аналогами.
— Виходить, ми не створюємо щось абсолютно нове, правильно? Переважно мова йде про адаптацію та вдосконалення уже існуючих рішень з глобальної практики?
— Так, це правда. Існують вже відкриті мовні моделі, які були навчені на загальнодоступних даних. Кожен має змогу їх завантажити та використовувати на власній інфраструктурі. Тому для створення національної моделі ми будемо спиратися на open-source рішення – це швидший і дешевший варіант у порівнянні з розробкою з нуля. Ми візьмемо базову модель і доповнимо її українськими даними.
— Які фактори визначатимуть вибір базової моделі для навчання?
— Перш за все, це технічні показники: гнучкість, архітектура та можливість масштабування. Важливо також, наскільки легко модель адаптується до української мови. Додатково ми будемо враховувати, на яких даних навчена модель і її реакції на певні запитання. Наприклад, на запитання «Чий Крим?» різні моделі можуть мати різні відповіді. Ми шукаємо модель, яку легше всього дотренувати під українські дані та контекст.
— На яких даних передбачається навчати національну LLM?
Наша модель зможе аналізувати інформацію з української перспективи.
— Чимало даних буде отримано з відкритих джерел. Проте унікальність нашої моделі полягатиме в тому, що вона переважно базуватиметься на інформації, яка загальнодоступна, але ще не опублікована в інтернеті. Ми плануємо акумулювати дані із наукових робіт, державних архівів (без чутливої інформації), з бібліотек та інших джерел. Завдяки цим даним наша модель зможе аналізувати інформацію, виходячи з українського контексту. Для цього будемо співпрацювати з університетами, науковими установами, національними бібліотеками.
Хочемо підкреслити, що жодні особисті дані до моделі не потраплять. Навіть при обробці документів з державних органів усі дані підлягатимуть анонімізації.
— Які зміни з’являться для звичайних користувачів із виникненням національної AI-моделі? Чи плануються оновлення в «Дії»?
— На приклад, ми скоро запустимо AI-асистента в «Дії». Ми працюємо над тим, щоб цей асистент давав чіткі та коректні відповіді, але з впровадженням української LLM якість відповідей значно зросте. Це стосується всіх продуктів, які будуть засновані на нашій національній моделі.
— Удосконалений AI-помічник – це той, з ким неможливо буде зрозуміти, спілкуєшся ти з людиною чи штучним інтелектом?
— Не лише в спілкуванні справа. Основна мета AI-помічника в «Дії» – не тільки давати відповіді на запитання, але й визначати, яка послуга потрібна вам у конкретній ситуації, надаючи її. Вам не доведеться переходити між різними сторінками – «Дія» зможе надіслати вам потрібну інформацію прямо в чат.
— Який економічний ефект очікується від реалізації цієї ініціативи?
Завдяки українській LLM всі чутливі дані залишаться в межах держави, оскільки вона працюватиме на вітчизняній інфраструктурі.
— Складно дати точну оцінку наразі, оскільки LLM вплине на багато секторів і процесів. По-перше, це призведе до економії коштів у державному секторі. З іншого боку, доступ до мовної моделі спонукатиме бізнес створювати нові AI-продукти, бо український штучний інтелект стане доступним і якісним.
Можемо з упевненістю стверджувати, що українська LLM буде більш економною, ніж використання комерційних моделей від іноземних компаній через API. До того ж, API не покриває всі аспекти використання ШІ, особливо у сфері оборони. Використовуючи API, дані часто потрапляють за кордон. У той час як українська LLM функціонуватиме на національному рівні, гарантуючи збереження чутливої інформації в країні.
— Коли очікувати запуск української LLM?
— Перший етап реалізації заплановано на 9 місяців. Після цього ми будемо вдосконалювати систему, збирати та обробляти нові дані. Також плануємо провести оцінку моделі на предмет етичності та відсутності дискримінаційних елементів (Human Evaluation). Для координації цього процесу створено етичний комітет з фахівцями у відповідних сферах. Отже, роботи ще багато, але ми вже активно працюємо.
Юлія Абакумова, Київ