Уперше штучний інтелект навчили говорити українською без цензури

Штучний інтелект (ШІ) уперше навчили говорити українською мовою зі сленгом і без цензури. Це зробила креативна агенції ISD Group, пише AIN.ua.

Свою версію ШІ розробники створили на базі нейромережі GPT-2 від Hugging Face. Вона дозволяє генерувати зв’язний текст, який максимально нагадує мову людей.

«Головним викликом було створити таку модель, яка зможе спілкуватися українською, як звичайна людина, зі сленгом і без цензури», – коментує гендиректор ISD Group Віктор Шкурба. Лідеркою та арт-директоркою проєкту у команді ISD була Наталія Тачинська.

Спершу створили мовний корпус нейромережі із відкритих баз словників українських розробників. За основу для претренування взяли 3 гігабайти творів українською з онлайн-бібліотек. Доповнили генератор інструментами, які допомагають будувати контекст і правильні послідовності слів.

Щоб нейромережа не «говорила» старомодно, до мовного корпусу додали субтитри сучасних фільмів, серіалів, блогів, твітів та інший контент із соцмереж. Нейромережа почала «говорити» сучасно та зі сленгом.

Вирішили не створювати нейтральну систему у форматі порадника, а піти далі й надати йому характер. «Це поганий хлопець, навіть трохи божевільний, який постійно підштовухує своїх друзів на якісь шалені вчинки», – пояснює Шкурба.

Для цього залучили молодь через відкриті ігрові телеграм-боти. Користувачі давали відповіді на питання та своїми відповідями «годували» нейромережу.

Випробувати штучний інтелект, який вміє «говорити» українською, можна тут. Проєкт створили за підтримки бренду Revo.

У 2019 році ISD Group розробила штучний інтелект AI Versus. Це соціальний експеримент, який показує вплив пропаганди на світогляд людей. Проєкт отримав «Каннського лева» в номінації Creative Data: Data storytelling, а також золоту нагороду фестивалю реклами та відео Ciclope Festival.

Читайте «Нормальні новини» в телеграмі

Уперше штучний інтелект навчили говорити українською без цензури

Інші статті на тему