Згідно з дослідженням newage, 70% українців віддають перевагу спілкуванню рідною мовою в інтернеті.
На більшості досліджених платформ відсоток коментарів українською мовою варіюється від 65% до 85%.
Після 24 лютого 2022 року ми стали свідками значного переходу на українську мову в соціальних мережах, на YouTube та у щоденному спілкуванні. Це не лише зміна мовних практик — це частина ширшої трансформації суспільства. Проте згодом виникло інше питання — чи не спостерігаємо ми зараз "відкат"? Чи дійсно ми продовжуємо рухатися в напрямку українізації, чи просто залишаємося в інформаційній бульбашці?
newage. Постійно займається обробкою даних і розробкою кампаній, що ґрунтуються на аналітичних висновках. Тому ми вирішили дослідити, як змінюється мовна ситуація в країні, використовуючи відкриті дані та засоби машинного навчання.
Ми поставили собі низку запитань:
Проблема класичних методів оцінювання мовної ситуації.
Питання мовної ситуації в Україні вже давно є предметом соціологічних досліджень, медіа-обговорень і політичних дискусій. Однак, попри активний інтерес, досі бракує об'єктивної, масштабної та регулярно оновлюваної статистики про мовні зміни в країні. Соціологічні опитування залишаються основним інструментом вивчення настроїв, але вони мають обмеження: невеликі вибірки, вплив формулювань запитань і політична заангажованість можуть спотворювати результати та їхню інтерпретацію.
В останні роки поширився аналіз пошукових запитів як індикатора суспільних змін, що вже є кроком до більш точного, data-driven підходу. Проте такі дослідження не дають розуміння мотивації користувачів і потребують серйозної інфраструктури для систематизації. Тому, щоб отримати більш комплексну картину, доцільно звернутися до аналізу поведінки користувачів у відкритому цифровому просторі (хоча навіть дані з пошуковиків уже можуть служити корисним маркером).
Методологічні підходи до дослідження
Замість того, щоб обмежуватись лише традиційними методами, ми вирішили скористатися нашою експертизою в команді newage. — роботою з даними. В умовах відкритих даних ми можемо більш точно, частіше і в масштабах вимірювати мовне середовище. Ключовим є розуміння того, що саме слід аналізувати і як з цим ефективно працювати. Тому ми розробили унікальний підхід, що об’єднує відкриті інформаційні джерела з можливостями машинного навчання.
Основою цього дослідження є базова концепція: скористатися наявними відкритими даними та обробити їх за допомогою сучасних інструментів машинного навчання. Мовне середовище охоплює не лише побутові розмови, а й коментарі на YouTube, дискусії в Telegram та оголошення на різних веб-сайтах.
Значний дисклеймер: публічний простір, навіть якщо йдеться про коментарі під відео на YouTube або повідомленнями в Telegram, не завжди повністю відображає особисте життя. Саме з цього простору починаються зміни. Тож наша мета полягає в тому, щоб фіксувати ці зміни, аналізувати їх і робити їх помітними для всіх.
Джерела даних, які ми аналізували
Для аналізу ми обрали кілька платформ, які найкраще відображають мовне середовище в публічній площині:
Як функціонує система
Для обробки великих обсягів інформації ми розробили автоматизовану систему, що складається з кількох компонентів:
Ця методологія дала нам змогу розробити універсальний інструмент, який легко масштабується, модернізується та коригується відповідно до нових джерел інформації.
Що ми виявили в інформації
Після обробки понад 300 тисяч коментарів та повідомлень на різних платформах, ми змогли побачити чітку картину мовної ситуації в онлайн-просторі. Ці дані не лише підтвердили інтуїтивні відчуття, а й дозволили подивитися на тенденції у динаміці. Виявилося, що цифрове середовище здатне дуже точно фіксувати зміни в мовній поведінці суспільства.
Проценти та зміни на платформах
Українська мова займає важливу позицію в світі онлайн-комунікацій.
У більшості великих платформ вона стала основною мовою взаємодії.
Ці канали слугують лише ілюстрацією, адже в загальному було досліджено понад 200 каналів.
Платформа для оголошень в галузі електронної комерції.
Ці результати підтверджують не лише зміни в мові, а й вибір мільйонів українців — прагнення висловлюватися і бути почутими рідною мовою.
Українська мова в регіонах: на шляху до єдності
Інформація з Telegram-каналів, що охоплюють різні міста України, яскраво ілюструє, що процес українізації відбувається не лише в західних чи центральних регіонах, але й поширюється по всій території країни, хоча і з неоднаковою швидкістю.
У західноукраїнських містах ситуація виявляється доволі потужною, як і передбачалося:
Центральні області також виявляють значні результати:
У східних та південних регіонах ситуація покращується, але українська мова все ще не домінує:
Увага! У численних ситуаціях ці показники вже збільшилися вдвічі або втричі з моменту початку повномасштабного вторгнення. Хоча це не надто позитивна ситуація, проте з кожним днем вона стає кращою.
Чи існує мовний регрес?
Це питання виникає досить часто. У соціальних мережах час від часу можна натрапити на дискусії щодо того, що "процес українізації уповільнився" або ж "спостерігається зворотний рух". І справді, після активного етапу українізації в 2022 році деякі могли відчути, що темпи змін зменшилися. Ми вирішили не покладатися на домисли, а звернутися до статистичних даних. І вони надали нам чітку відповідь.
Наше дослідження охопило численні канали на різних платформах, включаючи Telegram, YouTube та популярні e-commerce сайти. На більшості з цих ресурсів українська мова займає лідируючі позиції, а в багатьох випадках її використання продовжує зростати. Хоча темпи цього зростання можуть варіюватися в залежності від платформи, тематики або регіону, загальний тренд залишається незмінним: українська мова все більше набирає популярності.
Навіть на платформах, де можливий вплив бот-активності чи іноземної аудиторії (наприклад, Telegram), українська зберігає перевагу. У сегментах із меншою уразливістю -- таких як YouTube чи платформи з побутовими оголошеннями -- україномовність уже стала нормою.
Ще одна важлива ознака -- регіональні зміни. У містах, де традиційно переважала російська мова, ми зафіксували значне зростання україномовного контенту. Наприклад, в одеських Telegram-каналах показники виросли від 2-11% до 50%, у Харкові -- понад 45%, у Дніпрі -- стабільно понад 60%.
Це не лише короткочасна мода. Це -- постійна тенденція. Хоча процес переходу відбувається не рівномірно, він все ж триває.
Основні висновки дослідження
Після аналізу інформації з численних платформ і каналів, ми виділили кілька ключових спостережень, які сприяють глибшому розумінню актуального стану української мови в онлайн-середовищі.
Українська -- це вже нова норма
На більшості досліджених платформ відсоток коментарів українською мовою варіюється від 65% до 85%.. Повномасштабне вторгнення стало точкою зламу -- мільйони українців свідомо перейшли на українську як у публічному, так і в особистому спілкуванні.
Бульбашки формують мовне середовище
Україномовні блогери, медіа та контент-творці створюють навколо себе активні спільноти, де українська -- мова за замовчуванням. Це підсилює ефект "у нас всі говорять українською". Хоч це й не завжди відповідає загальній картині, воно має величезне значення для нормалізації української в цифровому просторі.
Контент, який ми щодекадно споживаємо, формує наші мовні звички. Українські автори відіграють ключову роль у встановленні стилю онлайн-простору, тому важливо сприяти їхньому визнанню та розвитку.
Політичні платформи під наглядом ботів.
На інформаційних та суспільно значущих платформах ми помітили активність ботів, переважно російськомовних. Такі атаки здатні спотворювати мовні дані, але водночас слугують показником вразливостей в інформаційному середовищі. Забезпечення цифрової гігієни в цьому контексті є вкрай необхідним.
Регіональні трансформації є більш складними, ніж може здаватися на перший погляд.
Не лише Київ чи Львів демонструють позитивну динаміку. Наприклад, згідно з дослідженням "Детектора медіа", в Одеській області частка людей, які розмовляють українською вдома, зросла з 26% у 2021 до 42% у 2023 році. Схожі зрушення відбуваються і в Харкові, Дніпрі, Кривому Розі. Так, шлях до рівномірної українізації ще триває, але його вже не спинити.
Ці висновки – не лише резюме дослідження. Вони слугують знаками майбутнього. Українська мова активно існує, еволюціонує та укріплюється. І це не просто теоретична концепція, а реальний факт, що підлягає вимірюванню.
Сьогодні мовна ситуація в цифрах відображає суттєві соціальні трансформації: до 2022 року україномовні коментарі становили меншість, але тепер спостерігається помітний зсув у бік української мови. Дослідження свідчать, що зміни у мовному середовищі не відбуваються за наказом, а формуються через щоденні вибори людей. Хоча цей процес і не є рівномірним, він стабільно сприяє утвердженню української мови як нової норми, навіть на популярних платформах, таких як Telegram.
Це не лише питання комунікації — це також про вибір, відповідальність та національну ідентичність. Сьогодні ми можемо впевнено стверджувати, що говоримо, пишемо і мислимо українською. За цими словами стоять не тільки наші переконання, але й конкретні статистичні дані, які свідчать про цей значний зсув.