Штучний інтелект змінює ринок аудіокниг: дешеві синтетичні голоси витісняють дикторів

Штучний інтелект змінює ринок аудіокниг: дешеві синтетичні голоси витісняють дикторів

Декількома словами

Використання штучного інтелекту для озвучення аудіокниг стрімко зростає, суттєво знижуючи витрати та час виробництва. Це вигідно видавництвам і розширює доступ до контенту, але викликає занепокоєння у професійних дикторів та порушує питання прозорості та прав на використання голосових даних.


Звучить напрочуд природно. Гарна дикція, слова плавно поєднуються, утворюючи вільні фрази з необхідними паузами. Інтонація та швидкість мовлення теж здаються людськими. Але це не так. Ми слухаємо аудіокнигу, яку озвучив штучний інтелект, а не професійний диктор. Ця тенденція викликає серйозне занепокоєння серед дикторів, чиї доходи вже відчутно знижуються. Водночас, видавнича індустрія бачить у цьому шлях до демократизації публікації аудіокниг, роблячи їх доступними не лише великим гравцям ринку.

Ринок аудіокниг перебуває у фазі активного зростання. За оцінками галузевих експертів, його обсяг значно збільшується з року в рік. Переважна більшість користувачів обирає моделі підписки.

Консультанти та підприємці, що працюють у сфері подкастів та аудіокниг, прогнозують, що синтетичні голоси можуть кількісно випередити людські в озвученні аудіокниг вже до кінця цього десятиліття, можливо, навіть раніше. Наразі у світі є близько 1,3 мільйона аудіокниг, озвучених людьми. Однак темпи зростання виробництва з використанням ШІ, особливо на зрілих ринках, таких як США та Велика Британія, свідчать про неминучість такої зміни.

Керівники видавництв підтверджують, що ринок аудіокниг, створених за допомогою ШІ, готовий до бурхливого розвитку. Деякі компанії активно інвестують у власні технології, адаптовані під потреби видавничої справи. Це дозволяє суттєво прискорити процес: готову аудіокнигу можна отримати всього за півтора дня, тоді як студійна робота займає тижні. Важливо зазначити, що ці інструменти передбачають людське курування для забезпечення певного рівня якості.

Головна перевага синтетичних голосів — значне скорочення виробничих витрат. Озвучення аудіокниги за допомогою ШІ може бути щонайменше у 10 разів дешевшим. У той час як студійна робота над книгою обсягом близько 380 сторінок може коштувати 3500-5000 євро, використання ШІ знижує цю суму до 200-300 євро. Це відкриває двері для невеликих видавництв, даючи їм можливість вийти на ринок аудіокниг. Експерти погоджуються, що для слухачів доступ до більшої кількості контенту завдяки ШІ є чудовим, але визнають, що професіонали, такі як диктори, перекладачі та ілюстратори, стикаються з серйозними викликами. Людські голоси, імовірно, залишаться затребуваними для преміальних продуктів або художніх творів, де важлива емоційна складова.

Професійні диктори підтверджують, що штучний інтелект вже суттєво вплинув на їхні доходи, знизивши їх, за деякими оцінками, на 50% за останні кілька років. ШІ перебирає на себе озвучення контенту, який не потребує сильної емоційної залученості, наприклад, документалістики чи публіцистики. Ця тенденція, на їхнє переконання, буде лише посилюватися.

Якість синтетичних голосів значно покращилася за останні два роки. Хоча вони переважно використовуються в нехудожній літературі, де нюанси інтерпретації мають меншу вагу, відрізнити їх від людських стає дедалі складніше. Фахівці індустрії вірять, що людські голоси не зникнуть з аудіокниг повністю, особливо в художній літературі, де потрібна передача пристрасті та емоцій. Однак дослідження показують, що для есе та науково-популярних текстів споживачам менш важлива особа наратора.

Деякі платформи використовують ШІ не тільки для озвучення, але й для розширення функціоналу для слухачів. Наприклад, пропонуються опції, що дозволяють перемикатися між різними голосами (як синтетичними, так і людськими) для однієї книги, персоналізуючи досвід прослуховування. Такі функції покликані доповнювати, а не замінювати людських нараторів, і можуть допомогти утримати користувачів, які відмовлялися від книги через невідповідний голос.

Гостро стоїть питання прозорості: як слухачеві дізнатись, чи озвучена аудіокнига людиною чи ШІ? Синтетичні голоси вже дуже реалістичні, особливо в нехудожній літературі. Відрізнити їх від людських часто складно, а деякі платформи чи видавництва додатково ускладнюють ситуацію, не вказуючи явно метод озвучення.

Існують кричущі випадки, коли видавці маскують використання ШІ, надаючи синтетичним голосам людські імена або навіть створюючи цілі «родини» голосів з одним прізвищем. Це, на думку професійних акторів дубляжу та дикторів, є не тільки не етичним, але й позбавляє споживача важливої інформації про те, що він слухає штучний голос.

В індустрії активно обговорюються стандарти маркування аудіокниг, озвучених ШІ. Пропонується розрізняти «голоси ШІ» (синтезовані з багатьох джерел) та «авторизовані копії голосу» (створені на основі записів конкретного диктора за його згодою). Наголошується на відповідальності видавців за належне позначення використання ШІ в метаданих. Деякі асоціації вважають за доцільне повідомляти про це, якщо щонайменше 10% озвучення виконано синтетичними інструментами. З огляду на поширення аудіокниг, озвучених ШІ, життєво важливим є створення єдиної міжнародної системи маркування.

Наразі не всі учасники ринку готові відкрито заявляти про використання ШІ в озвученні, побоюючись, що це може бути сприйнято споживачами як ознака низької якості. Експерти порівнюють це із ситуацією в харчовій промисловості: якби споживачі знали всі інгредієнти, можливо, вони відмовилися б від купівлі деяких продуктів.

Однак ця ситуація, ймовірно, зміниться. Нове законодавство, зокрема в Європі, зобов'язує маркувати результати, згенеровані ШІ, щоб їх штучний характер був очевидним, і передбачає значні штрафи за недотримання. Юристи, що спеціалізуються на цифровому праві, підтверджують, що це стосується і озвучення аудіокниг, оскільки голос є формою інтерпретації.

Великі платформи вже впроваджують ШІ для озвучування частини своїх бібліотек через партнерства з видавництвами. Вони заявляють, що аудіокниги, створені синтетичними голосами, чітко ідентифікуються.

Видавництва також усвідомлюють потенційні юридичні проблеми, пов'язані з публікацією аудіокниг, створених за допомогою ШІ. Окрім маркування, ключовим питанням є права на синтетичні голоси. Необхідна чітка простежуваність та визначення джерела голосу. З'являються агентства, що спеціалізуються на представленні «клонованих» голосів, дозволяючи професійним дикторам ліцензувати свої голосові моделі за роялті та надаючи видавництвам сертифікати, що підтверджують авторизоване використання голосу.

Read in other languages

Про автора

<p>експерт із глибокого аналізу та фактчекінгу. Пише аналітичні статті з точними фактами, цифрами та перевіреними джерелами.</p>