Декількома словами
Новий інструмент OpenAI для генерації зображень Imagen став вірусним завдяки можливості відтворювати стиль Studio Ghibli. Це спричинило безпрецедентний сплеск використання ChatGPT, підкреслило прогрес у якості ШІ-зображень, але водночас порушило питання авторського права та викликало дискусії про вплив штучного інтелекту на людську творчість і майбутнє мистецтва.

Компанія OpenAI оголосила цього вівторка, що її новий інструмент Imagen тепер доступний для всіх користувачів, а не лише для платних підписників. Через тиждень після запуску Imagen, однак, асоціюється з одним ім'ям: японською анімаційною студією Ghibli. Мільйони людей використали новий інструмент для відтворення сімейних чи історичних фотографій у стилі студії легендарного Хаяо Міядзакі. Чомусь інструкції щодо цих мемів поширилися серед людей, які зазвичай займаються іншими речами. Наприклад, один користувач у соціальній мережі запропонував завантажити фото з промптом: «перетворити це фото на аніме в стилі студії Ghibli».
Попри те, що зображення, згенеровані ШІ, мали свій початковий момент слави ще до появи ChatGPT, схоже, зараз вони стали ще популярнішими. Використання ChatGPT зросло до небаченого рівня за останні 12 місяців, згідно з Google Trends, порівняно з Grok, ШІ від X, який також мав помітний тиждень.
(Графік: Глобальні пошукові запити ChatGPT (синій) та Grok (жовтий) за останні 12 місяців, згідно з Google Trends.)
Сем Альтман, співзасновник OpenAI, заявив, що ніколи не бачив подібного попиту, і що користувачі приєднувалися до програми мільйонами. Це не так багато, коли, за словами самого Альтмана, чат-бот вже має 700 мільйонів щомісячних користувачів. Але мільйон користувачів «за годину» все ще вражає. Що сталося? Важко дати одну відповідь, але ось кілька варіантів.
1. Зображення безперечно кращі
Ось так виглядало зображення Ghibli, згенероване іншим ШІ у 2022 році: (Опис зображення: Єгипетський фараон на троні під прапором, у стилі Тоторо студії Ghibli).
Ось інший, кращий приклад, але який, ймовірно, вимагав значних зусиль на той час: (Опис зображень: Кілька зображень Сан-Франциско у стилі Ghibli, згенерованих за допомогою stable diffusion, що демонструють теплі кольори стилю).
Тепер же зробити це можна одним кліком для 700 мільйонів користувачів. Це інакше. Вже не просто «помітно, що це ШІ». Ghibli — лише один приклад можливостей, але чомусь сам Альтман обрав саме цей стиль для оголошення запуску.
Чому це не просто черговий мем? По-перше, тому що він перетнув межу віральності. Вже не лише діляться мемом, тепер мільйони анонімних користувачів генерують свої сімейні фото у стилі Ghibli. Також, звісно, це зробили знаменитості, політики і навіть армії. Наприклад, ізраїльські сили оборони опублікували своє зображення в цьому стилі.
В Іспанії Антоніо Ортіс, технологічний аналітик, був одним із перших, хто вірусно поширив мем у стилі Ghibli: «Це просто модний мем чи свідчення потужності чогось більшого? Я б сказав, і те, і інше», — каже він. «Щодо мему, очевидно, його життєвий цикл буде коротким. Однак технологічний прогрес іде набагато далі. Те, що запропонувала OpenAI, відрізняється від класичних моделей генерації зображень, які ми мали досі. Це значно підвищує рівень розуміння ваших намірів та роботи з семантикою того, що є на зображенні», — додає він.
Питання в тому, чи зможе мем, на цьому етапі повторення, вплинути на сам бренд: чи зможемо ми так само сприймати Тоторо чи Чіхіро, знаючи, що ШІ може їх просто скопіювати?
2. А як щодо прав?
Сьогодні навіть аватар Сема Альтмана в X — це зображення, зроблене у стилі Ghibli. Хоча стиль не захищений авторським правом, на відміну від творів, безцеремонне використання Ghibli викликало дискусію, яку часто затьмарюють все нові й нові зображення.
OpenAI, мабуть, уже знала, що закони в Японії більш поблажливі. Для відтворення стилю Ghibli, безперечно, OpenAI мала б використовувати зображення з фільмів Studio Ghibli: «Це могло б призвести до позову про порушення авторських прав», — пише у своєму блозі Андрес Гуадамус, професор інтелектуальної власності в Університеті Сассекса (Великобританія). «Однак справа була б не такою очевидною, як багато хто стверджує. Припускаючи, що Studio Ghibli подала б позов у Японії, першою перешкодою було б те, що японське законодавство про авторське право має широкий виняток для аналізу текстів і даних, що, очевидно, дозволяє такий тип навчання з комерційною метою».
Мало того: кількість зображень Ghibli у відкритому доступі в інтернеті вже мала бути величезною.
«Є причина, чому контент Studio Ghibli так легко відтворити: він є по всьому інтернету, зі скріншотами на форумах, гіфками в соціальних мережах… Порушники — це ми. Ми надаємо дані. В інтернеті доступний контент Ghibli за три десятиліття», — додає Гуадамус.
3. Людська меланхолія
OpenAI вже бере участь в інших судових процесах щодо прав. Поза правовою битвою, цей новий мем та його досконалість поглибили більшу і щодня поширенішу проблему: ШІ — це серйозно, дуже серйозно. Важко втекти від цієї меланхолії. Професор та експерт зі ШІ Ітан Моллік повертається до цього повідомлення щоразу, коли відбувається ще один символічний крок: «Я не можу повністю довіряти людям, які хоч трохи не деморалізовані деякими останніми досягненнями ШІ».
Дизайнер та засновник студії Mendesaltaren Денні Сальтарен написав про Ghibli довге повідомлення в X, сповнене також людяності перед неминучим наступом машини: «Усі, і коли я кажу всі, то це всі, референси доступні для втручання будь-кому. Це означає, що будь-хто може генерувати чи створювати. Проблема залишається там же: мало людей мають хороші референси чи смак. Тепер у нас буде світ, повний речей без душі, без суті, нібито красивіших, а нормою стане несмак», — пояснив він пізніше Джерело новини.
У своєму повідомленні він намагався знайти пояснення для виживання людської праці якимось чином: «Тепер усе краще, так, але й стандартніше. Правильніше. І нудніше. Ми просимо ChatGPT не помилятися. Незабаром ми проситимемо його помилятися. Випадково. Щоб нас не викрили. Щоб ніхто не помітив, що ми перестали творити і почали імітувати. Щоб обманювати. Щоб вдавати, ніби ми все ще здатні. Хоча насправді ми здатні лише просити. Просити машину бути людянішою за нас», — писав він.
Можливо, одна справа — досконалість машини. Рік тому ютуберка DamiLee запитувала: «Чому фільми Studio Ghibli не можна було б зробити за допомогою ШІ». Цього понеділка дехто прокоментував, що «це відео погано постаріло». «Що ви маєте на увазі?», — відповіла DamiLee. «Ви думаєте, що генерація зображень у «стилі» Ghibli — це те саме, що створення фільму Ghibli? І ви вважаєте, що ці зображення можуть вловити «душу» їхніх фільмів? Я запитую серйозно», — сказала вона.
Не потрібно бути експертом у фільмах Ghibli, щоб відрізнити справжній кадр від імітації ШІ. Один користувач порівняв детальність сцени Міядзакі (яка зайняла у аніматора Studio Ghibli 15 місяців) з версією ChatGPT (яка зайняла близько 30 секунд), зазначивши, що це багато говорить про мистецтво ШІ проти людського.
Ймовірно, ШІ також досягне такого рівня деталізації в кадрі. Але все одно бракуватиме решти фільму: «Чому Ghibli досі виживає? Тому що ми вирішили йти у протилежному напрямку від тренду», — казав Хаяо Міядзакі. «Я ніколи не думав про домінування на ринку чи перемогу в конкуренції. Легше, якщо все йде в одному напрямку, бо тоді ми можемо йти в протилежному. Якщо у вас немає такого мислення, неможливо встигати за цим суспільством масового споживання та мінливих тенденцій».