Що може розкрити ШІ про каталонську літературу? Три літературні експерименти змушують нас читати Мерсе Родореду, Кіма Монзо, Ірен Сола або Жузепа Пла по-новому

Декількома словами

Стаття розглядає літературні експерименти з використанням штучного інтелекту для аналізу стилів відомих каталонських письменників, таких як Мерсе Родореда, Жузеп Пла та Кім Монзо. Дослідження виявляє цікаві закономірності у виборі слів та стилістичних особливостях авторів, пропонуючи нові перспективи для розуміння їхньої творчості.


Що може розкрити ШІ про каталонську літературу? Три літературні експерименти змушують нас читати Мерсе Родореду, Кіма Монзо, Ірен Сола або Жузепа Пла по-новому

Коли було винайдено фотографію, публіка мусила навчитися дивитися на живопис по-новому.

Вже не вистачало технічного захоплення, тепер потрібно було знайти щось магічне, здатне вийти за межі представлення реальності. З тих пір, як ми можемо сказати, що текст виглядає написаним за допомогою ChatGPT, ми читаємо і пишемо так, ніби робот дивиться на нас через плече, гіперсвідомість, яка говорить нам, що зараз важливіше, ніж будь-коли, не піддаватися процедурним дієсловам і екстравагантним прикметникам. Як ми читаємо наших улюблених авторів зараз, коли є моделі, здатні їх імітувати? Що може розкрити штучний інтелект про геній Жузепа Пла чи Мерсе Родореду? Щоб відсвяткувати Сант Жорді, ми вирішили це дослідити. Більше інформації: Вибір критиків Quadern на Сант Жорді 2025. Родореда любить дивитися.

Одного дощового зимового дня я пішов у майстерню колективу Estampa (Даніель Пітарч, Пау Артігас, Рок Альбалат, Марсель Піє і Марк Падро) в районі Грасія. В кутку з десяток людей дивилися на екран, яким маніпулював один з них. На столі - премія «Місто Барселона», яку вони отримали напередодні. Її отримав проєкт «Картографія генеративного ШІ», карта, яка перетворює штучний інтелект, такий ефемерний, на те, чим він є насправді: сукупність ресурсів, механізмів і людської діяльності. Журі говорило про «прозорість і доступність», тому що одним із стовпів цієї групи програмістів, режисерів і дослідників є зняття штучного інтелекту з всемогутнього п'єдесталу, який він зазвичай займає, і надання йому матеріальності. Ми так звикли до технократів, які домінують в інтернеті, що очікували б від них зарозумілості тих, хто завоював об'єктивні знання, але в їхніх пропозиціях я знаходжу грайливу цікавість до всього, що вислизає. Я нічого не знаю про інженерію та програмування, але я читав есе Бена Блатта «Улюбленим словом Набокова є ліловий» (Simon & Schuster). Опубліковане в 2017 році, коли ми більше говорили про великі дані, ніж про штучний інтелект, це есе ставило такі об'єктивні стратегії, як статистичний аналіз, на службу такій суб'єктивній і романтичній меті, як з'ясування того, що нас спокушає в чиємусь письмі. Виявляється, письменники, яких історично вважали хорошими, використовують менше прислівників, ніж інші; що протягом останніх десятиліть бестселери зменшували діапазон слів; або, як говорить назва, улюбленим словом Набокова є «ліловий». Це не єдиний експеримент, який намагався поєднати статистику і літературу: в інтернеті неважко знайти інструменти з відкритим кодом, які дозволяють витягувати оцінку будь-якого тексту і навіть перетворювати його на декоративний постер. Вся принадність полягає в тому, що алгоритм перестає бути загрозою, яка замінить письменників, і стає інструментом для їх кращого слухання.

Натхненні Блаттом, ми хотіли прочитати наших авторів по-новому. Ми вирішили відокремити улюблені слова чотирьох письменників, двох живих і двох мертвих, дуже відомих і читаних, тому що ми хотіли перевірити, чи результат викликає ефект розпізнавання упереджених ідей або ж дивності. В Estampa виділили всі слова з творів Жузепа Пла, Мерсе Родореди, Сержі Памієса та Ірен Сола (вони описали це як «розривання намиста з перлів»), видалили найпоширеніші слова (артиклі, прийменники або дуже процедурні дієслова), а також ті, які повторювалися в подібних пропорціях між усіма чотирма. Тобто, витягнуті слова не є точно найбільш вживаними, а тими, які статистично вважаються найбільш ідіосинкратичними після порівняння між собою. Найбільше вражає в результаті те, що він так мало вражає. У списку кожного є щось захоплене, що змушує думати, що, коли ми читаємо, наш мозок також працює як статистична машина, яка робить висновки на основі повторень. Ми думаємо, що вловлюємо таємницю, але ми також рахуємо слова. Майже непристойно перевіряти, що, якщо сьогодні ми думаємо, що Пла є найкращим у поєднанні реальності та літератури, це також трохи тому, що він наполягав на включенні реальності у свою літературу. Здається, немає нічого більш творчого, ніж бути систематичним.

Схеми з улюбленими словами Мерсе Родореди (зверху зліва), Жузепа Пла (зверху справа), Ірен Сола (знизу зліва) і Сержі Памієса (знизу справа) ESTAMPA

Детектор статистичних особливостей говорить нам, що слово, яке найкраще передає поетику Родореди, займає 0,355% її творів і є «дивитися». Вона все ще більше використовує «бачити», 0,541%, і «очі», 0,443%, але алгоритм змушує нас помітити, що вони занадто загальні, щоб відрізнити її від інших трьох авторів. Лише рік тому Неус Пеналба опублікувала есе «Голод в очах, цемент в роті» (3i4), де, говорячи про «окулярцентричний наратив», збирає відповіді Родореди на «Анкету Пруста» 1979 року: «—Моє улюблене заняття? —Дивитися [...]. —Яке було б моє найбільше нещастя? —Не могти дивитися». Але геній літератури Родореди полягає не в наполяганні на темі, а в усьому, що вона здатна викликати поза текстом щоразу, коли дивиться. Існує філософія в голодних очах або в очах, які хочуть втекти з орбіт від переляку, тому що в Родореди слова не описують досвід, вони роблять його тривожно фізичним: руки зупиняються «над» (0,454%) серцем, щоб воно не втекло («Здавалося, що з шовку»).

Якщо дієслово, яке Родореда використовує найбільше, є «говорити», то улюблене слово Пла - «бути» у всіх його часах. Беручи до уваги широту його журналістської роботи, очевидно, чому його улюблені слова з'являються у значно нижчому відсотку. Його журналістські прагнення полягають у використанні мови для складання карти реальності (0,104%), і тому його улюблені слова часто є іменами, якими ми називаємо речі: країна (0,376%), історія (0,115%), книга (0,106%) або дух (0,094%). Сержі Памієс якось сказав, що в літературі, повній дезорієнтованих чоловіків, він вирішив не включати жінок через суміш усвідомлення сміховинності слізливих чоловічих творів і тому, що не наважується їх інтерпретувати. Однак жінка з'являється в його літературі (0,321%), але часто як іронічний об'єкт: «жінка мого життя». Єдиний, кому я показую результат цієї гри: питання зовсім не дивує, і він зізнається, що коли пише, він робить той самий експеримент більш грубими способами, щоб усунути повторення. Але найбільше (0,810%).

Особливо в «Я дала тобі очі, і ти дивився на темряву» (Anagrama), жіноча генеалогія дуже важлива в Ірен Сола: дочки залишаються вдома (0,497%) і успадковують від матерів (0,455%) фольклор та історії, які роблять нас тими, хто ми є, тоді як чоловіки (0,293%) беруть участь в Історії. І завжди говорили, що Ірен Сола надихається Родоредою. Настільки, що в попередньому експерименті Estampa, у книзі «Ти говорив зі мною, і я сказала тобі, що сказала, щоб ти не говорив мені» (Como), Сола зрозуміла, що трохи розмовляє з нею, коли розмовляє з нейронною мережею, навченою на каталонських літературних текстах. Як і у Родореди, у Соли багато слів про тіло і простір, але повторення слів, за словами алгоритму, не обов'язково вказує на подібність в інших вимірах.

Велика бібліотека

Звичайною проблемою в бібліотеці є те, наскільки довільним може бути порядок. Книга Пережауме більше підходить для розділу природи, поезії чи есе? Є багато факторів, які роблять книгу більш-менш схожою на іншу, від усталених літературних жанрів до семантичних полів, тем або структури речень. Що станеться, якщо бібліотека зможе вийти за межі трьох вимірів? Чи можливо створювати відносини на багатьох рівнях одночасно, навіть більше, ніж ми, люди, сприймаємо? Це те, що називається латентним простором, «математичною картою, де модель ШІ розміщує шаблони та зв'язки, які вона знайшла в словах, якими була навчена», — кажуть в Estampa. Ми вирішили спробувати її з першими десятьма назвами опитування найкращих книг за останні п'ятдесят років, яке ми опублікували тут лише рік тому. Відносини, які з цього випливають, є абстрактними для людського ока, але вони можуть зробити щось настільки поетичне, як поставити книгу поруч з іншою і натякнути, що в цьому є сенс. У якомусь прихованому вимірі виявляється, що «Я зізнаюся» — це міждисциплінарна робота, що Сола і Родореда не дуже схожі, але Сола, Марсал і Рохальс — так; що Монкада і Ройг торкаються один одного, а Пажес Жорда і Монзо роблять ту ж паралельну дугу.

ESTAMPA

Ви можете натиснути тут, щоб перейти до інтерактивної карти.

Подружня спальня

Ми всі пробували це вдома, і чат-боти, як правило, працюють краще, коли їм потрібно імітувати незрозумілі тексти, повні пишномовності, а не більш тверезі прози. Є щось у стилістичній депурації, що парадоксально важко імітувати, тому що кожне слово має містити більше сенсу. Тому ми вирішили випробувати ШІ з таким орієнтиром тверезості та депурації, як Кім Монзо. За сприяння редакторки Сандри Ольо, ми попросили в нього дозволу навчити модель на його повній творчості, і він сказав нам «так». Модель, яку використовувала Estampa, була попередньо навчена каталонською мовою за допомогою Aina, проєкту уряду Каталонії, спрямованого на популяризацію каталонської мови в цифровій сфері, про який ніхто не знав, що він закінчиться таким експериментом. Тобто, у нього є більш обмежений і конкретний корпус тексту, ніж у генераторів, до яких ми звикли. На основі обробки текстів модель навчилася розпізнавати специфічні патерни Монзо і згенерувала кілька варіантів тексту, які в сукупності є гротескним резюме його творчості: є сексуальність, посередність сучасного життя в місті, абсурдні роздвоєння і багато перерахувань — одне з оповідань було таким: «Чоловік сів за стіл. Він взяв блокнот і записав: «Сьогодні, вперше за довгий час, я зроблю те, що приносить мені радість: напишу оповідання». Він почав друкувати. Другий абзац він залишив незавершеним. Третій вже був закінчений. Четвертий теж»; і перерахування тривало до незручно неіснуючих чисел. Той, який ми вибрали, дивний, але ідіосинкратичний: «Резюме, яке він робить з творчості Монзо, зовсім не є хибним», — стверджує Борха Багунья, коли я прошу його проаналізувати, — «світ, обманливо повсякденний, простий синтаксис, металітературна відмітка (наприклад, складові імена пародії на мелодраму La magnitud de la tragèdia або гра всередині і зовні з картиною і сном), вибух більш-менш нещасливої сексуальності; мене втішає, однак, той факт, що він ще не вгадав його гумор або геній мови».

Оповідання Кіма Монзо

Напередодні Анна-Франческа провела ранок, прибираючи шухляди тумбочки. Вона зняла наволочки з подушок і одягла нові. Потім вона зробила те ж саме з ковдрами. І з простирадлами. Закінчивши, вона встала і пішла в одну з кімнат, яка знаходиться поруч з подружньою спальнею. На одній зі стін вона повісила картину, на якій зображена жінка, що сидить у червоному кріслі, дивлячись у невизначену точку кімнати. Анна-Франческа запитала її, чого вона хоче. Рамон-Марія сказав їй, що нічого. Дівчина кілька секунд дивилася на картину, а потім зірвала її зі стіни і поклала на тумбочку. Пальцями Анна-Франческа олівцем позначила три зони на картині: жінку, що сидить, червоне крісло і фон кімнати. Потім вона підійшла до неї і помацала її. Там не було намальовано ні стільця, ні крісла. Однак був намальований фон кімнати: сіра стіна, без меблів, крім великого білого дивана біля стіни і низького столика, теж білого, біля вікна. Чоловік точно не знає, чому він це зробив, але коли він повернув її на те місце, де вона була, йому здалося, що він бачить себе, що сидить у тому самому червоному кріслі, дивлячись у кімнату звідти, де вона зараз спостерігала за картиною. Анна-Франческа пройшла в вітальню, де Рамон-Марія залишив їй книгу для читання. Анна-Франческа швидко її закінчила. Потім, коли Рамон-Марія вже спав, вона поклала її на подушку і лягла на неї. Рамон-Марії приснилося, що вона була в ліжку з ним, голою і мастурбувала.

У цьому оповіданні є дивацтво, ніби ми слухаємо комічний монолог іноземною мовою: ми можемо здогадатися, що нас намагаються розсмішити, але не чому. Монзо ніколи не написав би про «подружню спальню» або «книгу для читання» без іронічного наміру, який тут неможливо розшифрувати. У словах цього штучного Монзо є слід світу, який створив реальний Монзо; тоді як у словах реального Монзо є слід того, хто хоче створити новий світ. Ми ставимо їх один навпроти одного, і на відстані, яка їх розділяє, є задоволення від пошуку нових прихованих значень, улюблених слів і оригінальних порівнянь. Зрештою, бажання продовжувати читати.

Тут ви можете прочитати статтю колективу Estampa.

Read in other languages

Про автора

<p>експерт із глибокого аналізу та фактчекінгу. Пише аналітичні статті з точними фактами, цифрами та перевіреними джерелами.</p>