Поліція Іспанії відмовляється від Veripol: Чому ІІ-система для виявлення фейкових заяв опинилася поза грою?

Декількома словами

Іспанська поліція припинила використання штучного інтелекту Veripol для виявлення фейкових заяв через його сумнівну юридичну силу та непрозорість. Критика стосується низької ефективності, відсутності належної підготовки поліцейських та недосконалої методології роботи системи.


Поліція Іспанії відмовляється від Veripol: Чому ІІ-система для виявлення фейкових заяв опинилася поза грою?

«Це перший інструмент такого роду у світі», — йшлося в прес-релізі Національної поліції Іспанії.

Veripol, представлена у 2018 році, позиціонувалась як алгоритм, здатний виявляти неправдиві заяви про пограбування з насильством з точністю понад 90%. У жовтні 2024 року, через шість років, ця ІІ-система припинила роботу, про що повідомили журналістам з Civio у Технічному кабінеті Генерального директорату поліції. У Міністерстві внутрішніх справ пояснюють, що причина відмови від використання Veripol — відсутність юридичної сили у судових процедурах.

Відмова від Veripol сталася через три місяці після публікації в Офіційному бюлетені Іспанії Європейського регламенту про штучний інтелект, який відносить поліграфи до ІІ «високого ризику», для яких передбачено суворі вимоги щодо перегляду, оновлення та прозорості. Наприкінці вересня звіт фахівців з права та математики з Університету Валенсії виявив серйозні недоліки інструменту. Перший з них – відсутність інформації про його роботу.

Роботи над впровадженням Veripol проводили дослідники з університетів Комплутенсе та Карлоса III, а також поліцейський Мігель Камачо-Кольядос, який зараз відповідає за технологічні інновації та кібербезпеку в Державній раді. Згідно з академічною статтею, яка детально описує розробку, вибірка, на якій навчали систему, складалася з 1122 заяв про пограбування в Іспанії за 2015 рік, з яких 534 були правдивими, а решта 588 – неправдивими. Тексти заяв обробляли з використанням методів NLP — спрощуючи їх для автоматичної обробки — та класифікували слова за типом, виключаючи ті, що зустрічалися менше ніж в 1% вибірки або більше ніж в 99%. Потім застосовували різні методи статистичної регресії, щоб вибрати, які слова були найбільш поширеними у фальшивих та правдивих заявах. Наприклад, згідно з Veripol, якщо в заяві містяться слова «день», «адвокат», «страховка» або «спина», ймовірність того, що вона фальшива, вища, особливо якщо кілька разів згадується число «двісті» або прислівники на кшталт «майже». Навпаки, заяви, які стосуються автобусів, певної марки мобільного телефону або номеру автомобіля, з більшою ймовірністю будуть правдивими.

У червні 2017 року було проведено пілотне випробування у відділках поліції Малаги та Мурсії. Згідно з академічною статтею, у 83,54% заяв, визначених Veripol як неправдиві, заявник зізнавався, що збрехав. У грудні того ж року дослідження було відзначено нагородою від Іспанського поліцейського фонду, а у 2018 році Міністерство внутрішніх справ оголосило про його впровадження в усіх відділках поліції.

Згідно з даними організації Algorithm Watch, з моменту впровадження до жовтня 2020 року Veripol використовувався для аналізу близько 84 000 заяв. З 49 702 заяв, оброблених у 2019 році, 2338 були ідентифіковані як фальшиві як цим інструментом, так і іншими засобами. Дослідження Університету Валенсії показує, що у 2022 році його використовували значно менше: кількість заяв, проаналізованих Veripol, впала до 3762, з яких 511 було виявлено як фальшиві.

Цей же звіт вказує на серйозні недоліки інструменту, які починаються з його власної концепції: базова ідея полягає в тому, що 57% заяв про пограбування з насильством є фальшивими, що ґрунтується на великій кількості нерозкритих випадків пограбувань. Критикується також обмеженість вибірки, яка трохи перевищує 1000 заяв порівняно з приблизно 60 000 випадками пограбувань з насильством, що реєструються щороку в Іспанії, згідно з Порталом статистичної злочинності. А також відсутність протоколу використання та інформації про навчання, яке пройшли поліцейські для його використання. Новина, опублікована у 2020 році виданням La Voz de Galicia, попереджала, що відділок поліції Віго, який використовував програму з 2018 року, не міг нею користуватися через відсутність підготовки у своїх співробітників.

Також підкреслюється, що заяви, проаналізовані Veripol, насправді були складені співробітниками поліції, тому це не буквальне відтворення заяви заявника. «Він аналізує не історію, яку можливий брехун розповідає поліції, а історію, яку пише сам поліцейський», – підкреслюється у звіті, додаючи, що інструмент також не враховує мовні відмінності між регіонами.

Але, перш за все, критикується непрозорість щодо його використання. «Система не є прозорою», – робить висновок звіт Університету Валенсії. «Офіційних даних про Veripol взагалі немає», – додає він. З Civio у лютому 2023 року і знову у грудні 2024 року було запрошено інформацію про технічні характеристики цього інструменту та про його використання, але Міністерство внутрішніх справ до цього дня не надало відповіді навіть щодо кількості відділків поліції, в яких його було впроваджено.

Ця стаття спочатку була опублікована в Civio, незалежній некомерційній редакції, яка проводить глибокі розслідування громадських справ.

Методологія

У лютому 2023 року Civio запросило у Міністерства внутрішніх справ, відповідно до Закону про прозорість, технічні характеристики Veripol, випадки використання та будь-який інший документ, який дозволив би з’ясувати, як працює програма та яку інформацію вона містить або може містити. Зважаючи на відмову Міністерства внутрішніх справ надати цю інформацію, було подано скаргу до Ради з питань прозорості та належного управління, яка 31 жовтня того ж року винесла рішення про право доступу та наказала Міністерству внутрішніх справ надати запитану інформацію. Єдиною інформацією, яка була остаточно надана, були посилання на прес-релізи, опубліковані поліцією та Університетом Комплутенсе щодо її введення в експлуатацію та нагороди, отриманої від Іспанського поліцейського фонду.

У грудні 2024 року Civio знову запросило інформацію, пов’язану з Veripol. Зокрема, список відділків поліції, в яких було впроваджено інструмент, та дані про використання, зокрема кількість випадків, оброблених за рік, та відсоток з них, у яких інструмент дійшов висновку, що заява є фальшивою. У відповідь Міністерство повідомило, що вони припинили використовувати Veripol 21 жовтня 2024 року, і відмовилося надати дані про використання. Наразі триває скарга до Ради з питань прозорості та належного управління щодо отримання доступу до цих даних.

У створенні та впровадженні гри брали участь Девід Кабо та Ана Вільота.

У препринті статті, опублікованої у журналі Knowledge-Based Systems, “Applying automatic text-based detection of deceptive language to police reports: Extracting behavioral patterns from a multi-step classification model to understand how we lie to the police” (Лара Кіхано-Санчес, Федеріко Лібераторе, Хосе Камачо Кольядос та Мігель Камачо-Кольядос, Університет Кардіффа, 2018), містяться дані за 2015 рік щодо інструменту, а також список із 110 термінів, перекладених з іспанської на англійську мову. Civio зв’язалося з авторами, але вони не надали вихідний список слів іспанською мовою.

Тому, щоб уникнути неоднозначності, пов’язаної з перекладом, було зібрано лише ті слова, які пояснюються з контекстом. Остаточний список термінів з відповідними вагами (чим вище значення, тим більший вплив) слів, які з’являються або з’являються дуже часто, визначає, що заява, ймовірно, фальшива: день (0,48), адвокат (0,43), страховка (0,24), спина (7,74), рюкзак (0,10), плече (17,99), шолом (26,92), iPhone (25,56), Apple (0,23), майже (?), позаду (0,12), двісті (0,30), євро (6,81), готівка (19,18), контракт (19,19).

Вибір, який було зроблено для випадку заяви, ймовірно, правдивої: автобус (0,52), номер (0,19), ланцюг (16,06), поліція (0,31), китаєць (52,58), шия (16,62), портал (0,26), сходова площадка (0,36), навіть (72,31), борода (0,34), сантиметр (0,09), худий (0,09), смаглявий (0,10), кричати (40,67), хапати (0,12), доктор (16,75), друг (0,13).

Візуалізація гри розроблена з використанням Svelte.js.

Read in other languages

Про автора

<p>експерт із глибокого аналізу та фактчекінгу. Пише аналітичні статті з точними фактами, цифрами та перевіреними джерелами.</p>