Штучний інтелект посилює стереотипи: як мовні моделі поширюють упередження між культурами

Штучний інтелект посилює стереотипи: як мовні моделі поширюють упередження між культурами

Декількома словами

Дослідження показує, що ШІ посилює стереотипи. Мовні моделі відтворюють упередження, отримані з різних культур, викликаючи занепокоєння щодо упередженості в ШІ.


Нове дослідження показує, що мовні моделі, які використовують штучний інтелект (ШІ), схильні повторювати та підсилювати стереотипи, засвоєні з різних мов і культур. Це викликає занепокоєння щодо упередженості в ШІ та його впливу на формування громадської думки.

У світі існують різні гендерні, вікові та національні стереотипи. З появою чат-ботів з ШІ ці усталені уявлення поширюються по всьому світу, що може призвести до посилення упередженості та дискримінації.

«ШІ включає стереотипи про людей, базуючись на інформації, яку люди публікують в інтернеті, а потім використовує їх як частину загальних знань», — каже Маргарет Мітчелл, дослідниця з Hugging Face, компанії, що спеціалізується на відкритих моделях ШІ. Дослідження показало, що моделі, розроблені в різних країнах, можуть по-різному реагувати на одні й ті самі питання про стереотипи.

Команда дослідників, які володіють 16 мовами, створила список з понад 300 стереотипів з усього світу. Вони розробили систему для генерації питань про ці стереотипи з різними тонами та підходами, щоб поставити їх кільком відкритим моделям ШІ. Результати показали, що спосіб відтворення стереотипів залежить від моделі та типу стереотипу.

В експерименті використовувалися великі багатомовні мовні моделі, навчені на даних з більшості мов, представлених у дослідженні, включаючи моделі Bloom, Llama, Mistral та Qwen. Найбільш поширеними були гендерні стереотипи, наприклад, про те, що дівчатка люблять рожевий колір.

Дослідники відзначають, що результати були передбачуваними, оскільки моделі навчаються на даних, створених людьми. Результати тестів були об'єднані в базу даних під назвою Shades, щоб компанії, які розробляють моделі, могли перевіряти відповіді своїх чат-ботів і виправляти їх за потреби.

Дослідження також виявило, що моделі можуть використовувати псевдонауку або псевдоісторію для виправдання стереотипів. Крім того, моделі часто погано справляються з обробкою стереотипів, якщо запит сформульований позитивно. Моделі також схильні «штрафувати» менш поширені мови, видаючи негативні стереотипи про відповідні культури, якщо модель не була добре навчена цією мовою.

Про автора

Прихильник лаконічності, точності та мінімалізму. Пише коротко, чітко та без зайвої води.