Артур Менш, CEO Mistral AI: «Регулювання – не найбільший виклик для ШІ в Європі»

Декількома словами

Артур Менш, CEO Mistral AI, підкреслює важливість технологічного суверенітету для Європи, особливо в контексті оборони та культури. Він наголошує на необхідності регулювання застосунків ШІ, а не самої технології, і закликає до прискорення впровадження ШІ європейськими компаніями для забезпечення їх конкурентоспроможності на світовій арені. Mistral AI бачить можливості в європейських потребах у суверенних технологіях і зосереджується на розробці рішень з високим рівнем управління даними. Компанія також прагне конкурувати з DeepSeek і американськими гігантами, пропонуючи ефективніші та адаптовані до конкретних мов моделі.


Артур Менш, CEO Mistral AI: «Регулювання – не найбільший виклик для ШІ в Європі»

Коли мова заходить про експансію ШІ зі Сполучених Штатів, або навіть з Китаю, існує «гальське село», яке чинить опір.

Французький стартап Mistral AI виник у квітні 2023 року, коли вже вирував ажіотаж навколо ChatGPT, запущеного п’ять місяців тому. Його заснували двоє колишніх дослідників Meta AI, Гійом Лампль і Тімоті Лакруа, разом з іншим колишнім дослідником DeepMind, підрозділу штучного інтелекту Google, Артуром Меншем.

Усі троє познайомилися під час навчання інженерії в École Polytechnique в Парижі. Вони почали проєкт з 12 інженерами, і тепер Mistral AI – це компанія зі 170 співробітників з офісами в Парижі, Лондоні, США та Сінгапурі. Вона залучила близько 1 мільярда євро інвестицій, що дає їй теоретичну вартість у 6 мільярдів. Підтримку надали французький технологічний магнат Ксав'є Ніль, а також Nvidia та Microsoft. І тому вона є однією з найбільших надій європейського ШІ.

Артур Менш (Париж, 1992) є генеральним директором Mistral і обличчям стартапу. Він приймає «Джерело новини» у заскленій кімнаті Mobile World Congress у Барселоні. Одягнений у темний костюм і після довгого дня зустрічей, керівник стартапу розповідає про роль Mistral у європейських пошуках технологічної незалежності. А також розглядає свої бізнес-перспективи – компанія має клієнтів у фінансовій сфері, оборонній промисловості та державному секторі – і коментує конкуренцію з DeepSeek і компаніями зі Сполучених Штатів.

Питання: Чому технологічний суверенітет важливий для Європи в нинішній геополітичній ситуації?

Відповідь: Останніми місяцями ми спостерігали, що багато європейських компаній, а також компаній за межами Європи, усвідомили, що їм потрібна стратегія, яка не повністю залежить від американських технологій для їхніх систем ШІ.

П: Це економічне питання?

В: Якщо у вас є компанії, які надмірно залежать від американських постачальників для покриття потреби, яка матиме значний вплив на ваш бізнес, як-от ШІ, це означає, що значна частина ВВП йде до Сполучених Штатів. Але є й інший аспект – культурний суверенітет. Він полягає в тому, щоб переконатися, що моделі знають іспанську літературу, французьку літературу, інший спосіб, яким ми осмислюємо історію в Європі, або різні способи, якими ми думаємо про демократію, що відрізняється від того, як про це думають у Сполучених Штатах.

П: Тепер, коли Сполучені Штати стали мінливим партнером, чи потрібен Європі також технологічний суверенітет в обороні?

В: Є третій фактор – стратегічний суверенітет. Це означає, що ШІ, який є новим способом побудови людино-машинного інтерфейсу, буде у всіх системах озброєння протягом наступних 10 років. На жаль, це важливий аспект у сучасному світі. І для європейських держав і [оборонної] промисловості дуже важливо мати можливість будувати системи з ШІ, який не надходить від постачальника, який не є членом держави.

П: Наскільки оборона буде суттєвим бізнесом для Mistral?

В: Це вже важливий бізнес для нас.

П: Як Mistral планує використати європейські потреби в суверенній технології?

В: Цей сценарій є джерелом можливостей для нас. Не лише тому, що ми є європейською компанією, а й тому, що технологія, яку ми розробляємо, призначена для випадків використання з високими вимогами до управління даними.

П: Що ви маєте на увазі?

В: Нашу технологію можна розгорнути локально. Якщо клієнт має достатньо GPU (графічних процесорів), він може запустити наш ШІ у своїй приватній хмарі. Коли справа доходить до виконання критичних робочих навантажень, які вимагають високого суверенітету даних, у нас є технологія для цього. Насправді, ми є єдиною компанією або однією з небагатьох, хто може це зробити.

П: У вас також є моделі, як-от Mistral Small 3, які працюють на ноутбуці…

В: Це було б розгортання на пристрої, яке полягає у впровадженні менших моделей у дешевше обладнання. Це може бути ноутбук або навіть смартфон. Сьогодні найкраща модель, яку можна запустити на ноутбуці, – це модель від Mistral.

П: Які переваги запуску LLM [великої мовної моделі] локально?

В: Перша полягає в тому, що це приватна система за замовчуванням. Вона також може працювати в середовищі без підключення до Інтернету. І це важливо для ефективності. Якщо ми зможемо обробити 80% запитів користувача на його власному комп'ютері та виконати їх локально, це енергія, яку ми заощаджуємо і не витрачаємо в центрах обробки даних.

«Технологія, яку ми розробляємо, призначена для випадків використання з високими вимогами до управління даними»

П: Ви наполягаєте на тому, що Європі потрібно менше регулювання…

В: Ми повинні зосередитися на регулюванні додатків, а не технологій. Ми дійсно віримо, що прийшли занадто рано [з європейським Регламентом щодо ШІ]. Але це можливо вирішити. Я б не сказав, що регулювання є найбільшим викликом, з яким стикається Європа в галузі штучного інтелекту. Хоча це, звичайно, не допомагає.

П: Що б ви хотіли змінити в регулюванні?

В: Ми завжди відстоювали необхідність збереження комерційної таємниці. Це дуже важливо для таких компаній, як наша, щоб бути конкурентоспроможними, особливо в аспектах, пов'язаних з даними навчання. Європейський Регламент щодо ШІ більше допомагає американським компаніям, ніж компаніям з ЄС, тому що, будучи дуже великими, вони можуть краще впоратися з будь-яким тягарем, який на них покладається. І я хотів би уникнути цього сценарію.

П: Раніше ви говорили, що регулювання не є головним викликом для ШІ. Який він?

В: Я думаю, що найбільший виклик, який ми маємо в Європі, і ми раді бачити, що це змінюється, полягає в тому, що темпи впровадження ШІ серед компаній були трохи повільними. Вони відстають від Сполучених Штатів. Але тепер вони зрозуміли, що це критично важливо для них. Що якщо вони хочуть конкурувати на світовій арені, їм потрібно бути більш ефективними за допомогою ШІ.

П: Як Mistral підходить до такого фрагментованого ринку, як європейський, який насправді є 27+1 ринками?

В: Це змушує нас мати команди в різних країнах. Зараз у нас є команда у Великій Британії, ще одна в Німеччині, і незабаром у нас буде команда в Іспанії. Кожна європейська компанія має особливі вимоги щодо мови або ставлення до клієнтів. І це вимагає глибокої персоналізації систем ШІ, що ми вміємо робити.

П: ChatGPT або Google NotebookLM вже добре працюють іспанською мовою. Як Mistral планує конкурувати з ними?

В: Можна розробляти моделі, які чудово працюють кількома мовами. Але якщо ви вирішите зосередитися на певній мові, ви можете створити меншу модель, яка буде кращою саме цією мовою. Єдиний спосіб створити модель, яка буде дуже задовільною певною мовою, – це ввести більше даних цією мовою та навчити її на них. Таким чином, ми можемо створити меншу модель, але присвячену цій мові.

«Ми були першими, хто запустив модель з відкритим кодом. І це запустило цілу снігову кулю, яка зростала»

П: Після потрясіння, викликаного DeepSeek в галузі, ви сказали, що Mistral вже впровадила методи підвищення ефективності. Чи можете ви розповісти про це?

В: DeepSeek використовує, насправді, фрагмент коду, який ми опублікували минулого року як відкритий код. Це техніка mixture of experts (MoE або суміш експертів). Вони масштабували її та додали певну математичну здатність міркування.

П: Отже, технологія спочатку була від Mistral?

В: Спочатку так. Ми були першими, хто запустив модель з відкритим кодом з нею. І це запустило цілу снігову кулю, яка зростала. Ви віддаєте щось спільноті відкритого коду, і хтось бере це і створює щось краще.

П: Це спосіб передати інновації на аутсорсинг…

В: Історично склалося так, що в штучному інтелекті завжди було так. Якщо ви подивитеся на те, що сталося між 2010 і 2020 роками, ми використали цю формулу для побудови глибокого навчання (deep learning). Таким чином, ми також розробили глибоке навчання з підкріпленням (deep reinforcement learning). І так ми почали працювати над великими мовними моделями (LLM). І раптом OpenAI побачила в цьому бізнес і вирішила закрити свою технологію та почати гонку, в якій вони намагатимуться стати монополістом.

П: Як Mistral може конкурувати з DeepSeek, яка також є компанією з відкритим кодом?

В: Зараз ми працюємо над тим, щоб мати моделі кращі, ніж у DeepSeek. І щодо ефективності під час навчання, яку вони заявили, ми вже досягли її і навіть покращуємо її.

Read in other languages

Про автора

Прихильник лаконічності, точності та мінімалізму. Пише коротко, чітко та без зайвої води.