Декількома словами
Віцепрезидент Google DeepMind Оріоль Віньялс аналізує швидкий розвиток штучного інтелекту, підкреслюючи можливості Gemini та виклики, пов'язані з високою швидкістю інновацій. Він передбачає поширення ШІ в голосових технологіях, створенні відео та робототехніці.
Оріоль Віньялс, віцепрезидент Google DeepMind, підрозділу, що створив Gemini, підкреслює все більш помітну присутність штучного інтелекту в голосових технологіях, відео та робототехніці. Математик та інженер телекомунікацій, Віньялс нещодавно був удостоєний звання почесного доктора Політехнічного університету Каталонії (UPC).
За останні три роки штучний інтелект зробив величезний стрибок, від текстових програм на кшталт ChatGPT до повсюдної інтеграції в програмне забезпечення. ШІ активно використовується вченими для перевірки теорій, митцями як новий інструмент, є майже незамінним для студентів і навіть виступає в ролі психолога. Однак таке стрімке прискорення супроводжується зростаючими ризиками та невизначеністю, оскільки технології стають все більш точними та дивовижними.
Віньялс визнає надто швидкий темп розвитку, але зазначає, що вимоги ринку та "захоплення" від створення чогось, порівнянного з польотом на Місяць, не дозволяють уповільнити його. Google DeepMind, придбана Alphabet у 2014 році, є лідером у сфері глибокого навчання ШІ. Серед її ключових розробок – Gemini, конкурент ChatGPT, а також знамениті AlphaGo, AlphaStar та AlphaFold. Остання, що передбачає структуру білків, принесла її творцям Нобелівську премію з хімії минулого року.
Пояснюючи еволюцію ШІ, Віньялс каже, що хоча базова технологія схожа на ту, що була десятиліття тому, вона постійно вдосконалюється, імітуючи нейронні зв'язки людського мозку. Перехід від суто наукових досліджень до масових застосувань був відзначений демонстраціями AlphaGo та популяризацією мовних моделей, таких як ChatGPT. Google DeepMind та Google Brain об'єднали зусилля для створення потужної мовної моделі, яка продовжує вдосконалюватися.
Версія Gemini 3.0 пропонує значні покращення в якості та функціональності, включаючи потужніші можливості створення зображень за допомогою рушія Nano Banana Pro, розширені здібності в кодуванні, математиці та міркуванні, а також покращену "особистість" моделі.
Щодо помилок ШІ, Віньялс пояснює їх тим, що моделі навчаються на контенті з інтернету, який сам може містити неточності. Він підкреслює, що користувачі повинні усвідомлювати потенційні помилки ШІ, як і у випадку з інформацією, знайденою в інтернеті. Для розуміння логіки ШІ можна змусити її "міркувати" природною мовою.
Швидкий вплив ШІ, який генеральний директор DeepMind Деміс Хассабіс порівняв з тим, що в 10 разів швидше за промислову революцію, вимагає постійної адаптації користувачів та покращення систем компаніями. Віньялс підтверджує, що моделі ШІ виявляють креативність, не лише інтерполюючи дані, але й генеруючи нові ідеї шляхом зв'язування інформації з різних областей.
Говорячи про відповідальність, Віньялс займає центристську позицію, визнаючи як ризики, так і переваги. Google відповідально підходить до запуску своїх моделей, незважаючи на конкурентний темп, що вимагає швидких випусків для виявлення проблем. Хоча Віньялс волів би повільніший розвиток, він визнає, що інерція інновацій та азарт ускладнюють уповільнення. Він сподівається, що за наявності достатніх даних про негативні наслідки темп може бути скоригований.
Конкуренція, включаючи китайську DeepSeek, має геополітичне значення, але Google та OpenAI залишаються лідерами. У Європі є сильні стартапи, але основна інфраструктура та інвестиції зосереджені в США та Китаї. Google прагне до вуглецевої нейтральності своїх центрів обробки даних, а сам ШІ може запропонувати рішення кліматичних проблем, включаючи дослідження ядерного синтезу.
У найближчому майбутньому ШІ розвиватиметься в голосових взаємодіях та створенні відеоконтенту. У середньостроковій перспективі (близько п'яти років) Віньялс очікує революцію в робототехніці, зі збільшенням взаємодії з гуманоїдними роботами, подібно до того, як зараз використовуються безпілотні автомобілі.