
Майкрософт
Технология, лежащая в основе ChatGPT, может делать гораздо больше, чем просто говорить. Линкси «Джим» Фан, исследователь ИИ в компании-производителе чипов Nvidia, работал с некоторыми коллегами, чтобы разработать способ установить мощную языковую модель GPT-4 — «мозги» ChatGPT и растущего числа других приложений и сервисов — свободно внутри. блочная видеоигра Шахтерское ремесло.
Команда Nvidia, в которую входила Анима Анандкумар, директор компании по машинному обучению и профессор Калифорнийского технологического института, создала Шахтерское ремесло бот под названием Voyager, который использует GPT-4 для решения проблем внутри игры. Языковая модель генерирует цели, которые помогают агенту исследовать игру, и код, который со временем улучшает навыки бота в игре.
Voyager не играет в игру как человек, но он может считывать состояние игры напрямую, через API. Например, он может увидеть удочку в своем инвентаре и реку поблизости и использовать GPT-4, чтобы предложить цель заняться рыбной ловлей, чтобы набраться опыта. Затем он будет использовать эту цель, чтобы GPT-4 сгенерировал код, необходимый для ее достижения персонажем.
Самая новая часть проекта — это код, который генерирует GPT-4 для добавления поведения в «Вояджер». Если первоначально предложенный код не работает идеально, Voyager попытается улучшить его, используя сообщения об ошибках, отзывы об игре и описание кода, сгенерированного GPT-4.
Со временем Voyager создает библиотеку кода, чтобы научиться делать все более сложные вещи и больше исследовать игру. Диаграмма, созданная исследователями, показывает, насколько он способен по сравнению с другими Шахтерское ремесло агенты. «Вояджер» получает в три раза больше предметов, исследует более чем в два раза дальше и создает инструменты в 15 раз быстрее, чем другие агенты ИИ. Фан говорит, что в будущем этот подход может быть улучшен за счет добавления в систему способа включения визуальной информации из игры.
В то время как чат-боты, такие как ChatGPT, поразили мир своим красноречием и очевидными знаниями, даже если они часто выдумывают, Voyager демонстрирует огромный потенциал языковых моделей для выполнения полезных действий на компьютерах. Использование языковых моделей таким образом, возможно, могло бы автоматизировать многие рутинные офисные задачи, что потенциально является одним из самых больших экономических последствий технологии.
Процесс, который “Вояджер” использует с GPT-4, чтобы понять, как делать что-то в Шахтерское ремесло может быть адаптирован для программного помощника, который решает, как автоматизировать задачи через операционную систему на ПК или телефоне. OpenAI, стартап, создавший ChatGPT, добавил к боту «плагины», которые позволяют ему взаимодействовать с онлайн-сервисами, такими как приложение для доставки продуктов Instacart. Майкрософт, которому принадлежит Шахтерское ремесло, также обучает программы искусственного интеллекта играть в нее, и недавно компания анонсировала Windows 11 Copilot, функцию операционной системы, которая будет использовать машинное обучение и API для автоматизации определенных задач. Может быть хорошей идеей поэкспериментировать с такими технологиями внутри такой игры, как Шахтерское ремеслогде ошибочный код может нанести относительно небольшой вред.
Разумеется, видеоигры долгое время были испытательным полигоном для алгоритмов ИИ. AlphaGo, программа машинного обучения, которая освоила чрезвычайно тонкую настольную игру Идти еще в 2016 году набил себе зубы, играя в простые видеоигры Atari. AlphaGo использовал метод, называемый обучением с подкреплением, который обучает алгоритм играть в игру, давая ему положительные и отрицательные отзывы, например, на основе счета в игре.
Для этого метода сложнее вести агента в игре с открытым концом, такой как Шахтерское ремесло, где нет очков или набора целей и где действия игрока могут окупиться гораздо позже. Считаете ли вы, что мы должны готовиться к сдерживанию экзистенциальной угрозы со стороны ИИ прямо сейчас, Шахтерское ремесло кажется отличной игровой площадкой для технологии.
Первоначально эта история появилась на wired.com.