OpenAI запустил ИИ-агента «Оператор», который выполняет задачи в интернете

Новый ИИ-агент от OpenAI под названием «Оператор» может взаимодействовать с веб-страницами, выполняя различные задачи вместо пользователя, что значительно упрощает повседневную жизнь.

👁️ 13
ИИ-агент OpenAI
Фото: forklog

Стартап OpenAI презентовал своего первого ИИ-агента, получившего название «Оператор». Он способен самостоятельно выполнять различные задачи в интернете, освобождая пользователя от рутинных действий.

Данный инструмент обеспечивает возможность просмотра веб-страниц и взаимодействия с ними, включая ввод текста, прокрутку рабочего окна и нажатие кнопок.

Пользователи могут поручить «Оператору» осуществлять множество повторяющихся задач, таких как:

  • Заполнение форм
  • Заказ продуктов
  • Бронирование отелей

«Возможность использовать те же интерфейсы и инструменты, с которыми люди взаимодействуют ежедневно, расширяет сферу применения ИИ, помогая экономить время на выполнении повседневных задач и открывая новые возможности для взаимодействия с бизнесом»,

- OpenAI

Искусственный интеллект «Оператора» основывается на новой модели, известной как Computer-Using Agent (CUA). Эта модель объединяет возможности GPT-4 для восприятия экрана и улучшенное мышление, полученное благодарю обучению с подкреплением. Агент может обрабатывать информацию через скриншоты и выполнять действия, подобные человеческим, с использованием мыши и клавиатуры.

Примечательно, что «Оператор» обучен запрашивать подтверждение перед завершением ключевых действий, таких как отправка электронных писем или бронирование гостиниц.

На данном этапе существует лишь предварительная исследовательская версия ИИ-агента. Он будет совершенствоваться на основе отзывов пользователей и доступен для подписчиков ChatGPT Pro по цене $200 в США. В дальнейшем планируется увеличить доступность для более широкой аудитории.

К сожалению, на данный момент «Оператор» не всегда работает безупречно. В случае возникновения трудностей он запросит помощь пользователя для завершения задания.

К слову, напоминаем, что в октябре 2024 года ИИ-стартап Anthropic представил обновленную версию своей модели Claude 3.5 Sonnet, которая способна выполнять задачи как человек, включая управление курсором и ввод текста.