OpenAI запустил ИИ-агента «Оператор», который выполняет задачи в интернете
Новый ИИ-агент от OpenAI под названием «Оператор» может взаимодействовать с веб-страницами, выполняя различные задачи вместо пользователя, что значительно упрощает повседневную жизнь.
Стартап OpenAI презентовал своего первого ИИ-агента, получившего название «Оператор». Он способен самостоятельно выполнять различные задачи в интернете, освобождая пользователя от рутинных действий.
A research preview of Operator, an agent that can use its own browser to perform tasks for you. pic.twitter.com/wkBBDIlVqj
— OpenAI (@OpenAI) January 23, 2025
Данный инструмент обеспечивает возможность просмотра веб-страниц и взаимодействия с ними, включая ввод текста, прокрутку рабочего окна и нажатие кнопок.
Пользователи могут поручить «Оператору» осуществлять множество повторяющихся задач, таких как:
- Заполнение форм
- Заказ продуктов
- Бронирование отелей
«Возможность использовать те же интерфейсы и инструменты, с которыми люди взаимодействуют ежедневно, расширяет сферу применения ИИ, помогая экономить время на выполнении повседневных задач и открывая новые возможности для взаимодействия с бизнесом»,
Искусственный интеллект «Оператора» основывается на новой модели, известной как Computer-Using Agent (CUA). Эта модель объединяет возможности GPT-4 для восприятия экрана и улучшенное мышление, полученное благодарю обучению с подкреплением. Агент может обрабатывать информацию через скриншоты и выполнять действия, подобные человеческим, с использованием мыши и клавиатуры.
Примечательно, что «Оператор» обучен запрашивать подтверждение перед завершением ключевых действий, таких как отправка электронных писем или бронирование гостиниц.
На данном этапе существует лишь предварительная исследовательская версия ИИ-агента. Он будет совершенствоваться на основе отзывов пользователей и доступен для подписчиков ChatGPT Pro по цене $200 в США. В дальнейшем планируется увеличить доступность для более широкой аудитории.
К сожалению, на данный момент «Оператор» не всегда работает безупречно. В случае возникновения трудностей он запросит помощь пользователя для завершения задания.
К слову, напоминаем, что в октябре 2024 года ИИ-стартап Anthropic представил обновленную версию своей модели Claude 3.5 Sonnet, которая способна выполнять задачи как человек, включая управление курсором и ввод текста.