Открыты детали работы ИИ-агента OpenAI «Оператор»

Программист Тибор Блахо раскрыл сведения о новом ИИ-агенте OpenAI под именем «Оператор». В статье рассмотрены замены и оценки его возможностей.

👁️ 46
ИИ-агент OpenAI «Оператор»
Фото: forklog

Программист с известными инсайдами о будущих ИИ-продуктах Тибор Блахо нашел свидетельства существования агента OpenAI под кодовым названием «Оператор».

Согласно информации Блахо, в десктопной версии ChatGPT для macOS доступны скрытые параметры, позволяющие включать и отключать «Оператора». Эту информацию также подтвердил пользователь X с ником M1.

Блахо обнаружил, что на сайте OpenAI есть упоминания о данном ИИ-агенте и его сопоставлении с конкурентами.

Анализ, представленный в таблицах, указывает на некоторые недостатки «Оператора» в ряде задач.


Эффективность и возможности «Оператора»

В результате тестирования на платформе OSWorld, которая моделирует реальную работу с компьютером, ИИ-агент от OpenAI показал 38,1%. Этот результат выше, чем у решения от Anthropic, однако все же значительно уступает результатам человека — 72,4%.

Тем не менее, «Оператор» демонстрирует преобладание над человеческими показателями в тестах на WebVoyager, которые оценивают способности ИИ в навигации по веб-сайтам.

Проблемы с конкретными задачами

При попытке создать биткоин-кошелек, нейросеть достигла успеха всего в 10% случаев. Однако результаты по регистрации у облачного провайдера составили более благоприятные 60%.

Кроме того, утечка графических данных указывает на высокую степень надежности ИИ в вопросах безопасности. «Оператор» активно сопротивляется угрозам, таким как попытки совершить «незаконные действия» и искать «чувствительные личные данные».

Напомним, что в ноябре были обнародованы планы OpenAI по запуску ИИ-агента «Оператор».
Тибор Блахо