OpenAI представила свого першого ШІ-агента Operator, який може переходити в інтернет, щоб виконувати завдання, як-от забронювати квитки чи замовити доставку.

Як він працює

Він заснований на новій моделі Computer-Using Agent (CUA), який завдяки GPT-4o може «бачити» інтерфейс (через скріншоти) і «взаємодіяти» з ним, як за допомогою миші й клавіатури. Він працює без інтеграції за допомогою API, виконуючи дії прямо в браузері.

Він використовує передові алгоритми для роботи з інтерфейсом, міркує й виправляє помилки. У складних випадках передає керування користувачеві. З деякими завданнями, як-от управління календарями і створення слайд-шоу, поки є проблеми, кажуть у компанії.

Як його використовувати
  • потрібно описати завдання, й Operator його виконає;
  • можна взяти контроль у будь-який момент, наприклад для введення паролів або розвʼязання CAPTCHA;
  • є можливість налаштовувати завдання для конкретних сайтів, наприклад параметри пошуку готелів;
  • також можна зберігати підказки для повторюваних дій, як-от замовлення продуктів або бронювання;
  • крім того, можна виконувати кілька завдань одночасно, як у звичайному браузері.
Чи це безпечно

Користувачі можуть відмовитися від збору даних для тренування моделей, вимкнувши опцію «поліпшувати модель для всіх», зазначили в OpenAI. Також можна видалити всі дані браузера й виходити з усіх сайтів одним кліком у налаштуваннях конфіденційності.

Де він працює

Наразі ШІ-асистент доступний лише для користувачів ChatGPT Pro в США за посиланням. У майбутньому компанія планує розширити доступ для користувачів Plus, Team та Enterprise, а також інтегрувати інструмент у ChatGPT.

   

Компанія OpenAI відкрила доступ до пошукового сервісу ChatGPT Search для всіх користувачів. Вона додає посилання на джерела відповідно до запиту користувача. Крім того, формулювати запити в пошуковику можна в більш розмовній формі.

Обкладинка й фото: OpenAI