OpenAI «پیشنمایشی تحقیقاتی» از ایجنت هوش مصنوعی جدیدی بهنام Operator منتشر کرد که میتواند برای انجام وظایف شما به وب برود. OpenAI میگوید: «با استفاده از مرورگر خود، Operator میتواند به یک صفحهی وب نگاه کند و با تایپکردن، کلیککردن و پیمایش با آن تعامل داشته باشد.» Operator ابتدا در ایالات متحده برای مشترکین ChatGPT Pro با هزینهی ۲۰۰ دلار در ماه راهاندازی میشود.
OpenAI میگوید Operator به یک مدل کامپیوتر-ایجنت متکی است که قابلیتهای دید GPT-4o را با «استدلال پیشرفته از طریق یادگیری تقویتی» ترکیب میکند تا بتواند با رابطهای کاربری گرافیکی (GUI) تعامل داشته باشد.
پخش از رسانه
به گفتهی اوپنایآی، Operator میتواند بدون نیاز به ادغام API سفارشی، با یک مرورگر «ببیند و تعامل کند» درست مانند همان کاری که کاربر با ماوس و کیبورد انجام میدهد.
ایجنت Operator میتواند از استدلال برای «خود اصلاحی» استفاده کند و اگر جایی گیر کند، کنترل را به کاربر میدهد. زمانی که یک وبسایت اطلاعات حساس مانند اطلاعات ورود به سیستم را درخواست کند، Operator از کاربر میخواهد که کنترل را در دست بگیرد و اقداماتی مانند ارسال ایمیل را تأیید کند. OpenAI میگوید که Operator به گونهای طراحی شده است که «درخواستهای مضر را رد و محتوای غیرمجاز را مسدود کند.»
-
برنامه OpenAI برای انتشار عامل هوش مصنوعی (ایجنت) در سال آینده
-
چتجیپیتی حالا وظایف شما را مدیریت میکند: دستیار هوشمند برای برنامهریزی روزانه
خالق ChatGPT با شرکتهایی مانند DoorDash و Instacart و OpenTable و Priceline و StubHub و Thumbtack و Uber همکاری میکند تا Operator ضمن رعایت هنجارهای تثبیتشده، به نیازهای دنیای واقعی پاسخ دهد. اوپنایآی اشاره میکند که ممکن است هنوز همه چیز آنطور که کاربر انتظار دارد کار نکند. این ابزار درحالحاضر با «رابطهای پیچیده مانند ایجاد نمایش اسلاید یا مدیریت تقویم» مشکل دارد.
OpenAI میخواهد در آینده ضمن ارائهی Operator برای کاربران Plus و Team و Enterprise این قابلیتها را در ChatGPT ادغام کند.