با ما همراه باشید

تکنولوژی

جنگ با آنتروپیک در حوزه کدنویسی؛ OpenAI از مدل جدیدی برای برنامه‌نویسی عامل‌محور رونمایی کرد

با این مدل، ابزار Codex می‌تواند «تقریباً هر کاری را که توسعه‌دهندگان و متخصصان با کامپیوتر انجام می‌دهند، بر عهده بگیرد.»

منتشر شده

در

OpenAI هفته گذشته از اپلیکیشنی برای توسعه‌دهندگان نرم‌افزار رونمایی کرد که Codex نام دارد و هدف اصلی آن برنامه‌نویسی مبتنی‌بر ایجنت است. حالا این شرکت مدل جدیدی با نام GPT-5.3 Codex را معرفی کرده که عملکرد ابزار مذکور را تا حد امکان تقویت می‌کند.

طبق اعلام OpenAI، این مدل جدید باعث تحول Codex می‌شود و آن را از عاملی که صرفاً «کد می‌نویسد و بررسی می‌کند»، به ابزاری تبدیل می‌کند که می‌تواند «تقریباً هر کاری را که توسعه‌دهندگان و متخصصان با کامپیوتر انجام می‌دهند، برعهده بگیرد.» این تغییر نه‌تنها روش انجام کارها را دگرگون می‌کند، بلکه امکان ساخت نرم‌افزار را برای همه ساده‌تر می‌کند.

OpenAI با آزمایش مدل جدید خود در بنچمارک‌های مختلف، ادعا کرده است که این هوش مصنوعی می‌تواند بازی‌ها و اپلیکیشن‌های پیچیده و کاربردی را در عرض چند روز از صفر تا صد خلق کند.

GPT-5.3 Codex همچنین ۲۵ درصد سریع‌تر از نسل قبلی خود، یعنی GPT-5.2، عمل می‌کند. OpenAI ادعا کرده این نخستین مدل آن است که در فرایند «خلق خود» نقش اساسی داشته و کارکنان OpenAI از نسخه‌های اولیه این برنامه برای رفع باگ‌ها و ارزیابی عملکرد خود مدل استفاده کرده‌اند.

جدال ایجنت‌ها؛ برتری کدنویسی GPT-5.3 در برابر ظرفیت عظیم کلود

انتشار این مدل جدید دقیقاً پس از معرفی مدل برنامه‌نویسی جدید رقیب دیرینه OpenAI، یعنی شرکت Anthropic، صورت گرفته است. مدل Claude 4.6 Opus که قدرتمندترین هوش مصنوعی آنتروپیک محسوب می‌شود، به کاربران اجازه می‌دهد وظایف بزرگ را به بخش‌های کوچک‌تر تقسیم کرده و انجام هر کدام را به یک ایجنت بسپارند.

در مقایسه فنی بین GPT-5.3 Codex و Claude Opus 4.6، شاهد تقابل دو استراتژی متفاوت هستیم؛ جایی که نماینده آنتروپیک با پنجره زمینه (Context Window) خیره‌کننده ۱ میلیون توکنی و تمرکز بر محیط‌های سازمانی، خود را به عنوان ابزاری برای مدیریت پروژه‌های عظیم و کشف باگ‌های امنیتی (کشف بیش از ۵۰۰ مورد Zero-Day) معرفی کرده است.

در مقابل، مدل جدید OpenAI با وجود ظرفیت حافظه کمتر (حدود ۴۰۰ هزار توکن)، در بنچمارک‌های تخصصی برنامه‌نویسی مانند SWE-Bench Pro و Terminal-Bench برتری عددی دارد و با قابلیت‌های منحصربه‌فردی نظیر Mid-Task Steering (هدایت مدل حین انجام وظیفه) و سرعت بالاتر، برای توسعه‌دهندگانی که به‌دنبال دقت و کنترل لحظه‌ای روی کد هستند، گزینه جذاب‌تری به نظر می‌رسد.

ادامه مطلب
برای افزودن دیدگاه کلیک کنید

یک پاسخ بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

جدیدترین اخبار پربحث

خبر مهم اخیر

«مجله فان فارسی» از سال ۱۳۹۰ مجله‌ای در حوزه سرگرمی، سبک زندگی، سفر و فرهنگ روزمره است که با انتشار محتوای جذاب و الهام‌بخش، تجربه‌های زندگی شهری، تفریح، هنر و لحظه‌های خوش را برای مخاطبان روایت می‌کند. کپی بخش یا کل هر کدام از مطالب "فان فارسی" تنها با کسب مجوز مکتوب امکان پذیر است.