با ما همراه باشید

تکنولوژی

مدل ChatGPT Images 2.0 معرفی شد؛ رقیب نانوبنانا با دقت خیره‌کننده در تولید متن

مدل تصویرساز جدید Images 2.0 به کاربران ChatGPT اجازه می‌دهد به صورت مستقیم در داخل این چت‌بات تصویر تولید کنند.

منتشر شده

در

مدل ChatGPT Images 2.0 معرفی شد؛ رقیب نانوبنانا با دقت خیره‌کننده در تولید متن

حدود یک سال پس از آنکه OpenAI به کاربران ChatGPT اجازه داد تا تصاویر و طراحی‌های مدنظر خود را مستقیماً داخل این چت‌بات خلق کنند، حالا این شرکت ChatGPT Images 2.0 را منتشر کرده تا با مدل نانو بنانا گوگل رقابت کند. این سیستم به‌عنوان گامی بزرگ برای مدل‌های تولید تصویر معرفی شده که می‌تواند دستورالعمل‌ها را دقیق دنبال کند، متن بسازد و اشیا را درون صحنه قرار دهد.

معرفی مدل هوش مصنوعی ChatGPT Images 2.0

مدل‌های هوش مصنوعی تصویرساز از دیرباز در تولید متن چالش داشته‌اند اما Images 2.0 در زمینه فهم متون غیرلاتین در زبان‌هایی مثل ژاپنی، کره‌ای، هندی و بنگالی عملکرد بسیار بهتری دارد. در بیانیه OpenAI آمده است:

«مدل Images 2.0 سطح بی‌بدیلی از تخصص و وفاداری را در زمینه تولید تصویر ارائه می‌کند. این مدل نه‌تنها می‌تواند تصاویر پیچیده‌تر بسازد، بلکه به بینش خود بهتر حیات می‌بخشد، می‌تواند دستورالعمل‌ها را دنبال کند، جزئیات خواسته‌شده را رعایت نماید، و عناصر دقیقی را رندر کند که معمولاً مدل‌های تصویرساز را دچار مشکل می‌کنند، عناصری مثل متون کوچک، نمادها، عناصر رابط کاربری، ترکیب‌های متراکم و محدودیت‌های سبک طراحی. همه این خروجی‌ها تا رزولوشن 2K قابل تولید هستند.»

اگر از Images 2.0 بخواهید منوی غذاهای یک رستوران مکزیکی را تولید کند، خروجی کار چیزی است که بلافاصله در یک رستوران واقعی قابل استفاده خواهد بود.

مدل ChatGPT Images 2.0 معرفی شد؛ رقیب نانوبنانا با دقت خیره‌کننده در تولید متن

جهت مقایسه، دو سال پیش همین پرامپت به DALL-E 3 داده شده بود که خروجی زیر را تولید کرد:

مدل ChatGPT Images 2.0 معرفی شد؛ رقیب نانوبنانا با دقت خیره‌کننده در تولید متن

مدل Images 2.0 به اندازه ChatGPT در تولید پاسخ سریع نیست، اما در عرض چند دقیقه می‌تواند طرح‌های پیچیده‌ای مثل کامیک‌های چند صفحه‌ای را خلق کند. این مدل اولین مدل تصویرساز با قابلیت استدلال است که اجازه می‌دهد هوش مصنوعی در وب جستجو و خروجی‌ها را بررسی کند. در نتیجه دقت مدل افزایش می‌یابد.

OpenAI می‌گوید مدل Images 2.0 به‌طور خاص در انجام کارهایی مثل تهیه پروتوتایپ بازی‌ها و استوری‌برد فیلم‌ها خوب عمل می‌کند. این مدل در بخش تنظیم نسبت تصویر هم انعطاف‌پذیری خوبی دارد و می‌تواند تصاویری با نسبت ۳:۱ و حتی ۱:۳ تولید کند.

تمام کاربران رایگان و پولی ChatGPT و Codex از امروز می‌توانند از مدل Images 2.0 استفاده کنند. کاربران اشتراک‌های پولی قادر به تولید خروجی‌های پیشرفته‌تر خواهند بود. OpenAI همچنین API مدل gpt-image-2 را در دسترس قرار می‌دهد و هزینه آن براساس کیفیت و رزولوشن خروجی تعیین خواهد شد.

ادامه مطلب
برای افزودن دیدگاه کلیک کنید

یک پاسخ بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

سینمای جنگ ایران؛ از حماسه شهادت تا قهرمان متفکر
سینمای ایران و جهان9 دقیقه پیش

سینمای جنگ ایران؛ از حماسه شهادت تا قهرمان متفکر

روایت یک رهبر مسیحی در دل جنگ اعراب و اسرائیل/ «نگهبان قدس» روی آنتن افق
سینمای ایران و جهان1 ساعت پیش

روایت یک رهبر مسیحی در دل جنگ اعراب و اسرائیل/ «نگهبان قدس» روی آنتن افق

مادرم تاثیرگذارترین فرد در ۱۵ سال فعالیت هنری من است/ فصل جدید «دودکش» در راه است
سینمای ایران و جهان1 ساعت پیش

مادرم تاثیرگذارترین فرد در ۱۵ سال فعالیت هنری من است/ فصل جدید «دودکش» در راه است

سینمای ایران و جهان1 ساعت پیش

ببینید | افشاگری سوگل خلیق از رفتار زشت برخی معلمان با او در دوران دبیرستان

خودرو2 ساعت پیش

کف قیمت خودرو در بازار چقدر است؟

شبکه آب‌رسانی و آب شرب سد «آبسرده» احداث می‌شود
سیاسی و اجتماعی2 ساعت پیش

شبکه آب‌رسانی و آب شرب سد «آبسرده» احداث می‌شود

قیمت طلای 18عیار امروز یکشنبه 17خرداد/ افزایش قیمت طلا + جدول و جزئیات کامل
اقتصاد پولی مالی3 ساعت پیش

قیمت طلای 18عیار امروز یکشنبه 17خرداد/ افزایش قیمت طلا + جدول و جزئیات کامل

قیمت دلار امروز یکشنبه 17خرداد/ افزایش قیمت + جدول و جزئیات
اقتصاد پولی مالی3 ساعت پیش

قیمت دلار امروز یکشنبه 17خرداد/ افزایش قیمت + جدول و جزئیات

جزئیات حراج شمش طلا در خرداد ۱۴۰۴ منتشر شد
اقتصاد پولی مالی3 ساعت پیش

جزئیات حراج شمش طلا در خرداد ۱۴۰۴ منتشر شد

سیاسی و اجتماعی4 ساعت پیش

روایت فرزندان سرلشکر شهید جمشید اسحاقی از نحوه شهادت پدرشان

جدیدترین اخبار پربحث

خبر مهم اخیر

«مجله فان فارسی» از سال ۱۳۹۰ مجله‌ای در حوزه سرگرمی، سبک زندگی، سفر و فرهنگ روزمره است که با انتشار محتوای جذاب و الهام‌بخش، تجربه‌های زندگی شهری، تفریح، هنر و لحظه‌های خوش را برای مخاطبان روایت می‌کند. کپی بخش یا کل هر کدام از مطالب "فان فارسی" تنها با کسب مجوز مکتوب امکان پذیر است.