با ما همراه باشید

تکنولوژی

هوش مصنوعی جدید تنسنت، عکس را به دنیای سه‌بعدی قابل کاوش تبدیل می‌کند [تماشا کنید]

این مدل با نام HunyuanWorld-Voyager از یک تصویر ثابت ویدیوهای شبه‌سه‌بعدی می‌سازد.

منتشر شده

در

هوش مصنوعی جدید تنسنت، عکس را به دنیای سه‌بعدی قابل کاوش تبدیل می‌کند [تماشا کنید]

شرکت چینی تنسنت (Tencent) از مدل هوش مصنوعی جدیدی به نام HunyuanWorld-Voyager رونمایی کرده که می‌تواند یک عکس را به ویدیوهای سه‌بعدی تبدیل کند.

طبق گزارش‌های منتشر شده، این مدل جدید به کاربران اجازه می‌دهد مسیر حرکت دوربین را مشخص کرده و در صحنه‌های مجازی که براساس عکس تولید می‌شود، حرکت کنند. این مدل به‌طور هم‌زمان ویدیو و داده‌های عمق تولید می‌کند و بدون نیاز به ابزارهای مدل‌سازی سنتی امکان ساخت مدل‌های سه‌بعدی را فراهم می‌کند.

البته نتایجی که توسط این مدل ارائه می‌شوند دقیقاً مدل‌های سه‌بعدی نیستند، بلکه ویدیوهایی دوبعدی هستند که با حفظ سازگاری فضا، حرکت دوربین در یک محیط سه‌بعدی را شبیه‌سازی می‌کنند. همچنین مدل هر بار فقط 49 فریم (حدود دو ثانیه ویدیو) را تولید می‌کند، اما می‌توان چندین کلیپ را به هم متصل کرد و ویدیوهای چند دقیقه‌ای ساخت.

ورودی این مدل هوش مصنوعی فقط یک تصویر و مسیر حرکت دوربین است. حرکت‌هایی مانند روبه‌جلو، عقب، چرخش یا حرکت به ‌طرفین نیز توسط رابط آن قابل تنظیم هستند.

تنسنت می‌گوید این مدل هوش مصنوعی جدید با بیش از 100 هزار کلیپ ویدیویی آموزش دیده است که شامل صحنه‌های واقعی و رندرهای Unreal Engine می‌شود. این داده‌ها به‌صورت خودکار توسط نرم‌افزاری پردازش شده‌اند که حرکت دوربین و عمق هر فریم را محاسبه می‌کند.

محدودیت‌های مدل هوش مصنوعی تنسنت

بااین‌حال، محدودیت‌های معماری Transformer باعث می‌شود مدل بتواند فقط الگوهای دیده‌شده در داده‌های آموزشی را شبیه‌سازی کند و در موقعیت‌های کاملاً جدید دچار خطا شود. به همین دلیل، Voyager در تولید چرخش‌های 360 درجه‌ای دچار اختلال می‌شود.

عملکرد هوش مصنوعی تنسنت
هوش مصنوعی جدید تنسنت، عکس را به دنیای سه‌بعدی قابل کاوش تبدیل می‌کند [تماشا کنید]

از نظر عملکرد، در بنچمارک WorldScore متعلق به دانشگاه استنفورد، Voyager بالاترین امتیاز کلی یعنی 77.62 را کسب کرده است. این مدل در کنترل اشیاء، سازگاری سبک و کیفیت خروجی عملکرد درخشانی داشته است، اما در کنترل حرکت دوربین پس از WonderWorld در رتبه دوم قرار گرفت.

برای اجرای مدل نیز به توان سخت‌افزاری بسیار بالایی نیاز دارد، چرا که برای خروجی 540p حداقل به 60 گیگابایت حافظه گرافیکی نیاز دارد. تنسنت هم‌اکنون وزن‌های مختلف مدل را در Hugging Face منتشر کرده و کد آن را برای اجرا در دسترس قرار داده است.

ادامه مطلب
برای افزودن دیدگاه کلیک کنید

یک پاسخ بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

ترازو در دست مخاطبان؛ بازخوانی دوگانه کیهان و سلبریتی‌ها
سینمای ایران و جهان4 دقیقه پیش

ترازو در دست مخاطبان؛ بازخوانی دوگانه کیهان و سلبریتی‌ها

عکس | خشم همسر مسی از شایعه عمل زیبایی!
سینمای ایران و جهان4 دقیقه پیش

عکس | خشم همسر مسی از شایعه عمل زیبایی!

پرسپولیس در آستانه یک جدایی مهم/ قرارداد سروش رفیعی تمدید نمی‌شود؟
ورزشی28 دقیقه پیش

پرسپولیس در آستانه یک جدایی مهم/ قرارداد سروش رفیعی تمدید نمی‌شود؟

تیم ملی با لباس اصلی مقابل مصر+ عکس
ورزشی29 دقیقه پیش

تیم ملی با لباس اصلی مقابل مصر+ عکس

تحریم نوبیتکس و یک ابهام بزرگ/ آیا دارایی کاربران در خطر است؟
اقتصاد پولی مالی33 دقیقه پیش

تحریم نوبیتکس و یک ابهام بزرگ/ آیا دارایی کاربران در خطر است؟

متقاضیان تسهیلات بانکی بخوانند/ چه کسانی می‌توانند از وام ۴۰۰ میلیونی مسکن برخوردار شوند؟ + دستورالعمل بانک مرکزی
ساختمان و معماری54 دقیقه پیش

متقاضیان تسهیلات بانکی بخوانند/ چه کسانی می‌توانند از وام ۴۰۰ میلیونی مسکن برخوردار شوند؟ + دستورالعمل بانک مرکزی

۳۴۷ صفحه مجازی مداخله گر در امور درمان مسدود شد
پزشکی و سلامت56 دقیقه پیش

۳۴۷ صفحه مجازی مداخله گر در امور درمان مسدود شد

پزشکی و سلامت56 دقیقه پیش

آیا سیگارهای الکترونیکی برای سلامتی مضر هستند؟

انتشار فراخوان جشنواره نمایش عروسکی تهران-مبارک
سینمای ایران و جهان60 دقیقه پیش

انتشار فراخوان جشنواره نمایش عروسکی تهران-مبارک

رونمایی از پوسترهای «روایت علوی» در تئاتر شهر/ چشم‌انداز بین‌المللی برای ترویج فرهنگ غدیر
سینمای ایران و جهان60 دقیقه پیش

رونمایی از پوسترهای «روایت علوی» در تئاتر شهر/ چشم‌انداز بین‌المللی برای ترویج فرهنگ غدیر

جدیدترین اخبار پربحث

خبر مهم اخیر

«مجله فان فارسی» از سال ۱۳۹۰ مجله‌ای در حوزه سرگرمی، سبک زندگی، سفر و فرهنگ روزمره است که با انتشار محتوای جذاب و الهام‌بخش، تجربه‌های زندگی شهری، تفریح، هنر و لحظه‌های خوش را برای مخاطبان روایت می‌کند. کپی بخش یا کل هر کدام از مطالب "فان فارسی" تنها با کسب مجوز مکتوب امکان پذیر است.