با ما همراه باشید

تکنولوژی

مدل هوش مصنوعی دیپ‌سیک V3.1 با پنجره محتوایی بزرگ‌تر منتشر شد

نسخه جدید دیپ‌سیک V3.1 توانایی پردازش متون طولانی‌تر را به مدل اضافه می‌کند.

منتشر شده

در

مدل هوش مصنوعی دیپ‌سیک V3.1 با پنجره محتوایی بزرگ‌تر منتشر شد

شرکت چینی دیپ‌سیک نسخه 3.1 مدل بزرگ زبانی خود را معرفی کرد که با افزایش طول پنجره متنی تا 128 هزارتوکن و افزایش تعداد پارامترها به 685 میلیارد، توانایی پردازش و عملکرد مدل را به‌شکل قابل توجهی بهبود داده است.

تغییرات نسخه 3.1 دیپ‌سیک

براساس گزارش‌ها ویژگی متمایز دیپ‌سیک V3.1، توانایی مدیریت متن‌های طولانی است؛ این مدل اکنون قادر است اطلاعات معادل یک کتاب 300 تا 400 صفحه‌ای را پردازش کند. این قابلیت باعث بهبود عملکرد در تولید محتوای طولانی، تحلیل اسناد و انجام مکالمات چندمرحله‌ای می‌شود. شرکت اعلام کرده که این امکان پیش‌تر در نسخه داخلی V3 وجود داشت، اما اکنون در تمامی رابط‌ها به‌طور رسمی فعال شده است.

ویژگی‌های نسخه 3.1 دیپ‌سیک
مدل هوش مصنوعی دیپ‌سیک V3.1 با پنجره محتوایی بزرگ‌تر منتشر شد

DeepSeek 3.1 همچنان بر پایه معماری Mixture-of-Experts (MoE) ساخته شده است و فقط 37 میلیارد پارامتر در هر توکن فعال می‌شود. این مدل از فرمت‌های مختلف دقت شامل BF16 ،FP8 و F32 پشتیبانی می‌کند تا در محیط‌های متنوع انعطاف‌پذیری بیشتری داشته باشد. توسعه‌دهندگان می‌توانند از طریق API یا از طریق Hugging Face به این مدل دسترسی پیدا کنند.

در ارزیابی‌های اولیه، دیپ‌سیک V3.1 با کسب امتیاز 71.6 درصد در آزمون کدنویسی Aider، عملکردی بالاتر از Claude Opus 4 داشت و به یکی از قوی‌ترین مدل‌های متن‌باز برای برنامه‌نویسی تبدیل شد. این مدل همچنین در حل مسائل ریاضی و منطقی پیشرفت چشمگیری نشان داد، اگرچه برخی کاربران تغییر قابل توجهی در توانایی استدلال آن نسبت به مدل R1-0528 قبلی مشاهده نکردند.

شرکت دیپ‌سیک تمامی ارجاعات به مدل R1 را از رابط چت‌بات حذف کرده و به سمت معماری هیبریدی پیش رفته است. قابلیت‌های استدلال اکنون در V3.1 ادغام شده‌اند و دیگر نیازی به مدل جداگانه نیست. هزینه آموزش این نسخه هنوز مشخص نشده، اما نسخه اصلی V3 با استفاده از 2.788 میلیون ساعت GPU روی تراشه‌های انویدیا H800 و با هزینه تقریبی 5.6 میلیون دلار آموزش داده شده بود که پایه‌ای برای نسخه جدید به‌شمار می‌رود.

در شرایطی که انتظار می‌رفت مدل بعدی R2 با تمرکز بر بهبود توانایی‌های استدلال منتشر شود، دیپ‌سیک حالا نسخه V3.1 را منتشر کرده است. گزارش‌ها نشان می‌دهد که مشکلات فنی تراشه‌های Huawei Ascend موجب تأخیر در عرضه R2 شده است. ظاهراً آموزش مدل روی تراشه‌های Ascend به‌دلیل ناسازگاری‌ها موفقیت‌آمیز نبوده و شرکت مجبور شده از پردازشگرهای گرافیکی انویدیا برای آموزش استفاده کند و Ascend را تنها برای استنتاج نگه دارد. این رویکرد ترکیبی باعث پیچیدگی و کندی روند توسعه شده و عرضه را به تعویق انداخته است.

تا زمان عرضه مدل دیپ‌سیک R2، نسخه V3.1 به‌عنوان پرچمدار فعلی دیپ‌سیک باقی می‌ماند و قادر است هم وظایف استدلالی و هم غیراستدلالی را در یک چارچوب یکپارچه اجرا و مدیریت کند.

ادامه مطلب
برای افزودن دیدگاه کلیک کنید

یک پاسخ بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اقتصاد پولی مالی23 دقیقه پیش

آخرین قیمت طلا و سکه امروز ۶ خردادماه ۱۴۰۵

اقتصاد پولی مالی24 دقیقه پیش

آخرین قیمت دلار امروز چهارنشبه ششم خردادماه

اقتصاد پولی مالی25 دقیقه پیش

سقوط آزاد طلا در راه است؟ / طلای جهانی در انتظار مذاکرات ایران و آمریکا

آیت الله خاتمی: دشمن در مذاکرات به دنبال تسلیم ملت ایران است
سیاسی و اجتماعی1 ساعت پیش

آیت الله خاتمی: دشمن در مذاکرات به دنبال تسلیم ملت ایران است

تبریک سخنگوی وزارت خارجه به مناسبت عید قربان
سیاسی و اجتماعی1 ساعت پیش

تبریک سخنگوی وزارت خارجه به مناسبت عید قربان

ولایتی: ضامن عینی بقای توافق،⁧‫تنگه هرمز‬⁩ است
سیاسی و اجتماعی1 ساعت پیش

ولایتی: ضامن عینی بقای توافق،⁧‫تنگه هرمز‬⁩ است

تنگه هرمز؛ تضمین اجرایی ایران در برابر نقض عهد احتمالی آمریکا
سیاسی و اجتماعی1 ساعت پیش

تنگه هرمز؛ تضمین اجرایی ایران در برابر نقض عهد احتمالی آمریکا

مزدوران ضدانقلاب خارج کشور از آتشی که می‌افروزند در امان نخواهند بود
سیاسی و اجتماعی1 ساعت پیش

مزدوران ضدانقلاب خارج کشور از آتشی که می‌افروزند در امان نخواهند بود

تصمیم ایرلند برای تصویب ممنوعیت واردات کالا از اسرائیل قابل تقدیر است
سیاسی و اجتماعی1 ساعت پیش

تصمیم ایرلند برای تصویب ممنوعیت واردات کالا از اسرائیل قابل تقدیر است

تقویت روحیه ایثار و وحدت، کلید سرافرازی میهن اسلامی است
سیاسی و اجتماعی1 ساعت پیش

تقویت روحیه ایثار و وحدت، کلید سرافرازی میهن اسلامی است

جدیدترین اخبار پربحث

خبر مهم اخیر

«مجله فان فارسی» از سال ۱۳۹۰ مجله‌ای در حوزه سرگرمی، سبک زندگی، سفر و فرهنگ روزمره است که با انتشار محتوای جذاب و الهام‌بخش، تجربه‌های زندگی شهری، تفریح، هنر و لحظه‌های خوش را برای مخاطبان روایت می‌کند. کپی بخش یا کل هر کدام از مطالب "فان فارسی" تنها با کسب مجوز مکتوب امکان پذیر است.