با ما همراه باشید

تکنولوژی

تحقیق اپل: مدل‌های زبانی می‌توانند با داده‌های صوتی و حرکتی تشخیص دهند چه کار می‌کنید

مدل‌های LLM با داده‌های صوتی و حرکتی می‌توانند تحلیل بهتری از فعالیت‌های کاربر داشته باشند.

منتشر شده

در

تحقیق اپل: مدل‌های زبانی می‌توانند با داده‌های صوتی و حرکتی تشخیص دهند چه کار می‌کنید

اپل تحقیق جدیدی منتشر کرده که نشان می‌دهد مدل‌های زبانی بزرگ (LLM) چگونه می‌توانند داده‌های صوتی و حرکتی را تحلیل کنند تا دید بهتری از فعالیت‌های کاربر به دست آورند.

یک مقاله جدید با عنوان «استفاده از LLMها برای ادغام چند حسی سنسورها در تشخیص فعالیت» اطلاعاتی درباره اینکه اپل چگونه ممکن است از تحلیل LLM در کنار داده‌های سنتی سنسورها برای درک دقیق‌تر فعالیت کاربر استفاده کند، ارائه می‌دهد. به گفته محققان، این روش پتانسیل بالایی برای افزایش دقت تحلیل فعالیت‌ها حتی در شرایطی که داده‌های کافی از سنسور موجود نیست، دارد.

مدل‌های زبانی بزرگ می‌توانند با داده‌های کمتر نوع فعالیت کاربر را مشخص کنند

در این تحقیق مشخص شد که مدل‌های زبانی بزرگ توانایی بسیار قابل‌توجهی در استنباط فعالیت‌های کاربر از طریق سیگنال‌های صوتی و حرکتی دارند، حتی اگر به‌صورت خاص برای این کار آموزش ندیده باشند. همچنین وقتی تنها یک مثال به آنها داده می‌شود، دقتشان حتی بیشتر هم می‌شود.

مدل‌های زبانی بزرگ اپل

یک تفاوت مهم این است که در این مطالعه، LLM خود فایل صوتی واقعی را دریافت نکرده بود، بلکه توضیحات کوتاه متنی تولیدشده توسط مدل‌های صوتی و یک مدل حرکتی مبتنی بر IMU به آن داده شد. IMU یا دستگاه سنجش لختی (اینرسی) حرکت را از طریق داده‌های شتاب‌سنج و ژیروسکوپ دنبال می‌کند.

در این مقاله، محققان توضیح داده‌اند که از Ego4D (یک مجموعه داده عظیم از رسانه‌هایی که با دیدگاه اول‌شخص ضبط شده) استفاده کرده‌اند. این داده‌ها شامل هزاران ساعت اطلاعات از محیط‌ها و موقعیت‌های واقعی از کارهای خانه گرفته تا فعالیت‌های فضای باز هستند.

محققان داده‌های صوتی و حرکتی را از طریق مدل‌های کوچک‌تر عبور دادند که زیرنویس متنی و پیش‌بینی کلاس‌ها را تولید می‌کردند، سپس این خروجی‌ها را به مدل‌های مختلف LLM مانند جمینای ۲.۵ پرو و Qwen-32B دادند تا ببینند چقدر می‌توانند فعالیت‌ها را شناسایی کنند.

اپل عملکرد این مدل‌ها را در دو وضعیت مختلف مقایسه کرد؛ یکی زمانی که لیست ۱۲ فعالیت ممکن برای انتخاب در اختیارشان قرار گرفت و دیگری زمانی که هیچ گزینه‌ای داده نشد.

محققان در پایان اشاره می‌کنند که نتایج این مطالعه اطلاعات جالبی درباره نحوه ترکیب چند مدل برای تحلیل داده‌های فعالیت و سلامت ارائه می‌دهد، به‌ویژه در مواردی که داده‌های خام سنسورها به تنهایی کافی نیستند تا تصویر واضحی از فعالیت کاربر ارائه دهند.

ادامه مطلب
برای افزودن دیدگاه کلیک کنید

یک پاسخ بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

مد و زیبایی6 دقیقه پیش

اهمیت پوست و مو در زیبایی ظاهری

۱۰۰موج وعده صادق ۴موجب اشتباه محاسباتی و التماس آتش بس دشمن شد
سیاسی و اجتماعی13 دقیقه پیش

۱۰۰موج وعده صادق ۴موجب اشتباه محاسباتی و التماس آتش بس دشمن شد

تقدیر کمیسیون فرهنگی از اقدامات سازمان تبلیغات اسلامی در جنگ رمضان
سیاسی و اجتماعی13 دقیقه پیش

تقدیر کمیسیون فرهنگی از اقدامات سازمان تبلیغات اسلامی در جنگ رمضان

سپاه، پرچم مقاومت و سربلندی ایران اسلامی را برافراشته نگاه داشته است
سیاسی و اجتماعی13 دقیقه پیش

سپاه، پرچم مقاومت و سربلندی ایران اسلامی را برافراشته نگاه داشته است

بیانیه شورای نگهبان به مناسبت سالروز تأسیس سپاه پاسداران انقلاب اسلامی
سیاسی و اجتماعی14 دقیقه پیش

بیانیه شورای نگهبان به مناسبت سالروز تأسیس سپاه پاسداران انقلاب اسلامی

امیر حاتمی: وحدت ارتش و سپاه، سرمایه‌ای مهم برای تثبیت امنیت ملی است
سیاسی و اجتماعی14 دقیقه پیش

امیر حاتمی: وحدت ارتش و سپاه، سرمایه‌ای مهم برای تثبیت امنیت ملی است

تأکید عارف بر پایداری ارتباطات در شرایط جنگی
سیاسی و اجتماعی14 دقیقه پیش

تأکید عارف بر پایداری ارتباطات در شرایط جنگی

پاسداران این مسیر مقدس، همواره گوش به فرمان ولی فقیه هستند
سیاسی و اجتماعی14 دقیقه پیش

پاسداران این مسیر مقدس، همواره گوش به فرمان ولی فقیه هستند

هلاکت عناصر جیش‌الظلم در راسک و کشف حجم بی‌سابقه سلاح و مواد منفجره
سیاسی و اجتماعی14 دقیقه پیش

هلاکت عناصر جیش‌الظلم در راسک و کشف حجم بی‌سابقه سلاح و مواد منفجره

بقایی: پیام‌های متناقضی از آمریکا دریافت کرده ایم
سیاسی و اجتماعی14 دقیقه پیش

بقایی: پیام‌های متناقضی از آمریکا دریافت کرده ایم

جدیدترین اخبار پربحث

خبر مهم اخیر

«مجله فان فارسی» از سال ۱۳۹۰ مجله‌ای در حوزه سرگرمی، سبک زندگی، سفر و فرهنگ روزمره است که با انتشار محتوای جذاب و الهام‌بخش، تجربه‌های زندگی شهری، تفریح، هنر و لحظه‌های خوش را برای مخاطبان روایت می‌کند. کپی بخش یا کل هر کدام از مطالب "فان فارسی" تنها با کسب مجوز مکتوب امکان پذیر است.