محققان بركلی: فناوری DeepSeek را با فقط ۳۰ دلار بازسازی كردیم!

تیمی تحقیقاتی ادعا می‌كند كه فناوری‌های دیپ‌سیك R1-Zero را با تنها ۳۰ دلار بازتولید كرده است.

محققان بركلی: فناوری DeepSeek را با فقط ۳۰ دلار بازسازی كردیم!هوش مصنوعیفناوریچهارشنبه ۱۰ بهمن ۱۴۰۳ - ۲۱:۰۹مطالعه 3 دقیقهپیام هدایتیتبلیغاتمشاهده همه ویدئو‌هاتبلیغاتتبلیغاتتیمی تحقیقاتی ادعا می‌كند كه فناوری‌های دیپ‌سیك R1-Zero را با تنها ۳۰ دلار بازتولید كرده است .

تبلیغاتتیمی تحقیقاتی از دانشگاه كالیفرنیا بركلی به رهبری جیایی پان، دانشجوی دكتری، ادعا می‌كند كه توانسته‌ است فناوری‌های اصلی دیپ‌سیك R1-Zero را با تنها ۳۰ دلار بازتولید كند و نشان دهد كه مدل‌های پیشرفته‌ی هوش مصنوعی را می‌توان با هزینه‌ای بسیار كم پیاده‌سازی كرد .

به گفته‌ی پان در پلتفرم Nitter، این تیم مدل دیپ‌سیك R1-Zero را در بازی Countdown بازتولید كرده‌اند. این مدل زبانی كوچك كه ۳ میلیارد پارامتر دارد، با استفاده از یادگیری تقویتی، قابلیت‌هایی مانند خودبازبینی و جست‌وجو را توسعه داده است .

پان توضیح داد كه تیمش كار را با مدل زبانی پایه و پرامپت اولیه (نقطه شروع برای مدل زبانی) و پاداش مبتنی‌بر داده‌های صحیح آغاز كرد. سپس، فرایند یادگیری تقویتی را بر‌اساس بازی Countdown اجرا كردند. بازی Countdown از برنامه‌ی تلویزیونی بریتانیایی الهام گرفته شده كه در آن بازیكنان باید با استفاده از عملیات ریاضی ساده، عددی تصادفی را با تركیب مجموعه‌ای از اعداد داده‌شده پیدا كنند .

در ابتدای پروژه‌ی تیم تحقیقاتی دانشگاه كالیفرنیا، مدل تنها خروجی‌های تصادفی تولید می‌كرد؛ اما به‌تدریج استراتژی‌های اصلاح و جست‌وجو را توسعه داد تا پاسخ صحیح را بیابد. در نمونه‌ای، مدل ابتدا جوابی را ارائه داد و سپس آن را بررسی و چندین بار اصلاح كرد تا به پاسخ درست رسید .

علاوه‌بر بازی Countdown، تیم دانشگاه كالیفرنیا آزمایش ضرب اعداد را نیز روی مدل اجرا كرد. مدل از ویژگی توزیعی ضرب برای تجزیه و حل گام‌به‌گام مسائل استفاده كرد؛ مشابه روشی كه برخی از افراد هنگام محاسبه ذهنی اعداد بزرگ به كار می‌برند .

محققان دنشگاه كالیفرنیا آزمایش خود را با مدل‌هایی در مقیاس‌های مختلف انجام دادند. در ابتدا، مدلی با ۵۰۰ میلیون پارامتر را آزمایش كردند كه تنها پاسخ تصادفی ارائه می‌داد و بدون بررسی بیشتر متوقف می‌شد. بااین‌حال، با افزایش تعداد پارامترها به ۱٫۵ میلیارد، مدل روش‌های پیچیده‌تری برای افزایش دقت پاسخ خود یاد گرفت .

در مقیاس‌های ۳ تا ۷ میلیارد پارامتر، مدل می‌توانست با مراحل كمتر پاسخ صحیح را پیدا كند.نكته‌ی شگفت‌انگیز این است كه تیم بركلی ادعا می‌كند كه تنها با ۳۰ دلار این پروژه را اجرا كرده است. در مقام مقایسه، API مدل‌های OpenAI برای هر میلیون توكن ورودی ۱۵ دلار هزینه دارد؛ در‌حالی‌كه هزینه‌ی دیپ‌سیك R1 فقط ۰٫۵۵ دلار به‌ازای هر میلیون توكن ورودی است؛ یعنی ۲۷ برابر ارزان‌تر .

پان می‌گوید كه این پروژه در راستای دسترس‌پذیر‌كردن تحقیق روی مقیاس‌پذیری یادگیری تقویتی انجام شده است.مقاله‌های مرتبطهوش مصنوعی دیپ سیك چیست؟ آموزش استفاده از DeepSeekادامه طوفان دیپ‌سیك؛ شركت‌های هوش مصنوعی همچنان شوكه‌اندهوش مصنوعی چینی دیپ‌سیك پس از بورس آمریكا، بورس استرالیا را هم قرمز كردبا‌این‌حال، نیتن لمبرت، متخصص یادگیری ماشینی، درباره‌ی هزینه واقعی دیپ‌سیك تردید دارد .

او اشاره كرده است كه هزینه اعلام‌شده ۵ میلیون دلاری برای آموزش مدل ۶۷۱ میلیارد پارامتری تمام واقعیت را نشان نمی‌دهد.لمبرت درباره‌ی هزینه‌ی توسعه‌ی دیپ‌سیك می‌افزاید كه هزینه‌هایی مانند حقوق محققان و زیرساخت‌ها و برق در محاسبات لحاظ نشده‌اند و او تخمین می‌زند كه هزینه‌ی سالانه اجرای دیپ‌سیك AI بین ۵۰۰ میلیون تا بیش از ۱ میلیارد دلار باشد .

منبع : https://www.zoomit.ir/ai-articles/433837-ai-research-team-claims-reproduce-deepseek-core-for-usd30/

مجله فن آوری

 
۱۸ سال در صدر؛ اپل باز هم «تحسین‌شده‌ترین شركت دنیا» شد
1403/11/11
تولیدمثل بدون مادر؛ دانشمندان چینی موش‌هایی با دو والد نر به دنیا آوردند
1403/11/11
گوگل برای جلوگیری از ورود نرم‌افزارهای مخرب به پلی استور دست‌به‌دامان هوش مصنوعی شد
1403/11/11
گروه تحت رهبری مستربیست با پیشنهاد ۲۰ میلیارد دلاری به‌دنبال خرید تیك‌تاك است
1403/11/11
مدت‌زمان بازی گیمرها در Xbox Cloud Gaming به ۱۴۰ میلیون ساعت رسید
1403/11/11
باتری گلكسی S25 اولترا در تست‌های اولیه، درخشان ظاهر شد
1403/11/11
زلزله در دنیای هوش مصنوعی؛ چطور چینی‌ها با دیپ‌سیك دنیا را غافلگیر كردند
1403/11/11
كل دیتابیس دیپ‌سیك لو رفت؛ جنجال جدید برای استارتاپ چینی هوش مصنوعی
1403/11/11
قیمت میم‌كوین ترامپ ۶۴ درصد از بالاترین سطح فاصله دارد
1403/11/11
تأیید شد: «فون 3a» گوشی بعدی ناتینگ است
1403/11/11
جزئیاتی از مدل جهانی شیائومی ۱۵ اولترا لو رفت
1403/11/11
ویندوز، اشتراك‌گذاری فایل برای كاربران اندروید را ساده‌تر می‌كند
1403/11/11
ویژگی Google Play Protect را نمی‌توان در حین تماس غیرفعال كرد
1403/11/11
هركس بتواند خط باستانی سند را رمزگشایی كند، یك میلیون دلار جایزه می‌گیرد
1403/11/11
ویمو قابلیت عجیبی به تاكسی‌های خودران اضافه می‌كند
1403/11/11
ترامپ به‌دنبال محدودیت بیشتر فروش تراشه‌های انویدیا به چین است؛ سقوط سهام تیم سبز
1403/11/11
بعدیانتها


با توجه به نیاز همیشگی شهروندان به اطلاعات و تلفن های تجاری و دولتی اقدام به تولید و راه اندازی سامانه 118 نوین بعنوان بزرگترین پایگاه اطلاعات مشاغل در کشور نمودیم .هدف ما در دسترس قرار دادن اطلاعات و مشخصات مریوط به مشاغل خصوصی و دولتی به عموم شهروندان و کاربران می باشد.


مشهد میدان راهنمایی روبروی دستغیب 3 پلاک 18
تلفن : 38472159 - 051 (10 خط)
ایمیل : info@118ovin.com