محققان بركلی: فناوری DeepSeek را با فقط ۳۰ دلار بازسازی كردیم!

تیمی تحقیقاتی ادعا می‌كند كه فناوری‌های دیپ‌سیك R1-Zero را با تنها ۳۰ دلار بازتولید كرده است.

محققان بركلی: فناوری DeepSeek را با فقط ۳۰ دلار بازسازی كردیم!هوش مصنوعیفناوریچهارشنبه ۱۰ بهمن ۱۴۰۳ - ۲۱:۰۹مطالعه 3 دقیقهپیام هدایتیتبلیغاتمشاهده همه ویدئو‌هاتبلیغاتتبلیغاتتیمی تحقیقاتی ادعا می‌كند كه فناوری‌های دیپ‌سیك R1-Zero را با تنها ۳۰ دلار بازتولید كرده است .

تبلیغاتتیمی تحقیقاتی از دانشگاه كالیفرنیا بركلی به رهبری جیایی پان، دانشجوی دكتری، ادعا می‌كند كه توانسته‌ است فناوری‌های اصلی دیپ‌سیك R1-Zero را با تنها ۳۰ دلار بازتولید كند و نشان دهد كه مدل‌های پیشرفته‌ی هوش مصنوعی را می‌توان با هزینه‌ای بسیار كم پیاده‌سازی كرد .

به گفته‌ی پان در پلتفرم Nitter، این تیم مدل دیپ‌سیك R1-Zero را در بازی Countdown بازتولید كرده‌اند. این مدل زبانی كوچك كه ۳ میلیارد پارامتر دارد، با استفاده از یادگیری تقویتی، قابلیت‌هایی مانند خودبازبینی و جست‌وجو را توسعه داده است .

پان توضیح داد كه تیمش كار را با مدل زبانی پایه و پرامپت اولیه (نقطه شروع برای مدل زبانی) و پاداش مبتنی‌بر داده‌های صحیح آغاز كرد. سپس، فرایند یادگیری تقویتی را بر‌اساس بازی Countdown اجرا كردند. بازی Countdown از برنامه‌ی تلویزیونی بریتانیایی الهام گرفته شده كه در آن بازیكنان باید با استفاده از عملیات ریاضی ساده، عددی تصادفی را با تركیب مجموعه‌ای از اعداد داده‌شده پیدا كنند .

در ابتدای پروژه‌ی تیم تحقیقاتی دانشگاه كالیفرنیا، مدل تنها خروجی‌های تصادفی تولید می‌كرد؛ اما به‌تدریج استراتژی‌های اصلاح و جست‌وجو را توسعه داد تا پاسخ صحیح را بیابد. در نمونه‌ای، مدل ابتدا جوابی را ارائه داد و سپس آن را بررسی و چندین بار اصلاح كرد تا به پاسخ درست رسید .

علاوه‌بر بازی Countdown، تیم دانشگاه كالیفرنیا آزمایش ضرب اعداد را نیز روی مدل اجرا كرد. مدل از ویژگی توزیعی ضرب برای تجزیه و حل گام‌به‌گام مسائل استفاده كرد؛ مشابه روشی كه برخی از افراد هنگام محاسبه ذهنی اعداد بزرگ به كار می‌برند .

محققان دنشگاه كالیفرنیا آزمایش خود را با مدل‌هایی در مقیاس‌های مختلف انجام دادند. در ابتدا، مدلی با ۵۰۰ میلیون پارامتر را آزمایش كردند كه تنها پاسخ تصادفی ارائه می‌داد و بدون بررسی بیشتر متوقف می‌شد. بااین‌حال، با افزایش تعداد پارامترها به ۱٫۵ میلیارد، مدل روش‌های پیچیده‌تری برای افزایش دقت پاسخ خود یاد گرفت .

در مقیاس‌های ۳ تا ۷ میلیارد پارامتر، مدل می‌توانست با مراحل كمتر پاسخ صحیح را پیدا كند.نكته‌ی شگفت‌انگیز این است كه تیم بركلی ادعا می‌كند كه تنها با ۳۰ دلار این پروژه را اجرا كرده است. در مقام مقایسه، API مدل‌های OpenAI برای هر میلیون توكن ورودی ۱۵ دلار هزینه دارد؛ در‌حالی‌كه هزینه‌ی دیپ‌سیك R1 فقط ۰٫۵۵ دلار به‌ازای هر میلیون توكن ورودی است؛ یعنی ۲۷ برابر ارزان‌تر .

پان می‌گوید كه این پروژه در راستای دسترس‌پذیر‌كردن تحقیق روی مقیاس‌پذیری یادگیری تقویتی انجام شده است.مقاله‌های مرتبطهوش مصنوعی دیپ سیك چیست؟ آموزش استفاده از DeepSeekادامه طوفان دیپ‌سیك؛ شركت‌های هوش مصنوعی همچنان شوكه‌اندهوش مصنوعی چینی دیپ‌سیك پس از بورس آمریكا، بورس استرالیا را هم قرمز كردبا‌این‌حال، نیتن لمبرت، متخصص یادگیری ماشینی، درباره‌ی هزینه واقعی دیپ‌سیك تردید دارد .

او اشاره كرده است كه هزینه اعلام‌شده ۵ میلیون دلاری برای آموزش مدل ۶۷۱ میلیارد پارامتری تمام واقعیت را نشان نمی‌دهد.لمبرت درباره‌ی هزینه‌ی توسعه‌ی دیپ‌سیك می‌افزاید كه هزینه‌هایی مانند حقوق محققان و زیرساخت‌ها و برق در محاسبات لحاظ نشده‌اند و او تخمین می‌زند كه هزینه‌ی سالانه اجرای دیپ‌سیك AI بین ۵۰۰ میلیون تا بیش از ۱ میلیارد دلار باشد .

منبع : https://www.zoomit.ir/ai-articles/433837-ai-research-team-claims-reproduce-deepseek-core-for-usd30/

محققان بركلی: فناوری DeepSeek را با فقط ۳۰ دلار بازسازی كردیم!

مجله فن آوری