ساخت مدل هوش مصنوعی استدلالگر رایگان با هزینه کمتر از ۵۰ دلار

انقلابی در هوش مصنوعی؟ ساخت مدل استدلالگر رایگان با هزینه کمتر از ۵۰ دلار! در دنیای پرهیاهوی هوش مصنوعی، خبر ساخت یک مدل استدلالگر رایگان با هزینه کمتر از ۵۰ دلار، مانند بمبی صدا کرد. این دستاورد توسط محققان دانشگاههای استنفورد و واشنگتن انجام شده و میتواند چالشی جدی برای شرکتهای بزرگ هوش مصنوعی مانند
انقلابی در هوش مصنوعی؟ ساخت مدل استدلالگر رایگان با هزینه کمتر از ۵۰ دلار!
در دنیای پرهیاهوی هوش مصنوعی، خبر ساخت یک مدل استدلالگر رایگان با هزینه کمتر از ۵۰ دلار، مانند بمبی صدا کرد. این دستاورد توسط محققان دانشگاههای استنفورد و واشنگتن انجام شده و میتواند چالشی جدی برای شرکتهای بزرگ هوش مصنوعی مانند OpenAI باشد.
سقوط سهام و ظهور رقیبان ارزانقیمت
هفتههای گذشته، هوش مصنوعی چینی DeepSeek با هزینه ساخت بسیار کمتر از مدلهای آمریکایی، باعث نگرانی و حتی سقوط سهام شرکتهای فناوری و بازارهای جهانی شده بود. حالا، محققان آمریکایی با ساخت مدل s1 نشان دادهاند که میتوان با هزینهای به مراتب کمتر، به تواناییهای مشابهی در زمینه استدلال دست یافت.
جزئیات مدل s1
این مدل که s1 نام دارد، در تستهایی که توانایی آن در ریاضی و کدنویسی را میسنجند، عملکردی مشابه مدلهای استدلالگر پیشرفته مانند o1 از OpenAI و DeepSeek R1 داشته است. نکته جالب توجه، دسترسی عمومی به مدل s1 به همراه دادهها و کد مورد استفاده برای آموزش آن در GitHub است.
نحوه ساخت مدل s1
محققان در مقاله خود توضیح دادهاند که ابتدا یک مدل پایه را توسعه داده و سپس با استفاده از فرایندی به نام «تقطیر»، قابلیتهای «استدلال» را از مدل هوش مصنوعی دیگری استخراج و به مدل پایه اضافه کردهاند. در این فرایند، از مدل جمینای ۲.۰ Flash Thinking Experimental گوگل کمک گرفته شده است.
هزینه و زمان آموزش
آموزش مدل s1 با ۱۶ پردازنده گرافیکی انویدیا H100 کمتر از ۳۰ دقیقه طول کشیده است. این در حالی است که آموزش مدلهای مشابه توسط شرکتهای بزرگ، به زمان و هزینه بسیار بیشتری نیاز دارد.
رویکردی ساده و مؤثر
تیم تحقیقاتی سازنده s1 در توسعه مدل خود به دنبال سادهترین رویکرد برای دستیابی به عملکرد قدرتمند در استدلال و «مقیاسبندی زمان آزمون» بودهاند. مورد دوم به مدل هوش مصنوعی اجازه میدهد تا قبل از ارائه پاسخ بیشتر فکر کند.
مقایسه با روشهای دیگر
مقاله s1 نشان میدهد که مدلهای استدلالگرا را میتوان از طریق فرایندی به نام «تنظیم دقیق نظارتشده» (SFT) با یک مجموعه داده نسبتاً کوچک تقطیر کرد. در این فرایند به مدل هوش مصنوعی دستور داده میشود که رفتارهای خاصی را در یک مجموعه داده شبیهسازی کند. گفته میشود که فرایند SFT نسبت به روش یادگیری تقویتی که DeepSeek برای آموزش مدل R1 براساس o1 انجام داده، ارزانتر است.
اهمیت این دستاورد
ساخت مدل هوش مصنوعی استدلالگر رایگان s1 نشان میدهد که میتوان با صرف هزینه و زمان کمتر، به تواناییهای مشابهی با مدلهای پیشرفته دست یافت. این موضوع میتواند تاثیر زیادی بر صنعت هوش مصنوعی داشته باشد و باعث کاهش هزینههای توسعه و دسترسی بیشتر به این فناوری شود.
چالشها و آینده پیش رو
با وجود این دستاورد بزرگ، هنوز چالشهایی در مسیر توسعه مدلهای هوش مصنوعی استدلالگر وجود دارد. یکی از این چالشها، بهبود عملکرد این مدلها در زمینههای پیچیدهتر و ارائه پاسخهای دقیقتر است. با این حال، ساخت مدل s1 میتواند نقطه عطفی در توسعه هوش مصنوعی باشد و راه را برای ساخت مدلهای ارزانتر و کارآمدتر هموار کند. با افزایش دسترسی به این فناوری، میتوان انتظار داشت که شاهد کاربردهای بیشتری از آن در زمینههای مختلف باشیم.
برچسب ها :
ناموجود- نظرات ارسال شده توسط شما، پس از تایید توسط مدیران سایت منتشر خواهد شد.
- نظراتی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
- نظراتی که به غیر از زبان فارسی یا غیر مرتبط با خبر باشد منتشر نخواهد شد.
ارسال نظر شما
مجموع نظرات : 0 در انتظار بررسی : 0 انتشار یافته : 0