آی نو؛ مرجع تخصصی اخبار و آموزش هوش مصنوعی

مدل‌های پایه چقدر اهمیت دارند؟

مدل‌های پایه چقدر اهمیت دارند؟

آیا عصر حکمرانی مدل‌های بزرگ هوش مصنوعی به پایان رسیده است؟ شاید این سوال احمقانه به نظر برسد، اما این موضوع در گفتگوهای من با استارتاپ‌های هوش مصنوعی بسیار مطرح شده است. این استارتاپ‌ها اکنون با کسب‌وکارهایی که قبلاً به عنوان “پوشش‌های GPT” یا شرکت‌هایی که رابط‌هایی را بر روی…

- اندازه متن +

آیا عصر حکمرانی مدل‌های بزرگ هوش مصنوعی به پایان رسیده است؟

شاید این سوال احمقانه به نظر برسد، اما این موضوع در گفتگوهای من با استارتاپ‌های هوش مصنوعی بسیار مطرح شده است. این استارتاپ‌ها اکنون با کسب‌وکارهایی که قبلاً به عنوان “پوشش‌های GPT” یا شرکت‌هایی که رابط‌هایی را بر روی مدل‌های هوش مصنوعی موجود مانند ChatGPT ایجاد می‌کنند، راحت‌تر هستند.

امروزه، تیم‌های استارتاپی بر سفارشی‌سازی مدل‌های هوش مصنوعی برای وظایف خاص و کار رابط تمرکز دارند و مدل پایه را به عنوان کالایی می‌بینند که در صورت لزوم می‌توان آن را تعویض کرد. این رویکرد به ویژه در کنفرانس Boxworks هفته گذشته مشهود بود که به نظر می‌رسید کاملاً به نرم‌افزارهای کاربردی ساخته شده بر روی مدل‌های هوش مصنوعی اختصاص داده شده بود.

کاهش مزایای مقیاس‌بندی مدل‌های از پیش آموزش‌دیده

بخشی از این موضوع به این دلیل است که مزایای مقیاس‌بندی پیش‌آموزش – فرآیند اولیه‌ی آموزش مدل‌های هوش مصنوعی با استفاده از مجموعه‌های داده‌ی عظیم که تنها در حوزه‌ی مدل‌های پایه است – کاهش یافته است. این بدان معنا نیست که هوش مصنوعی پیشرفت را متوقف کرده است، اما مزایای اولیه‌ی مدل‌های پایه فوق‌مقیاس به بازدهی نزولی رسیده است و توجه به پس‌آموزش و یادگیری تقویتی به عنوان منابع پیشرفت آینده معطوف شده است.

اگر می‌خواهید یک ابزار کدنویسی هوش مصنوعی بهتری بسازید، بهتر است روی تنظیم دقیق و طراحی رابط کار کنید تا اینکه چند میلیارد دلار دیگر در زمان سرور برای پیش‌آموزش هزینه کنید. همانطور که موفقیت Claude Code Anthropic نشان می‌دهد، شرکت‌های مدل پایه در این زمینه‌های دیگر نیز بسیار خوب هستند – اما این یک مزیت پایدار مانند گذشته نیست.

تغییر چشم‌انداز رقابتی هوش مصنوعی

به طور خلاصه، چشم‌انداز رقابتی هوش مصنوعی به گونه‌ای در حال تغییر است که مزایای بزرگترین آزمایشگاه‌های هوش مصنوعی را تضعیف می‌کند. به جای مسابقه برای یک AGI قدرتمند که می‌تواند با توانایی‌های انسانی در تمام وظایف شناختی مطابقت داشته باشد یا از آن فراتر رود، آینده‌ی نزدیک به نظر می‌رسد مجموعه‌ای از کسب‌وکارهای مجزا باشد: توسعه نرم‌افزار، مدیریت داده‌های سازمانی، تولید تصویر و غیره.

گذشته از مزیت اولین حرکت‌کننده، مشخص نیست که ساخت یک مدل پایه به شما مزیتی در این کسب‌وکارها می‌دهد. بدتر از آن، فراوانی جایگزین‌های متن‌باز به این معنی است که اگر مدل‌های پایه در لایه‌ی کاربردی رقابت را از دست بدهند، ممکن است هیچ اهرم قیمتی نداشته باشند. این امر شرکت‌هایی مانند OpenAI و Anthropic را به تامین‌کنندگان پشتیبان در یک تجارت کالایی با حاشیه سود پایین تبدیل می‌کند – همانطور که یکی از بنیانگذاران به من گفت: “مانند فروش دانه‌های قهوه به استارباکس”.

تحول در کسب‌وکار هوش مصنوعی

اغراق در مورد اینکه این یک تغییر چشمگیر برای کسب‌وکار هوش مصنوعی خواهد بود، دشوار است. در طول رونق معاصر، موفقیت هوش مصنوعی از موفقیت شرکت‌های سازنده مدل‌های پایه – به طور خاص، OpenAI، Anthropic و Google – جدایی‌ناپذیر بوده است. خوش‌بین بودن نسبت به هوش مصنوعی به این معنی بود که باور داشته باشیم تأثیر تحول‌آفرین هوش مصنوعی این شرکت‌ها را به شرکت‌های مهم نسلی تبدیل می‌کند. ما می‌توانستیم در مورد اینکه کدام شرکت در صدر قرار می‌گیرد بحث کنیم، اما واضح بود که برخی از شرکت‌های مدل پایه در نهایت کلیدهای پادشاهی را به دست خواهند آورد.

در آن زمان، دلایل زیادی وجود داشت که فکر کنیم این درست است. سال‌ها، توسعه مدل پایه تنها کسب‌وکار هوش مصنوعی بود – و سرعت بالای پیشرفت، رهبری آنها را غیرقابل عبور نشان می‌داد. و سیلیکون ولی همیشه عشق عمیقی به مزیت پلتفرم داشته است. این فرض وجود داشت که هر طور که مدل‌های هوش مصنوعی در نهایت پول در می‌آورند، سهم شیر از سود به شرکت‌های مدل پایه باز می‌گردد، که سخت‌ترین کار را برای تکرار انجام داده‌اند.

پیچیده‌تر شدن داستان موفقیت مدل‌های پایه

سال گذشته این داستان را پیچیده‌تر کرده است. خدمات هوش مصنوعی شخص ثالث موفق زیادی وجود دارد، اما آنها تمایل دارند از مدل‌های پایه به طور متناوب استفاده کنند. برای استارتاپ‌ها، دیگر مهم نیست که محصول آنها بر روی GPT-5، Claude یا Gemini قرار دارد و آنها انتظار دارند که بتوانند مدل‌ها را در اواسط انتشار بدون اینکه کاربران نهایی متوجه تفاوت شوند، تغییر دهند. مدل‌های پایه به پیشرفت واقعی ادامه می‌دهند، اما دیگر به نظر نمی‌رسد که هیچ شرکتی بتواند مزیت کافی برای تسلط بر صنعت را حفظ کند.

برای مطالعه اخبار بیشتر اینجا کلیک کنید.

عدم وجود مزیت اولین حرکت‌کننده

ما در حال حاضر نشانه‌های زیادی داریم که مزیت اولین حرکت‌کننده چندانی وجود ندارد. همانطور که مارتین کاسادو، سرمایه‌گذار خطرپذیر a16z، در یک پادکست اخیر اشاره کرد، OpenAI اولین آزمایشگاهی بود که یک مدل کدنویسی و همچنین مدل‌های مولد برای تصویر و ویدئو منتشر کرد – اما هر سه دسته را به رقبا واگذار کرد. کاسادو نتیجه گرفت: “تا آنجا که می‌توانیم بگوییم، هیچ خندق ذاتی در پشته فناوری برای هوش مصنوعی وجود ندارد.” بر اساس گزارشی از TechCrunch.

آینده مدل‌های پایه

البته، ما نباید شرکت‌های مدل پایه را هنوز کنار بگذاریم. هنوز مزایای پایدار زیادی در کنار آنها وجود دارد، از جمله شناخت برند، زیرساخت و ذخایر نقدی غیرقابل تصور. کسب‌وکار مصرف‌کننده OpenAI ممکن است دشوارتر از کسب‌وکار کدنویسی آن باشد و با بلوغ این بخش، مزایای دیگری ممکن است ظاهر شوند. با توجه به سرعت بالای توسعه هوش مصنوعی، علاقه فعلی به پس‌آموزش می‌تواند به راحتی در شش ماه آینده معکوس شود.

از همه نامشخص‌تر، مسابقه به سوی هوش عمومی می‌تواند با پیشرفت‌های جدید در داروسازی یا علم مواد به نتیجه برسد و ایده‌های ما را در مورد اینکه چه چیزی مدل‌های هوش مصنوعی را ارزشمند می‌کند، به طور اساسی تغییر دهد. اما در این میان، استراتژی ساخت مدل‌های پایه بزرگتر از همیشه، بسیار کمتر از سال گذشته جذاب به نظر می‌رسد – و ولخرجی میلیارد دلاری متا شروع به خطرناک به نظر رسیدن می‌کند.

درباره نویسنده

تحریریه آی نو

ارسال دیدگاه
0 دیدگاه

نظر شما در مورد این مطلب چیه؟

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *