الیبابا با توسعه Qwen 2.5-Max به عنوان جدیدترین مدل آموخته-خبیر (MoE) در اندازه بزرگ، در پاسخ به DeepSeek اقدام کرده است. این مدل، مدعی؛ آموزش از پیش بر روی بیش از 20 هزار میلیارد نشانه و تنظیم دقیق با روشهای پیشرفته مانند آموزش نظارت شده (SFT) و یادگیری تقویتی از بازخورد انسانی (RLHF) است.
اکنون، این مدل قابل دسترسی از طریق Alibaba Cloud برای بررسی و اکتشاف توسط Qwen Chat است. الیبابا به توسعه دهندگان و محققان دعوت کرده تا نوآوری های خود را از نزدیک ببینند.
در مقایسه با عملکرد برخی از مدلهای برجستهی مصنوعی در کلیه سنجهها، به نظر میرسد عملکرد Qwen 2.5-Max قول بخشیها دارد. ارزیابیها شامل معیارهای محبوبی مانند MMLU-Pro برای حل مشکلات دانشگاهی، LiveCodeBench برای تخصص کدنویسی، LiveBench برای بررسی قابلیتهای کلی مدل و Arena-Hard برای ارزیابی مدلها در مقایسه با ترجیحات انسانی بودند.
براساس ادعای الیبابا، Qwen 2.5-Max در مقایسه با DeepSeek V3 در سنجههایی مانند Arena-Hard, LiveBench, LiveCodeBench و GPQA-Diamond عملکرد بهتری از خود نشان داده است، در حالی که نتایج رقابتی در آزمونهای دیگر نیز وجود دارد.
الیبابا ، در تلاش برای جعل مدل Qwen 2.5-Max بیشتر قابل دسترس، آن را با پلتفرم Qwen Chat خود یکپارچه کرده است، که کاربران میتوانند با مدل به صورت مستقیم تعامل کنند- چه در حال بررسی قابلیتهای جستجوی آن باشند یا تست درک آن از پرسشهای پیچیده.
برای توسعهدهندگان، API Qwen 2.5-Max اکنون از طریق Alibaba Cloud تحت نام مدل “qwen-max-2025-01-25” در دسترس است. کاربران میتوانند با ثبت نام به حساب Alibaba Cloud، فعالسازی خدمات Model Studio و تولید کلید API، شروع کنند.
الیبابا با Qwen 2.5-Max، قصد دارد حوزه مدلهای AI را گسترش دهد. دستاوردهای آن نه تنها در بهبود عملکردهای سنجشی بلکه در تقویت تواناییهای تفکری و استدلالی این سیستمها نیز مشهود است.
تیم الیبابا، در نگاه به آینده، قصد دارد مرزهای یادگیری تقویتی را فشار دهد تا مهارتهای استدلال پیشرفتهتر را افزایش دهد. به نظر میرسد که این امکان مدلهای آنها را به سمت نه تنها برابری با هوش انسانی در حل مشکلات پیچیده هدایت کند، بلکه آنها را بتواند فرودهود.
تاثیرات این پیشرفت بر صنعت میتواند پرشمایه باشد. همانطور که روشهای مقیاسبندی بهبود مییافت و مدلهای Qwen پیشرویهای جدیدی را ایجاد میکرد، توقع میرود که موجهای بیشتری در زمینههای مبتنی بر AI در سراسر جهان بپا شود.