در برخی معیارها، Qwen 2.5 بیشتر از DeepSeek V3 عملکرد خوبی داشته است.

پربازدیدترین این هفته:

مطالب ترند و داغ:

شما هم با خودتان حرف میزنید/ بخوانید

از قانون 2-7-30 برای بهبود چشمگیر حافظه خود استفاده کنید

دیگران در حال خواندن این صفحات هستند:

خانه » در برخی معیارها، Qwen 2.5 بیشتر از DeepSeek V3 عملکرد خوبی داشته است.

اشتراک گذاری این مطلب:

الیبابا با توسعه Qwen 2.5-Max به عنوان جدیدترین مدل آموخته-خبیر (MoE) در اندازه بزرگ، در پاسخ به DeepSeek اقدام کرده است. این مدل، مدعی؛ آموزش از پیش بر روی بیش از 20 هزار میلیارد نشانه و تنظیم دقیق با روش‌های پیشرفته مانند آموزش نظارت شده (SFT) و یادگیری تقویتی از بازخورد انسانی (RLHF) است.

اکنون، این مدل قابل دسترسی از طریق Alibaba Cloud برای بررسی و اکتشاف توسط Qwen Chat است. الیبابا به توسعه دهندگان و محققان دعوت کرده تا نوآوری های خود را از نزدیک ببینند.

در مقایسه با عملکرد برخی از مدل‌های برجسته‌ی مصنوعی در کلیه سنجه‌ها، به نظر می‌رسد عملکرد Qwen 2.5-Max قول بخشی‌ها دارد. ارزیابی‌ها شامل معیارهای محبوبی مانند MMLU-Pro برای حل مشکلات دانشگاهی، LiveCodeBench برای تخصص کدنویسی، LiveBench برای بررسی قابلیت‌های کلی مدل و Arena-Hard برای ارزیابی مدل‌ها در مقایسه با ترجیحات انسانی بودند.

براساس ادعای الیبابا، Qwen 2.5-Max در مقایسه با DeepSeek V3 در سنجه‌هایی مانند Arena-Hard, LiveBench, LiveCodeBench و GPQA-Diamond عملکرد بهتری از خود نشان داده است، در حالی که نتایج رقابتی در آزمون‌های دیگر نیز وجود دارد.

الیبابا ، در تلاش برای جعل مدل Qwen 2.5-Max بیشتر قابل دسترس، آن را با پلتفرم Qwen Chat خود یکپارچه کرده است، که کاربران می‌توانند با مدل به صورت مستقیم تعامل کنند- چه در حال بررسی قابلیتهای جستجوی آن باشند یا تست درک آن از پرسشهای پیچیده.

برای توسعه‌دهندگان، API Qwen 2.5-Max اکنون از طریق Alibaba Cloud تحت نام مدل “qwen-max-2025-01-25” در دسترس است. کاربران می‌توانند با ثبت نام به حساب Alibaba Cloud، فعالسازی خدمات Model Studio و تولید کلید API، شروع کنند.

الیبابا با Qwen 2.5-Max، قصد دارد حوزه مدل‌های AI را گسترش دهد. دستاوردهای آن نه تنها در بهبود عملکردهای سنجشی بلکه در تقویت توانایی‌های تفکری و استدلالی این سیستم‌ها نیز مشهود است.

تیم الیبابا، در نگاه به آینده، قصد دارد مرزهای یادگیری تقویتی را فشار دهد تا مهارت‌های استدلال پیشرفته‌تر را افزایش دهد. به نظر می‌رسد که این امکان مدل‌های آنها را به سمت نه تنها برابری با هوش انسانی در حل مشکلات پیچیده هدایت کند، بلکه آنها را بتواند فرودهود.

تاثیرات این پیشرفت بر صنعت می‌تواند پرشمایه باشد. همانطور که روش‌های مقیاس‌بندی بهبود می‌یافت و مدل‌های Qwen پیشروی‌های جدیدی را ایجاد می‌کرد، توقع می‌رود که موج‌های بیشتری در زمینه‌های مبتنی بر AI در سراسر جهان بپا شود.