
Qwen від Alibaba — новий конкурент ChatGPT та DeepSeek
DeepSeek отримав нового конкурента, і ви можете спробувати його прямо зараз.

Alibaba щойно представила свою останню модель для міркувань, і, схоже, DeepSeek та OpenAI можуть почати хвилюватися — принаймні, якщо усі обіцяний Alibaba виявляться правдивими. Модель є відкритою, тому я вирішив перевірити її сам. Ви теж можете спробувати безкоштовно, хоча, як і очікувалося, є теми, на які вона не стане з вами говорити.
Нова модель під назвою QwQ-32b (Quan-with-Questions) працює з набагато меншою кількістю параметрів, що означає, що вона потребує менше ресурсів, але Alibaba стверджує, що вона працює на тому ж рівні, що й DeepSeek чи o1-mini від OpenAI.
Велика мовна модель DeepSeek R1 викликала великий інтерес у лютому, коли вийшла — вона раптово стала здатна конкурувати з золотим стандартом, встановленим ChatGPT та іншими альтернативами, але при цьому працювала набагато дешевше. Схоже, що Alibaba тут хоче піти ще далі.

Як пояснює VentureBeat, DeepSeek R1 потребує 671 мільярда параметрів для роботи, з яких активізується 37 мільярдів. У той же час нова модель Alibaba QwQ-32b обходиться всього 32 мільярдами параметрів. Для багатьох ці цифри абстрактні, але різниця у обчислювальній потужності величезна: DeepSeek R1 потребує 1600 ГБ відеопам’яті (VRAM), а QwQ-32b — всього 24 ГБ VRAM. У більшості випадків це буде Nvidia H100 або еквіваленти, але навіть ігрова карта RTX 4090 має 24 ГБ пам’яті. Остання RTX 5090 збільшує це до 32 ГБ.
QwQ-32b від Alibaba доступна за ліцензією Apache 2.0, що означає, що компанії та дослідники можуть її використовувати. Більше того, ми можемо спробувати її прямо зараз через Qwen Chat від Alibaba. Як і DeepSeek, вона має деякі обмеження, але в неї є й кілька очевидних переваг, які я помітив одразу.
Схоже, що вона дає достатньо глибокі відповіді навіть на швидкі й прості запитання. Це може бути добре, але інколи це дратує, адже модель надає багато зайвого контексту, який ви не просили. Нам подобається, що вона показує увесь процес своїх міркувань — це нагадує функцію «Глибоке мислення» у ChatGPT, але з меншою глибиною.
Особливо цікаво, як модель працює з завданнями, пов’язаними з логікою та поетапним аналізом. Наприклад, при розв’язанні математичних задач чи при розборі складних сценаріїв, QwQ-32b робить акцент на прозорість аргументації. Це може виявитися надзвичайно корисним у освітній сфері чи при розробці інтелектуальних помічників, яким необхідно обґрунтовувати свої відповіді.

Також варто зазначити, що завдяки своїй легкості QwQ-32b може стати чудовим вибором для стартапів і розробників із обмеженим бюджетом. Можливість запустити потужну мовну модель на споживчому залізі, такому як RTX 4090, робить її особливо привабливою в умовах зростаючої конкуренції на ринку ШІ.
При запитаннях про політику Qwen Chat позначає такі теми як непридатні. Можливо, існують способи обійти це обмеження — адже з DeepSeek це було можливо — але поки нам не вдалося.
Чи збереже Alibaba своє слово — час покаже, але схоже, що у ChatGPT і DeepSeek з’явився новий серйозний конкурент.
Висновок

Зрештою, модель Qwen від Alibaba демонструє вражаюче поєднання ефективності й доступності, пропонуючи якість, порівнянну з лідерами ринку, при значно менших вимогах до ресурсів. Незважаючи на деякі обмеження та фільтри, ця відкрита модель може стати серйозним конкурентом для DeepSeek і ChatGPT, особливо для компаній і дослідників, що шукають економічні й гнучкі рішення в сфері штучного інтелекту. Майбутнє покаже, наскільки швидко і широко вона буде впроваджуватися й розвиватися.
Якщо ви хочете опанувати найсучасніші моделі штучного інтелекту і забезпечити собі потужний інструмент для роботи чи ігор, радимо купити ПК у нас. Наша компанія допоможе підібрати комп’ютер, ідеально придатний для ваших завдань, щоб ви могли ефективно використовувати такі моделі, як Qwen від Alibaba та інші передові технології ШІ.

