Нейроканал
20 января 2026, 13:38
Zhipu AI выложили GLM-4
По бенчмаркам бьёт Qwen3-30B-A3B почти везде. Особенно выделяется на агентских задачах: SWE-bench Verified — 59,2% против 22% у Qwen, τ²-Bench — 79,5% против 49%. И GPT-OSS-20B тоже обгоняет.
Для запуска поддерживает vLLM и SGLang, но только из main-веток. Нужны nightly-версии:
pip install -U vllm --pre --index-url install git+>
Для Blackwell GPU нужен флаг --attention-backend triton. По идее квантованная версия запустится даже на 24 GB карточках, народ активно тестирует и выкладывает свои версии.
Итого: как легковесная модель для агентских задач и написания кода прям супер вариант.
Веса на HF, API, тех. отчёт