Kimi K2 0905
Провайдер: Moonshot AI
Kimi K2 0905 is the September update of [Kimi K2 0711](moonshotai/kimi-k2). It is a large-scale Mixture-of-Experts (MoE) language model developed by Moonshot AI, featuring 1 trillion total parameters with 32 billion active per forward pass. It supports long-context inference up to 256k tokens, extended from the previous 128k. This update improves agentic coding with higher accuracy and better generalization across scaffolds, and enhances frontend coding with more aesthetic and functional outputs for web, 3D, and related tasks. Kimi K2 is optimized for agentic capabilities, including advanced tool use, reasoning, and code synthesis. It excels across coding (LiveCodeBench, SWE-bench), reasoning (ZebraLogic, GPQA), and tool-use (Tau2, AceBench) benchmarks. The model is trained with a novel stack incorporating the MuonClip optimizer for stable large-scale MoE training.
Характеристики
- Тип
- Текстовая модель
- Провайдер
- Moonshot AI
- Принимает на вход
- текст
- Создаёт на выходе
- текст
- Окно контекста
- 262 144 токенов
- Минимальный тариф
- Максимум
Похожие нейросети
- CH★ ФлагманAnthropicТекстовая модель
Claude Haiku 4.5
Claude Haiku 4.5 — это самая быстрая и эффективная модель от Anthropic, предоставляющая интеллект, близкий к передовому, за небольшую долю стоимости и с меньшей задержкой по сравнению с более крупными моделями Claude. Соответствуя производительности Claude Sonnet 4 в задачах рассуждения, кодирования и использования компьютера, Haiku 4.5 обеспечивает передовые возможности для приложений реального времени и высоконагруженных систем. Модель добавляет "расширенное мышление" в линейку Haiku, позволяя контролировать глубину рассуждений, выводить резюмированные или чередующиеся мысли, а также использовать рабочие процессы с полной поддержкой инструментов для кодирования, bash, веб-поиска и использования компьютера. Набрав >73% в тесте SWE-bench Verified, Haiku 4.5 входит в число лучших в мире моделей для кодирования, сохраняя при этом исключительную отзывчивость для подагентов, параллельного выполнения и масштабного развертывания."
От 140 нейронов / 1M токенов - CO★ ФлагманAnthropicТекстовая модель
Claude Opus 4.8
Claude Opus 4.8 — самая мощная общедоступная модель семейства Opus от Anthropic. Она поддерживает ввод текста, изображений и файлов с выводом текстовых данных, а также обладает расширенными возможностями reasoning и контекстным окном объемом 1M token.
От 650 нейронов / 1M токенов - CS★ ФлагманAnthropicТекстовая модель
Claude Sonnet 4.6
Sonnet 4.6 — одна из самых мощных на текущий момент модель Anthropic, обладающая передовой производительностью в программировании, работе ИИ-агентов и выполнении профессиональных задач. Она превосходно справляется с итеративной разработкой, навигацией по сложным кодовым базам, сквозным управлением проектами с поддержкой памяти, созданием безупречных документов и уверенным использованием компьютера для веб-тестирования (QA) и автоматизации рабочих процессов
От 420 нейронов / 1M токенов - DV★ ФлагманDeepSeekТекстовая модель
DeepSeek V4 Flash
DeepSeek V4 Flash — это оптимизированная по эффективности модель архитектуры Mixture-of-Experts от DeepSeek, содержащая 284 млрд параметров при 13 млрд активируемых параметров. Модель поддерживает контекстное окно размером 1 млн token и предназначена для высокоскоростного inference.
От 22 нейронов / 1M токенов - DV★ ФлагманDeepSeekТекстовая модель
DeepSeek V4 Pro
DeepSeek V4 Pro — это крупномасштабная Mixture-of-Experts модель от DeepSeek с 1,6 трлн общих параметров и 49 млрд активных параметров, поддерживающая контекстное окно в 1 млн токенов. Модель предназначена для решения сложных задач reasoning, программирования и других высокоуровневых вычислительных операций.
От 227 нейронов / 1M токенов - G5★ ФлагманZhipu AIТекстовая модель
GLM 5.1
Это флагманская мультимодальная модель от компании Z.ai (Zhipu AI) с открытыми весами (лицензия MIT), специально оптимизированная для решения длительных автономных задач и сложного программирования. Благодаря архитектуре Mixture-of-Experts (MoE) на 744 млрд параметров и обучению исключительно на чипах Huawei Ascend, модель демонстрирует производительность на уровне Claude Opus 4.6 и GPT-5.4, достигая 58,4% на бенчмарке SWE-bench Pro. Ключевой особенностью GLM-5.1 является её способность к непрерывному планированию и итеративной самокоррекции в течение 8-часовых рабочих циклов, что делает её эффективным инструментом для создания ИИ-агентов, способных самостоятельно оптимизировать код, работать с репозиториями и выполнять комплексные инженерные проекты.
От 189 нейронов / 1M токенов