Tongyi DeepResearch 30B A3B
Провайдер: Alibaba
Tongyi DeepResearch is an agentic large language model developed by Tongyi Lab, with 30 billion total parameters activating only 3 billion per token. It's optimized for long-horizon, deep information-seeking tasks and delivers state-of-the-art performance on benchmarks like Humanity's Last Exam, BrowserComp, BrowserComp-ZH, WebWalkerQA, GAIA, xbench-DeepSearch, and FRAMES. This makes it superior for complex agentic search, reasoning, and multi-step problem-solving compared to prior models. The model includes a fully automated synthetic data pipeline for scalable pre-training, fine-tuning, and reinforcement learning. It uses large-scale continual pre-training on diverse agentic data to boost reasoning and stay fresh. It also features end-to-end on-policy RL with a customized Group Relative Policy Optimization, including token-level gradients and negative sample filtering for stable training. The model supports ReAct for core ability checks and an IterResearch-based 'Heavy' mode for max performance through test-time scaling. It's ideal for advanced research agents, tool use, and heavy inference workflows.
Характеристики
- Тип
- Текстовая модель
- Провайдер
- Alibaba
- Принимает на вход
- текст
- Создаёт на выходе
- текст
- Окно контекста
- 131 072 токенов
- Минимальный тариф
- Базовый
Похожие нейросети
- CH★ ФлагманAnthropicТекстовая модель
Claude Haiku 4.5
Claude Haiku 4.5 — это самая быстрая и эффективная модель от Anthropic, предоставляющая интеллект, близкий к передовому, за небольшую долю стоимости и с меньшей задержкой по сравнению с более крупными моделями Claude. Соответствуя производительности Claude Sonnet 4 в задачах рассуждения, кодирования и использования компьютера, Haiku 4.5 обеспечивает передовые возможности для приложений реального времени и высоконагруженных систем. Модель добавляет "расширенное мышление" в линейку Haiku, позволяя контролировать глубину рассуждений, выводить резюмированные или чередующиеся мысли, а также использовать рабочие процессы с полной поддержкой инструментов для кодирования, bash, веб-поиска и использования компьютера. Набрав >73% в тесте SWE-bench Verified, Haiku 4.5 входит в число лучших в мире моделей для кодирования, сохраняя при этом исключительную отзывчивость для подагентов, параллельного выполнения и масштабного развертывания."
От 140 нейронов / 1M токенов - CO★ ФлагманAnthropicТекстовая модель
Claude Opus 4.8
Claude Opus 4.8 — самая мощная общедоступная модель семейства Opus от Anthropic. Она поддерживает ввод текста, изображений и файлов с выводом текстовых данных, а также обладает расширенными возможностями reasoning и контекстным окном объемом 1M token.
От 650 нейронов / 1M токенов - CS★ ФлагманAnthropicТекстовая модель
Claude Sonnet 4.6
Sonnet 4.6 — одна из самых мощных на текущий момент модель Anthropic, обладающая передовой производительностью в программировании, работе ИИ-агентов и выполнении профессиональных задач. Она превосходно справляется с итеративной разработкой, навигацией по сложным кодовым базам, сквозным управлением проектами с поддержкой памяти, созданием безупречных документов и уверенным использованием компьютера для веб-тестирования (QA) и автоматизации рабочих процессов
От 420 нейронов / 1M токенов - DV★ ФлагманDeepSeekТекстовая модель
DeepSeek V4 Flash
DeepSeek V4 Flash — это оптимизированная по эффективности модель архитектуры Mixture-of-Experts от DeepSeek, содержащая 284 млрд параметров при 13 млрд активируемых параметров. Модель поддерживает контекстное окно размером 1 млн token и предназначена для высокоскоростного inference.
От 22 нейронов / 1M токенов - DV★ ФлагманDeepSeekТекстовая модель
DeepSeek V4 Pro
DeepSeek V4 Pro — это крупномасштабная Mixture-of-Experts модель от DeepSeek с 1,6 трлн общих параметров и 49 млрд активных параметров, поддерживающая контекстное окно в 1 млн токенов. Модель предназначена для решения сложных задач reasoning, программирования и других высокоуровневых вычислительных операций.
От 227 нейронов / 1M токенов - G5★ ФлагманZhipu AIТекстовая модель
GLM 5.1
Это флагманская мультимодальная модель от компании Z.ai (Zhipu AI) с открытыми весами (лицензия MIT), специально оптимизированная для решения длительных автономных задач и сложного программирования. Благодаря архитектуре Mixture-of-Experts (MoE) на 744 млрд параметров и обучению исключительно на чипах Huawei Ascend, модель демонстрирует производительность на уровне Claude Opus 4.6 и GPT-5.4, достигая 58,4% на бенчмарке SWE-bench Pro. Ключевой особенностью GLM-5.1 является её способность к непрерывному планированию и итеративной самокоррекции в течение 8-часовых рабочих циклов, что делает её эффективным инструментом для создания ИИ-агентов, способных самостоятельно оптимизировать код, работать с репозиториями и выполнять комплексные инженерные проекты.
От 189 нейронов / 1M токенов