模型服务

RISC-V
DeepSeek-R1-Distill-Qwen-32B

DeepSeek-R1-Distill-Qwen-32B

DeepSeek-R1-Distill-Qwen-32B是基于模型蒸馏从 DeepSeek-R1模型中提炼出来的模型,它继承了 DeepSeek-R1的推理能力,在保持高性能的同时, 大幅提升了推理速度,同时加持预训练等多个领域模型的优势。

GPGPU
DeepSeek-R1-Distill-Qwen-32B

DeepSeek-R1-Distill-Qwen-32B

DeepSeek-R1-Distill-Qwen-32B是基于模型蒸馏从 DeepSeek-R1模型中提炼出来的模型,它继承了 DeepSeek-R1的推理能力,在保持高性能的同时, 大幅提升了推理速度,同时加持预训练等多个领域模型的优势。

GPGPU
DeepSeek-R1-Distill-Llama-70B

DeepSeek-R1-Distill-Llama-70B

DeepSeek-R1-Distill-Llama-70B是基于Llama架构升级及强化学习训练优化后的模型,在多个任务中表现出色,成本显著降低了 DeepSeek-R1的使用成本。

敬请期待
Qwen2.5-72B

Qwen2.5-72B

Qwen2.5-72B是由Qwen团队开发并主导开发的下一代语言模型,该模型在多项任务中表现突出,展现了在多个领域中的卓越性能。

敬请期待
QwQ-32B

QwQ-32B

QwQ-32B是Qwen系列语言模型,与传统模型多参数量多算力不同,QWQ具备多参和低算力的特性,集将其下所有参数量系列模型输出,大幅提升了推理速度。

敬请期待
DeepSeek-R1-Distill-Qwen-7B

DeepSeek-R1-Distill-Qwen-7B

DeepSeek-R1-Distill-Qwen-7B是通过知识蒸馏技术从DeepSeek-R1模型中提炼出来的小型语言模型。它继承了 DeepSeek-R1的推理能力,专注于数学和逻辑推理任务,体积更小。