融合通用与代码能力的全新模型 DeepSeek-V2.5,现已在 API 及网页端全面上线。
全新体验,无限可能
DeepSeek-V2.5 的综合能力
在目前大模型主流榜单中,DeepSeek-V2.5 均表现出色
中文综合能力(AlignBench)开源模型中最强
与 GPT-4-Turbo,文心 4.0 等闭源模型在评测中处于同一梯队
英文综合能力(MT-Bench)处于第一梯队
英文综合能力(MT-Bench)与最强的开源模型 LLaMA3-70B 处于同一梯队,超过最强 MoE 开源模型 Mixtral8x22B
知识、数学、推理、编程等榜单结果位居前列
开源模型和 API 支持 128K 上下文
是否开源 | 中文综合 | 英文综合 | 知识 | 基础算数 | 数学解题 | 逻辑推理 | 编程 | |
---|---|---|---|---|---|---|---|---|
AlignBench | MT-Bench | MMLU | GSM8K | MATH | BBH | HumanEval | ||
DeepSeek-V2.5 | 开源 | 8.04 | 9.02 | 80.4 | 95.1 | 74.7 | 84.3 | 89.0 |
DeepSeek-V2 | 开源 | 7.89 | 8.85 | 80.6 | 94.8 | 71.0 | 83.4 | 84.8 |
GPT-4-Turbo-1106 | - | 8.01 | 9.32 | 84.6 | 93.0 | 64.1 | - | 82.2 |
GPT-4-0613 | - | 7.53 | 8.96 | 86.4 | 92.0 | 52.9 | 83.1 | 84.1 |
GPT-3.5 | - | 6.08 | 8.21 | 70.0 | 57.1 | 34.1 | 66.6 | 48.1 |
Gemini1.5 Pro | - | 7.33 | 8.93 | 81.9 | 91.7 | 58.5 | 84.0 | 71.9 |
Claude3 Opus | - | 7.62 | 9.00 | 86.8 | 95.0 | 61.0 | 86.8 | 84.9 |
Claude3 Sonnet | - | 6.70 | 8.47 | 79.0 | 92.3 | 40.5 | 82.9 | 73.0 |
Claude3 Haiku | - | 6.42 | 8.39 | 75.2 | 88.9 | 40.9 | 73.7 | 75.9 |
abab-6.5(MiniMax) | - | 7.97 | 8.82 | 79.5 | 91.7 | 51.4 | 82.0 | 78.0 |
abab-6.5s(MiniMax) | - | 7.34 | 8.69 | 74.6 | 87.3 | 42.0 | 76.8 | 68.3 |
ERNIE-4.0(文心一言) | - | 7.89 | 7.69 | - | 91.3 | 52.2 | - | 72.0 |
GLM-4(智谱清言) | - | 7.88 | 8.60 | 81.5 | 87.6 | 47.9 | 82.3 | 72.0 |
Moonshot-v1(月之暗面) | - | 7.22 | 8.59 | - | 89.5 | 44.2 | - | 82.9 |
Baichuan 3(百川) | - | - | 8.70 | 81.7 | 88.2 | 49.2 | 84.5 | 70.1 |
Qwen1.5 72B(通义千问) | 开源 | 7.19 | 8.61 | 76.2 | 81.9 | 40.6 | 65.9 | 68.9 |
LLaMA 3 70B | 开源 | 7.42 | 8.95 | 80.3 | 93.2 | 48.5 | 80.1 | 76.2 |
Mixtral 8x22B | 开源 | 6.49 | 8.66 | 77.8 | 87.9 | 49.8 | 78.4 | 75.0 |
DeepSeek API 定价
每 百万 输入 Tokens
1元
每 百万 输出 Tokens
2元
为什么选择 DeepSeek?
即刻接入236B 参数量
128K 上下文(API)
128K 上下文(API)
能力卓越
1 元 / 百万输入 Tokens
2 元 / 百万输出 Tokens
2 元 / 百万输出 Tokens
价格低廉
显示美元价格
兼容 OpenAI API 接口
体验丝滑