🏆 全球AI知名模型大全

90+知名模型完整收录 · 26家公司 · 官网 · 评测 · 定价 · 特色能力

90+ 模型26家公司评测数据API价格开源闭源标注
快速跳转
📊 完整对比表 🇺🇸 美国阵营 🇨🇳 中国阵营 🇪🇺 欧洲/其他 🔓 开源模型 📋 选型建议
📊 全球AI模型完整对比表
数据声明:「发布时间」为模型公开发布或正式上架月份(培训整理,以厂商公告为准)。SWE-bench 列为 SWE-bench Verified 公开参考(偏编程);MMLU 仅保留仍有对照意义的旧版分数。点击模型名称跳转官网。选型与定价以 Artificial AnalysisLMSYS Arena 及各厂商官网为准。
2026 年 5 月前沿梯队 + 高性价比 / 开源主力
#模型名称公司类型参数SWE-benchMMLU发布时间特色

📊 公开榜单参考(请自行核对最新)

排行榜变动频繁,培训时建议直接打开下列站点,勿背诵具体分数:

⚠️ 勿使用未在厂商官网或上述榜单出现的型号做采购决策。

🇺🇸 美国AI公司阵营
OpenAI
GPT系列、o1/o3、Sora、DALL-E。全球AI领导者,推动GPT-4o/4.1/5代际迭代以及o系列推理模型。ChatGPT月活5亿+,2025年估值3000亿美元。
Anthropic
Claude系列。由前OpenAI员工创立,专注AI安全与对齐。Claude 3.7 Sonnet编码能力全球第一,Claude Code CLI编程工具广受好评。
Google DeepMind
Gemini系列、AlphaFold。200万Token上下文是其最大差异化优势。Gemini 2.0 Pro整合Google搜索/Map生态,多模态能力出色。
Meta AI
LLaMA系列。开源AI最坚定的推动者。Llama 4 Scout/Behemoth重新定义开源上限,全球开发者社区最大,是自托管/私有化部署的首选。
xAI (Elon Musk)
Grok系列。深度整合X(Twitter)实时数据,可以实时获取社交媒体信息。Grok-3模型实力位居第一梯队,训练集群规模世界最大之一。
Microsoft
Phi系列、Copilot生态。微软不追求最大参数,但Phi-4以14B参数达到同级SOTA,适合边缘部署。深度整合Azure+Office+GitHub生态。
Mistral AI
Mistral系列。欧洲AI代表,开源+商业混合模式。Mistral Large 2综合实力不俗,在欧洲市场占有率领先,支持多语言。
Cohere
Command R系列、Embedding模型。专注企业RAG场景,检索增强能力行业领先。其Embedding模型被广泛用于知识库搭建。
Amazon
Amazon Nova系列、Bedrock平台。通过Bedrock提供多模型托管,Nova模型性价比突出。亚马逊AI生态深度整合电商/AWS/智能音箱。
Nous Research
Hermes系列、OpenHermes、Dolphin。开源AI社区明星,以高质量指令微调著称。Hermes 3 405B是开源Agent模型的标杆,Hermes Agent框架GitHub 17K Stars。
AI21 Labs
Jamba系列。以色列AI独角兽,独创SSM-Transformer混合架构(Jamba系列),长上下文处理能力强。商用开源,支持多语言,企业级RAG场景。
Reka AI
Reka Core/Flash/Edge系列。前DeepMind/Google Brain团队创立的AI公司,原生多模态(文/图/音/视/视频理解),边缘到云端全覆盖。
HuggingFace
AI开源社区+模型托管平台。StarCoder2/SmolLM2/Zephyr系列。生态核心,是AI开发者必备的平台,模型数超100万。
Stability AI
Stable Diffusion系列+StableLM。AI图像生成领域的开源旗手,SD 3.5是Stable系列最先进的图像模型。公司2024年后经历调整重组。
Writer
Palmyra X系列。企业级AI写作和文本生成平台,Palmyra模型专为企业内容创作场景优化,强调安全合规。
H2O.ai
Danube系列。开源机器学习平台,Danube 3轻量级语言模型适合企业私有化部署。强调可解释AI和AutoML。

🇨🇳 中国AI公司阵营
深度求索 DeepSeek
DeepSeek-R1/V3系列。2025年全球最火的中国AI公司。以低成本高性能震撼业界,API价格为GPT-4o的1/30,R1开源后引发美股科技抛售。中文+代码能力极强。
阿里云 通义千问
Qwen系列。中国最活跃的开源模型体系,从0.5B到235B全覆盖。Qwen3-235B综合性能国内第一梯队,尤其Agent能力和代码能力突出。开源生态活跃。
百度 文心
文心4.5 Turbo。国内最早发布大模型的厂商之一,搜索增强能力突出。深度整合百度搜索/地图/文库生态,C端用户基数庞大。
字节跳动 豆包
Doubao Pro系列。以极低价格和大规模C端用户著称,豆包App月活过亿。火山引擎提供API,通过抖音/TikTok场景大规模验证。
智谱AI GLM
GLM-4系列。清华系创业团队,GLM是国内最早的通用大模型之一。Agent工具调用能力突出,企业合作广泛。
月之暗面 Kimi
Kimi K2.5系列。以超长上下文(200万Token)著称,长文档理解力突出。创始人杨植麟为前清华AI研究员,Kimi成为知识工作者热门工具。
零一万物 Yi
Yi系列。李开复创立,Yi-Lightning以极速响应和低价著称。开源+商业双线布局,产品矩阵完善。
腾讯 混元
混元Turbo系列。整合腾讯生态(微信/企微/腾讯云),视频多模态能力特色突出。在音视频处理和游戏场景应用广泛。
科大讯飞 星火
星火Spark 4.5。国内语音AI领导者,语音识别和合成能力突出。在教育和医疗场景有深厚积累,星火大模型获批较早。
百川智能
Baichuan系列。搜狗创始人王小川创立,Baichuan-3在中文场景表现不俗。专注医疗AI应用。
华为 盘古
盘古大模型系列。华为自主AI芯片(昇腾)+大模型全栈,气象大模型全球领先。企业级市场(政府/运营商)优势明显。
MiniMax
Minimax M2.5、海螺AI。音视频多模态和C端产品(海螺AI)表现出色,视频生成质量在国内领先。
上海AI实验室 InternLM
InternLM系列。学术研究导向,书生开源模型体系。8B模型在同参数下表现优异,适合学界和轻量部署。
小米 MiMo
MiMo-V2.5-Pro。小米2025年正式入局大模型,MiMo系列在综合评测中表现不俗,"手机+AIoT+汽车"三位一体生态整合潜力巨大。

🌍 其他地区AI公司
🇪🇺 Mistral AI (法国)
欧洲AI领军者,创始人来自Meta/Google DeepMind。Mistral Large 2和Small系列,多语言能力突出,获法国政府大力支持。
🇰🇷 Upstage (韩国)
Solar系列。韩国最大AI独角兽,Pre-MoE架构优化出色。擅长韩语+多语言NLP。
🇫🇮 Silen AI (芬兰)
Poro系列。北欧AI新星,Poro 34B在斯堪的纳维亚语言处理上领先,轻量高效。
🇦🇪 TII (阿联酋)
Falcon系列。阿联酋技术创新研究所开源Falcon,中东最强AI模型,阿拉伯语优先。

🔓 开源模型与本地部署
权重可下载、可自托管(License 以各项目为准)。下表汇总本站对比表中的开源型号;完整梯队见 完整对比表

常见部署路径

💡 7B~14B 适合单卡消费级 GPU;MoE 大模型需多卡或量化(AWQ / GPTQ)。
模型名称公司参数SWE-bench发布时间场景 / 特色
开源生态与社区
Meta · Llama
Llama 4 Scout、Llama 3.1 等;全球开发者生态最大,Ollama / HF 首发适配多。
深度求索 DeepSeek
V4-Pro / Flash、R1、V3 等 MoE 开源;编程与推理性价比极高,国内下载友好。
阿里 · Qwen 开源
Qwen3-235B MoE、Qwen3-7B、Qwen2.5 系列;中文与 Agent 能力强,ModelScope 镜像全。
Mistral AI
Mistral Large 2 等;欧洲开源代表,Apache 2.0 居多,适合多语言与企业私有化。
Microsoft · Phi
Phi-4 等小模型;端侧与边缘部署,14B 级在笔记本 GPU 上可跑。
Hugging Face
模型托管与推理 API 社区;StarCoder、SmolLM 等,是找权重与讨论的首选平台。

📋 模型选型指南

按使用场景选模型

综合对话
GPT-5.5 · Claude Opus 4.7 / Sonnet 4.6 · Gemini 2.5 Pro · DeepSeek-V4
编程/SWE-bench
Claude Opus 4.7 · DeepSeek-V4-Pro · Sonnet 4.6 · 编码章 详表
中文场景
Qwen3.6 · DeepSeek-V4/R1 · Kimi K2.6 · GLM-5 · 豆包
数学/推理
o3/o4 · DeepSeek-R1 / V4(以官方报告为准)
用户体验
LMSYS Arena
低成本 API
DeepSeek · 豆包 · Qwen-Turbo(见官网单价)
开源/本地
Qwen3-7B · Llama 4 · DeepSeek-V4-Flash · Phi-4
长文档
Kimi · Gemini 长上下文 · Claude(以官方上限为准)
企业 RAG
Command R+ · GPT-5.5 / 4o · Qwen3.6
多模态
GPT-5.5 / 4o · Gemini 2.5 · 混元/通义 API