全部AI模型 · AI大模型全景

快速跳转

📊 完整对比表 🇺🇸 美国阵营 🇨🇳 中国阵营 🇪🇺 欧洲/其他 🔓 开源模型 📋 选型建议

📊 全球AI模型完整对比表

数据声明：「发布时间」为模型公开发布或正式上架月份（培训整理，以厂商公告为准）。SWE-bench 列为 SWE-bench Verified 公开参考（偏编程）；MMLU 仅保留仍有对照意义的旧版分数。点击模型名称跳转官网。选型与定价以 Artificial Analysis、LMSYS Arena 及各厂商官网为准。

2026 年 5 月前沿梯队 + 高性价比 / 开源主力

#	模型名称	公司	类型	参数	SWE-bench	MMLU	发布时间	特色

📊 公开榜单参考（请自行核对最新）

排行榜变动频繁，培训时建议直接打开下列站点，勿背诵具体分数：

⚠️ 勿使用未在厂商官网或上述榜单出现的型号做采购决策。

🇺🇸 美国AI公司阵营

OpenAI

openai.com

GPT系列、o1/o3、Sora、DALL-E。全球AI领导者，推动GPT-4o/4.1/5代际迭代以及o系列推理模型。ChatGPT月活5亿+，2025年估值3000亿美元。

Anthropic

anthropic.com

Claude系列。由前OpenAI员工创立，专注AI安全与对齐。Claude 3.7 Sonnet编码能力全球第一，Claude Code CLI编程工具广受好评。

Google DeepMind

deepmind.google

Gemini系列、AlphaFold。200万Token上下文是其最大差异化优势。Gemini 2.0 Pro整合Google搜索/Map生态，多模态能力出色。

Meta AI

ai.meta.com

LLaMA系列。开源AI最坚定的推动者。Llama 4 Scout/Behemoth重新定义开源上限，全球开发者社区最大，是自托管/私有化部署的首选。

xAI (Elon Musk)

x.ai

Grok系列。深度整合X(Twitter)实时数据，可以实时获取社交媒体信息。Grok-3模型实力位居第一梯队，训练集群规模世界最大之一。

Microsoft

azure.microsoft.com

Phi系列、Copilot生态。微软不追求最大参数，但Phi-4以14B参数达到同级SOTA，适合边缘部署。深度整合Azure+Office+GitHub生态。

Mistral AI

mistral.ai

Mistral系列。欧洲AI代表，开源+商业混合模式。Mistral Large 2综合实力不俗，在欧洲市场占有率领先，支持多语言。

Cohere

cohere.com

Command R系列、Embedding模型。专注企业RAG场景，检索增强能力行业领先。其Embedding模型被广泛用于知识库搭建。

Amazon

aws.amazon.com

Amazon Nova系列、Bedrock平台。通过Bedrock提供多模型托管，Nova模型性价比突出。亚马逊AI生态深度整合电商/AWS/智能音箱。

Nous Research

nousresearch.com

Hermes系列、OpenHermes、Dolphin。开源AI社区明星，以高质量指令微调著称。Hermes 3 405B是开源Agent模型的标杆，Hermes Agent框架GitHub 17K Stars。

AI21 Labs

ai21.com

Jamba系列。以色列AI独角兽，独创SSM-Transformer混合架构（Jamba系列），长上下文处理能力强。商用开源，支持多语言，企业级RAG场景。

Reka AI

reka.ai

Reka Core/Flash/Edge系列。前DeepMind/Google Brain团队创立的AI公司，原生多模态（文/图/音/视/视频理解），边缘到云端全覆盖。

HuggingFace

huggingface.co

AI开源社区+模型托管平台。StarCoder2/SmolLM2/Zephyr系列。生态核心，是AI开发者必备的平台，模型数超100万。

Stability AI

stability.ai

Stable Diffusion系列+StableLM。AI图像生成领域的开源旗手，SD 3.5是Stable系列最先进的图像模型。公司2024年后经历调整重组。

Writer

writer.com

Palmyra X系列。企业级AI写作和文本生成平台，Palmyra模型专为企业内容创作场景优化，强调安全合规。

H2O.ai

h2o.ai

Danube系列。开源机器学习平台，Danube 3轻量级语言模型适合企业私有化部署。强调可解释AI和AutoML。

🇨🇳 中国AI公司阵营

深度求索 DeepSeek

deepseek.com

DeepSeek-R1/V3系列。2025年全球最火的中国AI公司。以低成本高性能震撼业界，API价格为GPT-4o的1/30，R1开源后引发美股科技抛售。中文+代码能力极强。

阿里云通义千问

tongyi.aliyun.com

Qwen系列。中国最活跃的开源模型体系，从0.5B到235B全覆盖。Qwen3-235B综合性能国内第一梯队，尤其Agent能力和代码能力突出。开源生态活跃。

百度文心

wenxin.baidu.com

文心4.5 Turbo。国内最早发布大模型的厂商之一，搜索增强能力突出。深度整合百度搜索/地图/文库生态，C端用户基数庞大。

字节跳动豆包

volcengine.com

Doubao Pro系列。以极低价格和大规模C端用户著称，豆包App月活过亿。火山引擎提供API，通过抖音/TikTok场景大规模验证。

智谱AI GLM

zhipuai.cn

GLM-4系列。清华系创业团队，GLM是国内最早的通用大模型之一。Agent工具调用能力突出，企业合作广泛。

月之暗面 Kimi

moonshot.cn

Kimi K2.5系列。以超长上下文(200万Token)著称，长文档理解力突出。创始人杨植麟为前清华AI研究员，Kimi成为知识工作者热门工具。

零一万物 Yi

01.ai

Yi系列。李开复创立，Yi-Lightning以极速响应和低价著称。开源+商业双线布局，产品矩阵完善。

腾讯混元

hunyuan.tencent.com

混元Turbo系列。整合腾讯生态（微信/企微/腾讯云），视频多模态能力特色突出。在音视频处理和游戏场景应用广泛。

科大讯飞星火

xinghuo.xfyun.cn

星火Spark 4.5。国内语音AI领导者，语音识别和合成能力突出。在教育和医疗场景有深厚积累，星火大模型获批较早。

百川智能

baichuan-inc.com

Baichuan系列。搜狗创始人王小川创立，Baichuan-3在中文场景表现不俗。专注医疗AI应用。

华为盘古

huaweicloud.com

盘古大模型系列。华为自主AI芯片（昇腾）+大模型全栈，气象大模型全球领先。企业级市场（政府/运营商）优势明显。

MiniMax

minimaxi.com

Minimax M2.5、海螺AI。音视频多模态和C端产品（海螺AI）表现出色，视频生成质量在国内领先。

上海AI实验室 InternLM

internlm.org

InternLM系列。学术研究导向，书生开源模型体系。8B模型在同参数下表现优异，适合学界和轻量部署。

小米 MiMo

mi.com

MiMo-V2.5-Pro。小米2025年正式入局大模型，MiMo系列在综合评测中表现不俗，"手机+AIoT+汽车"三位一体生态整合潜力巨大。

🌍 其他地区AI公司

🇪🇺 Mistral AI (法国)

mistral.ai

欧洲AI领军者，创始人来自Meta/Google DeepMind。Mistral Large 2和Small系列，多语言能力突出，获法国政府大力支持。

🇰🇷 Upstage (韩国)

upstage.ai

Solar系列。韩国最大AI独角兽，Pre-MoE架构优化出色。擅长韩语+多语言NLP。

🇫🇮 Silen AI (芬兰)

silen.ai

Poro系列。北欧AI新星，Poro 34B在斯堪的纳维亚语言处理上领先，轻量高效。

🇦🇪 TII (阿联酋)

falconllm.tii.ae

Falcon系列。阿联酋技术创新研究所开源Falcon，中东最强AI模型，阿拉伯语优先。

🔓 开源模型与本地部署

权重可下载、可自托管（License 以各项目为准）。下表汇总本站对比表中的开源型号；完整梯队见完整对比表。

常见部署路径

一键体验：Ollama（Llama / Qwen / DeepSeek 等）
模型下载：Hugging Face · 魔搭 ModelScope
生产推理：vLLM · llama.cpp · TensorRT-LLM

💡 7B～14B 适合单卡消费级 GPU；MoE 大模型需多卡或量化（AWQ / GPTQ）。

模型名称	公司	参数	SWE-bench	发布时间	场景 / 特色

开源生态与社区

Meta · Llama

ai.meta.com/llama

Llama 4 Scout、Llama 3.1 等；全球开发者生态最大，Ollama / HF 首发适配多。

深度求索 DeepSeek

deepseek.com

V4-Pro / Flash、R1、V3 等 MoE 开源；编程与推理性价比极高，国内下载友好。

阿里 · Qwen 开源

qwenlm.github.io

Qwen3-235B MoE、Qwen3-7B、Qwen2.5 系列；中文与 Agent 能力强，ModelScope 镜像全。

Mistral AI

mistral.ai

Mistral Large 2 等；欧洲开源代表，Apache 2.0 居多，适合多语言与企业私有化。

Microsoft · Phi

Phi 系列

Phi-4 等小模型；端侧与边缘部署，14B 级在笔记本 GPU 上可跑。

Hugging Face

huggingface.co

模型托管与推理 API 社区；StarCoder、SmolLM 等，是找权重与讨论的首选平台。

📋 模型选型指南

按使用场景选模型

综合对话

GPT-5.5 · Claude Opus 4.7 / Sonnet 4.6 · Gemini 2.5 Pro · DeepSeek-V4

编程/SWE-bench

Claude Opus 4.7 · DeepSeek-V4-Pro · Sonnet 4.6 · 编码章详表

中文场景

Qwen3.6 · DeepSeek-V4/R1 · Kimi K2.6 · GLM-5 · 豆包

数学/推理

o3/o4 · DeepSeek-R1 / V4（以官方报告为准）

用户体验

见 LMSYS Arena

低成本 API

DeepSeek · 豆包 · Qwen-Turbo（见官网单价）

开源/本地

Qwen3-7B · Llama 4 · DeepSeek-V4-Flash · Phi-4

长文档

Kimi · Gemini 长上下文 · Claude（以官方上限为准）

企业 RAG

Command R+ · GPT-5.5 / 4o · Qwen3.6

多模态

GPT-5.5 / 4o · Gemini 2.5 · 混元/通义 API

🏆 全球AI知名模型大全

快速跳转

📊 公开榜单参考（请自行核对最新）

常见部署路径

按使用场景选模型