Amazon Bedrock 新增了来自 Google、MiniMax AI、Mistral AI、Moonshot AI、NVIDIA、OpenAI 和 Qwen 的 18 个完全托管的开源模型,包括新的 Mistral Large 3 和 Ministral 3 模型,涵盖 3B、8B 和 14B 等规模。
此次发布后,Amazon Bedrock 现在提供了近 100 个无服务器模型,涵盖领先 AI 公司的广泛且深入的模型选择,使客户能够选择最符合其独特需求的精确功能。我们密切关注客户的需求和技术进步,根据客户需求和技术发展定期扩展 我们精选的模型库 ,将有前景的新模型与已有的行业热门模型相结合。
这种持续扩展高性能且差异化的模型选择,有助于客户保持在 AI 创新前沿。您可以通过 Amazon Bedrock 的统一 API 访问这些模型,评估、切换和采用新模型,而无需重写应用程序或更改基础设施。新 Mistral AI 模型这四个 Mistral AI 模型现已首先在 Amazon Bedrock 上推出,每个模型都针对不同的性能和成本需求进行了优化:
- Mistral Large 3 – 这个开源模型经过优化,适用于长上下文、多模态和指令可靠性任务。它在长文档理解、代理和工具使用工作流、企业知识工作、编码协助、数学和编码任务等高级工作负载、多语言分析和处理以及结合视觉的多模态推理方面表现出色。
- Ministral 3 3B – Ministral 3 系列中最小的模型,专为单个 GPU 部署进行边缘优化,具备强大的语言和视觉能力。它在图像描述、文本分类、实时翻译、数据提取、短内容生成以及在边缘或低资源设备上的轻量级实时应用中展现出稳健的性能。
- Ministral 3 8B – 这是文本和视觉方面表现最佳的 Ministral 3 模型,专为单个 GPU 部署进行边缘优化,具有高性能和最小的占用空间。该模型适用于受限环境中的聊天界面、图像和文档描述与理解、专用代理使用场景,以及本地或嵌入式系统的平衡性能。
- Ministral 3 14B – 最强大的 Ministral 3 模型提供最先进的文本和视觉性能,专为单 GPU 部署进行优化。您可以使用这些高级本地智能体用例和私有 AI 部署,让高级功能与实际硬件限制相结合。
更多开放权重模型选项
您可以在各个行业广泛使用这些开放权重模型来应对各种用例:
| 模型提供商 | 模型名称 | 描述 | 使用场景 |
| Gemma 3 4B | 高效的文字和图像模型,可在笔记本电脑上本地运行。支持设备端人工智能应用的多语言功能。 | 设备端 AI 用于移动和边缘应用,隐私敏感的本地推理,多语言聊天助手,图像描述和标题生成,以及轻量级内容生成。 | |
| Gemma 3 12B | 工作站平衡的文本和图像模型。多语言理解,适用于隐私敏感的应用程序的本地部署。 | 基于工作站的 AI 应用;适用于企业的本地部署;多语言文档处理、图像分析和问答;以及符合隐私要求的 AI 助手。 | |
| Gemma 3 27B | 强大的文本和图像模型,适用于企业应用。多语言支持,适用于隐私和控制需求的本地部署。 | 企业本地部署,高性能多模态应用,高级图像理解,多语言客户服务,以及数据敏感型 AI 工作流。 | |
| Moonshot AI | Kimi K2 Thinking | 深度推理模型,可在使用工具时进行思考。可处理需要数百个连续操作的研究、编程和复杂工作流。 | 需要规划、多步骤工作流、数据分析和计算,以及需要研究的长篇内容创作的复杂编码项目。 |
| MiniMax AI | MiniMax M2 | 专为编码代理和自动化设计。擅长多文件编辑、终端操作和高效执行长工具调用链。 | 代码代理和集成开发环境(IDE)集成、多文件代码编辑、终端自动化和 DevOps、长链工具编排,以及代理软件开发。 |
| Mistral AI | Ministral 3 | 擅长数学、编程、多语言任务以及多模态推理,具备视觉能力,适合高效本地部署。 | 数学和编程任务,多语言分析与处理,以及结合视觉的多模态推理。 |
| Voxtral Mini 1.0 | 高级音频理解模型,支持转录、多语言、问答、摘要和函数调用。 | 语音控制应用,快速语音转文本转换,以及离线语音助手。 | |
| Voxtral Small 1.0 | 具备最先进的音频输入功能,文本表现处于行业领先水平;在语音转录、翻译和理解方面表现卓越。 | 企业语音转录、多语言客户服务以及音频内容摘要。 | |
| NVIDIA | NVIDIA Nemotron Nano 2 9B | 高效混合型变压器 Mamba 架构的 LLM,擅长推理和代理任务。 | 推理、工具调用、数学、编程和遵循指令。 |
| NVIDIA Nemotron Nano 2 VL 12B | 先进的多模态推理模型,用于视频理解和文档智能,支持检索增强生成(RAG)和多模态代理应用。 | 多图像和视频理解、视觉问答和总结。 | |
| OpenAI | gpt-oss-safeguard-20b | 内容安全模型,应用您的自定义策略。对有害内容进行分类,并提供解释以支持信任与安全工作流程。 | 内容审核和安全分类、自定义策略执行、用户生成内容过滤、信任与安全工作流程以及自动内容分类。 |
| gpt-oss-safeguard-120b | 更大内容安全模型,适用于复杂的内容审核。可应用自定义策略并进行详细推理,以支持企业信任与安全团队。 | 企业级内容审核,复杂策略解读,多层级安全分类,合规性检查,高风险内容审核。 | |
| Qwen | Qwen3-Next-80B-A3B | 通过混合注意力实现快速推理,适用于超长文档。优化用于 RAG 流程、工具使用及代理工作流,响应迅速。 | RAG 流程处理长文档,代理工作流调用工具,代码生成与软件开发,多轮对话扩展上下文,多语言内容生成。 |
| Qwen3-VL-235B-A22B | 理解图像和视频。从文档中提取文本,将截图转换为可运行的代码,并自动化界面操作。 | 从图像和 PDF 中提取文本,将用户界面设计或截图转换为可运行的代码,自动化应用程序中的点击和导航,视频分析和理解,阅读图表和示意图。 |
在部署公开可用模型时,请仔细考虑生产环境中数据隐私要求,检查输出中的偏见,并监控您的结果以确保数据安全、 负责任的 AI 和 模型评估 。
您可以访问 Amazon Bedrock 的企业级安全功能 ,并使用 Amazon Bedrock Guardrails 实现符合您应用程序需求和负责任的 AI 政策的安全保障。您还可以使用 Amazon Bedrock 模型评估工具来评估和比较模型,以确定最适合您使用场景的模型。
开始使用,您可以通过在 Amazon Bedrock 控制台 的 playground 中使用几个提示来快速测试这些模型,或者使用任何 AWS SDKs 来访问 Bedrock 的 InvokeModel 和 Converse API。您还可以使用这些模型与任何支持 Amazon Bedrock 的代理框架配合使用,并通过 Amazon Bedrock AgentCore 和 Strands Agents 部署代理。如需了解更多信息,请参阅 Amazon Bedrock 用户指南中的使用 AWS SDKs 的代码示例 。
现已推出
查看 完整区域列表 以了解新模型的可用性及未来更新,或在 AWS 区域能力 的 AWS CloudFormation 资源标签中搜索您的模型名称。如需了解更多信息,请查看 Amazon Bedrock 产品页面 和 Amazon Bedrock 定价页面 。
今天就在 Amazon Bedrock 控制台 中尝试这些模型,并将反馈发送至 AWS re:Post for Amazon Bedrock 或通过您通常的 AWS 支持联系人。