Bedrock

2026年5月15日

1. Model catalog

Amazon Bedrock Foundation Models
Amazon Bedrock Marketplace
Bedrock Custom Model Import

1.1. 区别对比

特性	Foundation Models	Marketplace	Custom Model Import
模型来源	AWS 托管的精选模型	第三方提供商模型	自定义训练/微调模型
托管方式	AWS 全托管	第三方托管/市场交易	自主部署
成本模式	按使用量付费	可能需订阅/许可费	自带许可成本
可用性	立即可用，高 SLA	依赖提供商	自行维护
定制程度	标准模型	专业/领域模型	完全自定义
数据隐私	AWS 标准	依赖提供商	完全控制

1.1.1. Foundation Models (基础模型库)

定义: AWS 原生提供、完全托管的精选模型集合
特点:
- 由 AWS 直接托管和维护，高可用性保证
- 经过严格测试和优化
- 按实际使用量付费，无基础设施成本
- 开箱即用，无需部署
模型来源:
- Amazon 自研 (Nova, Titan 系列)
- 顶级 AI 公司 (Anthropic Claude, Meta Llama, Mistral, Cohere)
适用场景: 快速上线、通用任务、成本优化

1.1.2. Marketplace (模型市场)

定义: 第三方模型提供商的模型交易平台
特点:
- 扩展可选模型范围
- 包含专业领域、特定任务模型
- 可能需要额外订阅或许可费用
- 部分模型需要特殊配置
模型来源: 各种 AI 公司、研究机构
适用场景: 特定专业领域、需要最新研究成果

1.1.3. Custom Model Import (自定义模型导入)

定义: 导入和部署自己训练或微调的模型
特点:
- 完全控制模型选择和训练
- 支持基于开源模型微调/持续预训练
- 数据完全自主可控
- 需要处理模型生命周期
模型来源: 自行训练或微调的模型
适用场景:
- 特定行业知识
- 数据隐私要求高
- 需要完全定制化

1.2. model choice

1.2.1. Amazon Models

模型名称	参数大小	使用场景
Nova Micro	~11B	快速文本生成、对话
Nova Lite	~20B	多模态理解(文本/图像/视频)
Nova Pro	~90B	多模态复杂推理
Nova Premier	~470B	最强多模态能力
Nova Canvas	-	图像生成
Nova Reel	-	视频生成
Nova Sonic	-	语音交互
Titan Text Express	-	通用文本生成
Titan Text Lite	-	轻量级文本任务
Titan Text Premier	-	高级文本理解
Titan Embeddings G1	-	文本向量化
Titan Image Generator	-	图像生成

1.2.2. Anthropic Claude Models

模型名称	参数大小	使用场景
Claude 3 Haiku	~20B	快速响应、简单任务
Claude 3 Sonnet	~70B	平衡性能与速度
Claude 3 Opus	~2T	复杂推理、高质量输出
Claude 3.5 Haiku	~20B	成本优化多模态
Claude 3.5 Sonnet	~70B	多模态理解与编程
Claude 3.7 Sonnet	~70B	扩展上下文、复杂任务
Claude Sonnet 4	~70B	最新平衡型
Claude Opus 4	~2T	最强推理能力
Claude Haiku 4.5	~20B	快速响应、简单任务
Claude Sonnet 4.5	~70B+	智能体、编程、工具使用
Claude Opus 4.5	~2T+	自主推理、规划执行

1.2.3. Meta Llama Models

模型名称	参数大小	使用场景
Llama 3 8B	8B	轻量级部署
Llama 3 70B	70B	高性能推理
Llama 3.1 8B	8B	优化轻量任务
Llama 3.1 70B	70B	通用高性能
Llama 3.1 405B	405B	超大规模推理
Llama 3.2 1B	1B	极速响应、边缘设备
Llama 3.2 3B	3B	轻量级应用
Llama 3.2 11B	11B	多模态视觉理解
Llama 3.2 90B	90B	多模态复杂任务
Llama 3.3 70B	70B	优化推理性能
Llama 4 Maverick 17B	17B	多模态智能体
Llama 4 Scout 17B	17B	快速多模态

1.2.4. Mistral AI Models

模型名称	参数大小	使用场景
Mistral 7B	7.3B	高效开源模型
Mixtral 8x7B	46.7B	MoE架构、高质量输出
Mistral Small	7.3B	快速响应
Mistral Large (24.02)	123B	复杂推理
Mistral Large (24.07)	123B	最新推理能力
Pixtral Large	~123B	多模态理解

1.2.5. DeepSeek Models

模型名称	参数大小	使用场景
DeepSeek-R1	671B (37B激活)	高级推理

1.2.6. Google Gemma Models

模型名称	参数大小	使用场景
Gemma 3 270M	270M	文本嵌入
Gemma 3 1B	1B	轻量级部署
Gemma 3 4B	4B	平衡性能与速度
Gemma 3 12B	12B	多模态理解
Gemma 3 27B	27B	高级推理

1.2.7. Other Models

提供商	模型名称	参数大小	使用场景
AI21 Labs	Jamba 1.5 Large	398B (94B激活)	长文本处理
AI21 Labs	Jamba 1.5 Mini	52B (12B激活)	快速生成
Cohere	Command R+	104B	RAG、工具调用
Cohere	Command R	~35B	企业应用
Cohere	Command	-	通用文本生成
Cohere	Embed English/Multilingual	-	向量嵌入
Cohere	Rerank 3.5	-	搜索重排序
OpenAI	gpt-oss-20b	20B	代码与推理
OpenAI	gpt-oss-120b	120B	高级代码分析
Stability AI	Stable Diffusion 3.5 Large	-	图像生成
Stability AI	Stable Image Core/Ultra	-	高质量图像
Luma AI	Ray v2	-	视频生成
TwelveLabs	Marengo/Pegasus	-	视频理解
Writer	Palmyra X4/X5	-	企业写作

2. knowledge base(知识向量数据库)

datasource:

S3 (Simple Storage Service): 对象存储服务
web crawler
confluence
sharePoint
Custom data sources

3. evaluation

被评测模型
评测模型
数据集
评测指标

评论