Bedrock
1. Model catalog
- Amazon Bedrock Foundation Models
- Amazon Bedrock Marketplace
- Bedrock Custom Model Import
1.1. 区别对比
| 特性 | Foundation Models | Marketplace | Custom Model Import |
|---|---|---|---|
| 模型来源 | AWS 托管的精选模型 | 第三方提供商模型 | 自定义训练/微调模型 |
| 托管方式 | AWS 全托管 | 第三方托管/市场交易 | 自主部署 |
| 成本模式 | 按使用量付费 | 可能需订阅/许可费 | 自带许可成本 |
| 可用性 | 立即可用,高 SLA | 依赖提供商 | 自行维护 |
| 定制程度 | 标准模型 | 专业/领域模型 | 完全自定义 |
| 数据隐私 | AWS 标准 | 依赖提供商 | 完全控制 |
1.1.1. Foundation Models (基础模型库)
- 定义: AWS 原生提供、完全托管的精选模型集合
- 特点:
- 由 AWS 直接托管和维护,高可用性保证
- 经过严格测试和优化
- 按实际使用量付费,无基础设施成本
- 开箱即用,无需部署
- 模型来源:
- Amazon 自研 (Nova, Titan 系列)
- 顶级 AI 公司 (Anthropic Claude, Meta Llama, Mistral, Cohere)
- 适用场景: 快速上线、通用任务、成本优化
1.1.2. Marketplace (模型市场)
- 定义: 第三方模型提供商的模型交易平台
- 特点:
- 扩展可选模型范围
- 包含专业领域、特定任务模型
- 可能需要额外订阅或许可费用
- 部分模型需要特殊配置
- 模型来源: 各种 AI 公司、研究机构
- 适用场景: 特定专业领域、需要最新研究成果
1.1.3. Custom Model Import (自定义模型导入)
- 定义: 导入和部署自己训练或微调的模型
- 特点:
- 完全控制模型选择和训练
- 支持基于开源模型微调/持续预训练
- 数据完全自主可控
- 需要处理模型生命周期
- 模型来源: 自行训练或微调的模型
- 适用场景:
- 特定行业知识
- 数据隐私要求高
- 需要完全定制化
1.2. model choice
1.2.1. Amazon Models
| 模型名称 | 参数大小 | 使用场景 |
|---|---|---|
| Nova Micro | ~11B | 快速文本生成、对话 |
| Nova Lite | ~20B | 多模态理解(文本/图像/视频) |
| Nova Pro | ~90B | 多模态复杂推理 |
| Nova Premier | ~470B | 最强多模态能力 |
| Nova Canvas | - | 图像生成 |
| Nova Reel | - | 视频生成 |
| Nova Sonic | - | 语音交互 |
| Titan Text Express | - | 通用文本生成 |
| Titan Text Lite | - | 轻量级文本任务 |
| Titan Text Premier | - | 高级文本理解 |
| Titan Embeddings G1 | - | 文本向量化 |
| Titan Image Generator | - | 图像生成 |
1.2.2. Anthropic Claude Models
| 模型名称 | 参数大小 | 使用场景 |
|---|---|---|
| Claude 3 Haiku | ~20B | 快速响应、简单任务 |
| Claude 3 Sonnet | ~70B | 平衡性能与速度 |
| Claude 3 Opus | ~2T | 复杂推理、高质量输出 |
| Claude 3.5 Haiku | ~20B | 成本优化多模态 |
| Claude 3.5 Sonnet | ~70B | 多模态理解与编程 |
| Claude 3.7 Sonnet | ~70B | 扩展上下文、复杂任务 |
| Claude Sonnet 4 | ~70B | 最新平衡型 |
| Claude Opus 4 | ~2T | 最强推理能力 |
| Claude Haiku 4.5 | ~20B | 快速响应、简单任务 |
| Claude Sonnet 4.5 | ~70B+ | 智能体、编程、工具使用 |
| Claude Opus 4.5 | ~2T+ | 自主推理、规划执行 |
1.2.3. Meta Llama Models
| 模型名称 | 参数大小 | 使用场景 |
|---|---|---|
| Llama 3 8B | 8B | 轻量级部署 |
| Llama 3 70B | 70B | 高性能推理 |
| Llama 3.1 8B | 8B | 优化轻量任务 |
| Llama 3.1 70B | 70B | 通用高性能 |
| Llama 3.1 405B | 405B | 超大规模推理 |
| Llama 3.2 1B | 1B | 极速响应、边缘设备 |
| Llama 3.2 3B | 3B | 轻量级应用 |
| Llama 3.2 11B | 11B | 多模态视觉理解 |
| Llama 3.2 90B | 90B | 多模态复杂任务 |
| Llama 3.3 70B | 70B | 优化推理性能 |
| Llama 4 Maverick 17B | 17B | 多模态智能体 |
| Llama 4 Scout 17B | 17B | 快速多模态 |
1.2.4. Mistral AI Models
| 模型名称 | 参数大小 | 使用场景 |
|---|---|---|
| Mistral 7B | 7.3B | 高效开源模型 |
| Mixtral 8x7B | 46.7B | MoE架构、高质量输出 |
| Mistral Small | 7.3B | 快速响应 |
| Mistral Large (24.02) | 123B | 复杂推理 |
| Mistral Large (24.07) | 123B | 最新推理能力 |
| Pixtral Large | ~123B | 多模态理解 |
1.2.5. DeepSeek Models
| 模型名称 | 参数大小 | 使用场景 |
|---|---|---|
| DeepSeek-R1 | 671B (37B激活) | 高级推理 |
1.2.6. Google Gemma Models
| 模型名称 | 参数大小 | 使用场景 |
|---|---|---|
| Gemma 3 270M | 270M | 文本嵌入 |
| Gemma 3 1B | 1B | 轻量级部署 |
| Gemma 3 4B | 4B | 平衡性能与速度 |
| Gemma 3 12B | 12B | 多模态理解 |
| Gemma 3 27B | 27B | 高级推理 |
1.2.7. Other Models
| 提供商 | 模型名称 | 参数大小 | 使用场景 |
|---|---|---|---|
| AI21 Labs | Jamba 1.5 Large | 398B (94B激活) | 长文本处理 |
| AI21 Labs | Jamba 1.5 Mini | 52B (12B激活) | 快速生成 |
| Cohere | Command R+ | 104B | RAG、工具调用 |
| Cohere | Command R | ~35B | 企业应用 |
| Cohere | Command | - | 通用文本生成 |
| Cohere | Embed English/Multilingual | - | 向量嵌入 |
| Cohere | Rerank 3.5 | - | 搜索重排序 |
| OpenAI | gpt-oss-20b | 20B | 代码与推理 |
| OpenAI | gpt-oss-120b | 120B | 高级代码分析 |
| Stability AI | Stable Diffusion 3.5 Large | - | 图像生成 |
| Stability AI | Stable Image Core/Ultra | - | 高质量图像 |
| Luma AI | Ray v2 | - | 视频生成 |
| TwelveLabs | Marengo/Pegasus | - | 视频理解 |
| Writer | Palmyra X4/X5 | - | 企业写作 |
2. knowledge base(知识向量数据库)
datasource:
- S3 (Simple Storage Service): 对象存储服务
- web crawler
- confluence
- sharePoint
- Custom data sources
3. evaluation
被评测模型
评测模型
数据集
评测指标