手把手教会你在 Amazon Bedrock 使用Claude Fable 5

因_果_律

429人浏览 · 2026-06-10 12:28:51

因_果_律 · 2026-06-10 12:28:51 发布

Claude Fable 5 在 Amazon Bedrock 上的使用指南

2026 年 6 月 9 日，Anthropic 正式发布了 Claude Fable 5，并在发布当天即可通过 Amazon Bedrock 调用。本文将介绍从 Agreement 签署、Data Retention 设置到 Converse API 推理执行的完整流程，以及使用时的注意事项。

在这里插入图片描述
AWS公告

一、什么是 Claude Fable 5？

2026 年 4 月限量开放的 Mythos Preview（Project Glasswing） 正式版，就是 Fable 5。

Fable 5 和 Mythos 5 共享同一底层模型，区别仅在于是否附带安全防护（Safeguard）：

Fable 5：含 Safeguard（面向通用场景）
Mythos 5：无 Safeguard（面向高级研究场景）

名称来源颇有意思：拉丁语 fabula 和希腊语 mythos 都含有「故事」之意，体现了这一系列模型的命名哲学。

二、价格对比

项目	Claude Fable 5	Opus 4.8（参考）	Mythos Preview（参考）
模型级别	Mythos	Opus	Mythos
API Model ID	claude-fable-5	claude-opus-4-8	（限量开放）
上下文窗口	1M tokens	200K tokens	1M tokens
最大输出	128K tokens	32K tokens	128K tokens
输入价格	$10 / 1M tokens	$5 / 1M tokens	$25 / 1M tokens
输出价格	$50 / 1M tokens	$25 / 1M tokens	$125 / 1M tokens
Safeguard	✅ 有	❌ 无	❌ 无
知识截止日期	2026 年 1 月	—	—

价格亮点： Fable 5 的输入/输出价格均为 Mythos Preview 的 40%，以更亲民的价格获得 Mythos 级别的能力。相比 Opus 4.8，输入/输出均贵约 2 倍，但上下文窗口扩大到 1M tokens。

三、主要特性

根据 Anthropic 官方博客，Fable 5 / Mythos 5 具备以下性能亮点：

长任务优势显著： 任务越长越复杂，相比其他模型的优势越大
超强代码能力（SWE）： Stripe 用它在 5000 万行 Ruby 代码库上，将原本需要 2 个月的迁移工作压缩到 1 天完成
视觉能力顶尖： Anthropic 称其 Vision 性能达到业界最高水准，甚至仅凭视觉信息通关了《口袋妖怪 FireRed》
超长上下文： 在数百万 token 的输入下仍能保持注意力，并通过自我备注机制提升推理质量

Safeguard 结构

维度	详情
覆盖领域	网络安全 / 生物化学 / 模型蒸馏
触发行为	Anthropic 称会 fallback 到 Opus 4.8 响应；但经 Bedrock 验证，实际返回空 content + `content_filtered`（后文详述）
触发频率	官方称低于 5% 的 session
数据保留	出于安全目的保留 30 天

四、实战：在 Bedrock 上使用 Claude Fable 5

验证环境：

区域：us-east-1
Model ID：global.anthropic.claude-fable-5（Global cross-region inference profile）
验证时间：2026-06-10 08:45–08:47 JST
AWS CLI：2.27.x / Python 3.12

Step 1：签署 Agreement

使用 Fable 5 之前，必须先同意数据保留政策（Agreement）。

# 查询可用的 Offer
aws bedrock list-foundation-model-agreement-offers \
  --model-id anthropic.claude-fable-5 \
  --region us-east-1

# 用获取到的 offer-token 创建 Agreement
aws bedrock create-foundation-model-agreement \
  --model-id anthropic.claude-fable-5 \
  --offer-token <offer-token> \
  --region us-east-1

Step 2：启用 Data Retention API

使用该模型的前提条件之一是启用 provider data share，开启后推理数据将被共享给 Anthropic（详见注意事项）。

注意： 截至撰文时，Management Console 的 UI 中无法完成此设置，boto3 也暂未支持对应方法。因此需要通过 SigV4 手动签名 直接调用 API。

import boto3, json
from botocore.auth import SigV4Auth
from botocore.awsrequest import AWSRequest
import requests as req

session = boto3.Session(region_name='us-east-1')
credentials = session.get_credentials().get_frozen_credentials()

url = 'https://bedrock.us-east-1.amazonaws.com/data-retention'
body = json.dumps({
    'mode': 'provider_data_share',
    'modelId': 'anthropic.claude-fable-5'
})

request = AWSRequest(method='PUT', url=url, data=body,
                     headers={'Content-Type': 'application/json'})
SigV4Auth(credentials, 'bedrock', 'us-east-1').add_auth(request)

r = req.put(url, headers=dict(request.headers), data=body)
print(r.status_code, r.json())

前提：运行环境已通过 IAM Role 或 Profile 配置好 AWS 认证信息。

成功响应示例：

{
  "mode": "provider_data_share",
  "updatedAt": "2026-06-09T23:46:41.595Z"
}

Step 3：通过 Converse API 发起推理

aws bedrock-runtime converse \
  --model-id "global.anthropic.claude-fable-5" \
  --messages '[{"content":[{"text":"你好！请告诉我你的模型名称，一句话即可。"}],"role":"user"}]' \
  --inference-config '{"maxTokens":100}' \
  --region us-east-1

完整响应示例：

{
  "output": {
    "message": {
      "role": "assistant",
      "content": [
        {
          "reasoningContent": {
            "reasoningText": {
              "text": "",
              "signature": "CAISpwIKYAgOEAEYAipABCVa..."
            }
          }
        },
        {
          "text": "你好！我是**Claude**。"
        }
      ]
    }
  },
  "stopReason": "end_turn",
  "usage": {
    "inputTokens": 30,
    "outputTokens": 57,
    "totalTokens": 87
  },
  "metrics": {
    "latencyMs": 5431
  }
}

响应解读

响应中包含了 reasoningContent 字段——这是因为 Fable 5 的 Reasoning 功能始终开启。本次 reasoningText.text 为空，但 signature 字段有值，说明 Reasoning 并未被禁用，只是可见文本较短。outputTokens: 57 远大于实际输出文字量，正是因为 Reasoning 部分也计入了输出 token。

延迟为 5,431ms，仅供单次调用参考。

五、使用注意事项

1. Provider Data Share（数据共享）

使用该模型的前提是启用 provider data share。开启后，推理数据将在 30 天内共享给 Anthropic。官方声明该数据仅用于安全目的，不用于模型训练。详情请参阅官方文档。

2. Reasoning 始终开启

可以调整 effort level，但无法关闭 Reasoning 本身。即使 reasoningText.text 为空，也会产生 Reasoning token 消耗，影响输出 token 数量和费用。

3. Temperature 固定为 1.0

Temperature 被锁定在 1.0，用户无法修改。无法通过采样参数来稳定输出。

4. top_p / top_k 限制

top_p：必须 ≥ 0.99 且 < 1.0（不可指定 1.0），不需要时建议不传
top_k：不支持

5. Safeguard 触发时的处理

重要： Anthropic 官方表示 Safeguard 触发时会 fallback 到 Opus 4.8，但通过 Bedrock Converse API 实测，触发时返回的是 stopReason: "content_filtered" + 空 content，并不包含 fallback 响应。

注意是 "content_filtered" 而非 "refusal"。触发时 inputTokens: 0，完全不计费。应用侧需要将 stopReason: "content_filtered" 作为正常情况处理。

Safeguard 触发时的响应示例：

{
  "output": {
    "message": {
      "role": "assistant",
      "content": []
    }
  },
  "stopReason": "content_filtered",
  "usage": {
    "inputTokens": 0,
    "outputTokens": 0,
    "totalTokens": 0
  },
  "metrics": {
    "latencyMs": 5970
  }
}

6. 区域限制（截至 2026-06-10）

访问方式	可用区域
In-Region	`us-east-1`、`eu-north-1`
Global cross-region inference	东京（`ap-northeast-1`）等其他区域可通过此方式访问

区域可用情况随时变化，请以官方文档为准。

7. 其他限制速查

项目	说明
Service Tier	目前仅支持 Standard，不支持 Priority / Flex / Reserved
端点类型	`bedrock-runtime`（支持 Guardrails、Knowledge Bases 等 AWS 功能）vs `bedrock-mantle`（Anthropic SDK 兼容，不支持上述 AWS 功能）
Prompt Cache	支持，但需显式指定 cache checkpoint（最小 1,024 tokens，最多 4 个 checkpoint，TTL 5 分钟 / 1 小时）