跳转至

bedrock-converse

Since Docker image version 0.0.6

Amazon Bedrock LLM 统一调用。

将消息发送到指定的 Amazon Bedrock 模型。Converse提供了一个与支持消息的所有模型兼容的统一接口。这允许您只编写一次代码,并将其用于不同的模型。如果某个模型具有独特的推理参数,您也可以将这些独特的参数传递给该模型。

参数配置

通过亚马逊Bedrock Converse API调用模型。您可以使用此提供程序配置所有支持的模型。

这个网址 解释了如何使用 Bedrock Converse API 以及他支持的特性。

提示词缓存
这个网址 可以看到支持模型和用法。
请注意,总的提示缓存数量不要超出文档中的描述。其中:system 算一个,tools 算一个,messagePositions 的算多个,这些总和不要超出限制。

建议使用这个 Provider 来支持 Bedrock 的大语言模型。

Key Type Required Default value Description
modelId string Y Model id, 点这里查看列表
regions string[] or string N [“us-east-1”] 如果您已经申请并指定了多个地区,那么将会随机选择一个地区进行调用。这个功能可以有效缓解性能瓶颈。
maxTokens number N 1024 默认最大 tokens 数量,对应标准 API 的 max_tokens 参数。 如果 API 请求中不指定,则使用此值。
thinking boolen N false 是否开启 reason/think 功能
thinkBudget number N 1024 在开启 thinking 的情况下,推理部分允许的最大 tokens 数量
promptCache.fields string[] N 在什么位置开启提示词缓存,支持三个字符串:”system”, “messages”, “tools”
promptCache.messagePositions int[] N 多轮对话中,可以指定 messages 缓存的加载位置

bedrock-converse 的配置示例如下:

{
  "modelId": "us.anthropic.claude-3-7-sonnet-20250219-v1:0",
  "regions": [
    "us-east-1"
  ],
  "thinking": true,
  "maxTokens": 32000,
  "promptCache": {
    "fields": [
      "system",
      "messages",
      "tools"
    ],
    "messagePositions": [
      0,
      1
    ]
  },
  "thinkBudget": 2000
}

输出结果

输出中增加了 reasoning_content 字段,与 deepseek 的输出保持一致。如下:

data: {"id":"3","created":1740468210,"object":"text_completion","choices":[{"index":0,"delta":{"role":"assistant","content":"","reasoning_content":"你好"},"finish_reason":null,"logprobs":null}],"model":"sonnet37-think"}
...