跳到主要内容

国内零门槛接入Gemini 2.5 & Claude 4指南

课程说明:

  体验课时间有限,若想深度学习大模型技术,欢迎大家报名由我主讲的《2025大模型Agent智能体开发实战》(5月班)

d0c81dfe43a1becced8c07db33c3a787_

《2025大模型Agent智能体开发实战》(5月班) 为【100+小时】体系大课,总共20大模块精讲精析,零基础直达大模型企业级应用!

img

同时,5月班重磅新增DeepSeek+Agents SDK+谷歌ADK+MCP技术应用与智能体开发相关实战内容,并计划新增Qwen-3模型实战教学:

34533e2c95414b3dc5ab1131d9d1e38

部分项目成果演示

from IPython.display import Video
  • MateGen项目演示
Video("https://ml2022.oss-cn-hangzhou.aliyuncs.com/4.MateGen%20Pro%20%E9%A1%B9%E7%9B%AE%E5%8A%9F%E8%83%BD%E6%BC%94%E7%A4%BA.mp4", width=800, height=400)
  • 智能客服项目演示
Video("https://ml2022.oss-cn-hangzhou.aliyuncs.com/%E6%99%BA%E8%83%BD%E5%AE%A2%E6%9C%8D%E6%A1%88%E4%BE%8B%E6%BC%94%E7%A4%BA.mp4", width=800, height=400)
  • Dify项目演示
Video("https://ml2022.oss-cn-hangzhou.aliyuncs.com/2f1b47f42c65fd59e8d3a83e6cb9f13b_raw.mp4", width=800, height=400)
  • LangChain&LangGraph搭建Multi-Agnet
Video("https://ml2022.oss-cn-hangzhou.aliyuncs.com/%E5%8F%AF%E8%A7%86%E5%8C%96%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90Multi-Agent%E6%95%88%E6%9E%9C%E6%BC%94%E7%A4%BA%E6%95%88%E6%9E%9C.mp4", width=800, height=400)

此外,若是对大模型底层原理感兴趣,也欢迎报名由我和菜菜老师共同主讲的《2025大模型原理与实战课程》(5月班)

da5d51c998df07d747cd223c1ed25f7

两门大模型课程5月班目前上新特惠中,立减2000起,合购还有更多优惠哦~详细信息扫码添加助教,回复“大模型”,即可领取课程大纲&查看课程详情👇

104150cccbefc135f401007257c939e

国内零门槛接入Gemini 2.5 & Claude 4

本地聊天机器人 & 代码编辑器Cursor & Agent代码开发环境

1. Gemini & Claude模型发布情况与接入方法

🌟 Gemini 2.5:Google 推出的多模态智能模型

  在 2025 年 5 月的 Google I/O 大会上,Google 发布了 Gemini 2.5 系列模型,包括 Gemini 2.5 Pro 和 Gemini 2.5 Flash。其中,Gemini 2.5 Pro 是目前最先进的模型,具备强大的推理和编码能力,支持文本、图像、音频和视频等多种输入形式。该模型引入了“Deep Think”模式,能够处理复杂的数学和编程任务。此外,Gemini 2.5 Pro 拥有 100 万 token 的上下文窗口,适用于处理大规模数据集和复杂问题。Gemini 2.5 Flash 则优化了响应速度和效率,适合需要快速处理的任务。这两款模型均可通过 Google AI Studio 和 Vertex AI 进行访问。

🔗 官方网站:https://deepmind.google/models/gemini/pro/

512bad1e38094d61f773de7f3ddaa36

🧠 Claude 4:Anthropic 推出的混合推理 AI 模型

  2025 年 5 月 22 日,Anthropic 在其首届开发者大会上发布了 Claude 4 系列模型,包括 Claude Opus 4 和 Claude Sonnet 4。这两款模型采用混合推理架构,能够在快速响应和深入推理之间切换。Claude Opus 4 是目前最强大的模型,特别擅长处理需要长时间专注和多步骤的复杂任务,如软件开发和复杂数据分析。Claude Sonnet 4 则作为 Sonnet 3.7 的升级版,提供更高的指令遵循性和编码能力。这两款模型现已在 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 上线,供开发者和企业使用。

🔗 官方网站:https://www.anthropic.com/news/claude-4

6687920c81d4b53ef38a78565ad0221
  • 纯直连方法(需要网络工具)
04e1ebe91f1f08fc78a3b93665497cb image-20250523201346774
  • 借助聚合API和中转代理,无网络门槛接入接入Gemini&Claude

  此外,伴随着模型应用需求不断扩大,很多中转和聚合平台各项功能也逐渐完善,并能承担起应用和开发的功能。本期公开课,就为大家详细介绍如何借助聚合API和中专代理,零门槛接入Gemini 2.5与Claude 4大模型。

  • 课件领取:
104150cccbefc135f401007257c939e

2.API聚合平台账号注册与OpenAI风格API调用

  接下来继续介绍API聚合平台账号注册流程。这里首先要注意,我们选取API聚合平台的要求如下:

  1. 更新速度方面,能够第一时间上线最新的模型,如最近的Gemini 2.5 Pro模型和Claude 4模型等;
  2. 国内没有网络门槛即可访问,且拥有单账号最高的RateLimit
  3. 能够一个账号/API-KEY调用多个模型,避免调用不同模型时来回切换API-KEY和Base-URL;
  4. 能够清楚检测每个API-KEY各模型token及费用消耗情况;
  5. 能够无缝使用谷歌genai或者Anthropic原版客户端进行模型调用,进而方便使用各模型客户端自带的Agent开发工具,例如网络搜索工具、代码解释器、MCP工具等;
  6. 【非开发向】能够较好的集成到一些聊天应用中,如Cherry studio或者Open-WebUI。

据此,经过一段时间的测试,我们挑选出三家能满足上述要求的模型聚合API供应商,分别是:

  • OpenRouter:全球最大的模型聚合API供应商,能提供的统一 API 接口和多模型支持,由于其用户规模较大,且各项功能维护较好,很多应用甚至会单独为OpenRouter提供API接入端口。网址:https://openrouter.ai/

    image-20250523162148189
  • DMXAPI:国内开发者创建的大模型API聚合平台,各项功能稳定,说明文档完整,非常适合国内开发者使用。网址:https://www.dmxapi.cn/

    image-20250523163640572
  • small AI:新兴的API聚合平台,同样也可以无缝接入各类主流大模型,并且价格相对便宜。网址:https://www.smallai.asia/

    image-20250523163852129

接下来我们就注意注册各平台账号,并演示不同平台账号接入Gemini和Claude模型基本流程。需要注意的是,以上三个平台中,OpenRouter自定义了一整套各类模型接入方法,其他两个平台的模型接入流程都是类似的,只需要修改API-KEY和Base-URL即可。大家在实际使用过程中任选其一即可。

2.1 OpenRouter账号注册与模型调用测试

  • OpenRouter账号注册

  来到OpenRouter主页:https://openrouter.ai/ ,点击注册:

image-20250523164213266

可以选择GitHub账号、谷歌账号或者任意自选邮箱进行注册:

image-20250523164232269
  • OpenRouterAPI-KEY创建流程

然后即可点击Credits进行充值:

image-20250523165147651

点击Add Credits,可选择各类信用卡进行充值:

image-20250523165233620

然后点击创建API-KEY即可:

image-20250523165310040
  • OpenRouter网站功能介绍
Video("https://ml2022.oss-cn-hangzhou.aliyuncs.com/2025-05-23%2016-49-11.mp4", width=800, height=400)
  • OpenRouter API-KEY调用测试

  紧接着,我们测试下刚才创建的OpenRouter API-KEY能否顺利调用Gemini 2.5 Pro模型和Claude 4模型。OpenRouter默认使用OpenAI风格API进行调用,我们可以运行如下代码进行测试:

import os
from dotenv import load_dotenv
load_dotenv(override=True)
from openai import OpenAI
# OpenRouter Gemini 2.5调用测试
or_client = OpenAI(
base_url="https://openrouter.ai/api/v1",
api_key=os.getenv("OR_API_KEY"),
)

or_completion = or_client.chat.completions.create(
model="google/gemini-2.5-flash-preview-05-20",
messages=[
{
"role": "user",
"content": [
{
"type": "text",
"text": "你好,好久不见,请介绍下你自己。"
}
]
}
]
)
print(or_completion.choices[0].message.content)
# OpenRouter Claude 4模型调用测试
or_client = OpenAI(
base_url="https://openrouter.ai/api/v1",
api_key=os.getenv("OR_API_KEY"),
)

or_completion = or_client.chat.completions.create(
model="anthropic/claude-opus-4",
messages=[
{
"role": "user",
"content": [
{
"type": "text",
"text": "你好,好久不见,请介绍下你自己。"
}
]
}
]
)
print(or_completion.choices[0].message.content)

能发现可以顺利进行调用。

而对话结束后,即可在OpenRouter官网上查看扣费情况,本次花费约2美分不到: image-20250523170228405

2.2 DMXAPI账号注册与模型调用测试

  • DMXAPI账号注册流程

  接下来继续测试DMXAPI账号注册与API调用流程。同样我们在DMX官网:https://www.dmxapi.cn/ ,点击进行注册:

image-20250523170420788 image-20250523170500261

然后即可在价格页面查看所需要的模型及其相应的定价:

image-20250523170758769

并且可以在教程页面看到DMXAPI各类模型采用OpenAI风格API进行调用的方法:

image-20250523170848457

此外,DMXAPI还提供了非常便捷的开票通道,对企业用户非常友好:

image-20250523170854807
  • DMXAPI API-KEY注册流程

  同样的,我们可以在工作台中进行余额充值:

image-20250523171345325

然后可以在工作台主页进行DMXAPI的API-KEY创建:

image-20250523171116460

并可以在使用日志中看到每一次模型调用的情况及计费:

image-20250523171202134
  • DMXAPI网站介绍
Video("https://ml2022.oss-cn-hangzhou.aliyuncs.com/2025-05-23%2017-06-15.mp4", width=800, height=400)
  • DMXAPI API-KEY调用测试

紧接着,我们尝试使用DMXAPI的API-KEY进行模型调用:

# DMXAPI Gemini 2.5调用测试
dmx_client = OpenAI(
base_url="https://www.dmxapi.cn/v1",
api_key=os.getenv("DMX_API_KEY"),
)

dmx_completion = dmx_client.chat.completions.create(
model="gemini-2.5-flash-preview-04-17",
messages=[
{
"role": "user",
"content": [
{
"type": "text",
"text": "你好,好久不见,请介绍下你自己。"
}
]
}
]
)
print(dmx_completion.choices[0].message.content)
# OpenRouter Claude 4模型调用测试
dmx_client = OpenAI(
base_url="https://www.dmxapi.cn/v1",
api_key=os.getenv("DMX_API_KEY"),
)

dmx_completion = dmx_client.chat.completions.create(
model="claude-opus-4-20250514",
messages=[
{
"role": "user",
"content": [
{
"type": "text",
"text": "你好,好久不见,请介绍下你自己。"
}
]
}
]
)
print(dmx_completion.choices[0].message.content)

能够看到,两款模型都能顺利调用。但DMXAPI的模型实时更新速度不如OpenRouter,目前只更新了Claude 4,并未更新Gemini 2.5 flash 0520模型API。

2.3 smallAI API-KEY获取与模型调用测试

  • smallAI API-KEY获取流程

  最后,让我们来介绍smallAI的注册和使用流程。和DMXAPI类似,smallAI也是国内开发团队创建的,一款更加轻量级的模型聚合平台。我们可以登录管smallAI官网:https://www.smallai.asia/shop

image-20250523171901701

直接下滑选择一款模型套餐进行购买即可:

image-20250523172023347 image-20250523172057430

完成购买后即可在邮箱中收到API-KEY:

image-20250523172353378
  • smallAI API额度查询

  而由于smallAI并不需要账号注册,因此若要进行额度查询,我们可以在https://token.ai99.asia/ 网页中,输入API-KEY进行查询:

image-20250523172534638
  • smallAI 可调用的模型查询

  同时,我们可以在https://smallai-pro.feishu.cn/base/PpzVb1Zega9HPJsMHVtczS7Nnah?table=blkakovWSuKyyfC4 中查看目前smallAI可调用的大模型:

image-20250523173004747

能够看到,目前smallAI已经集成了Claude 4模型、以及部分Gemini 2.5模型。

  • smallAI API-KEY调用流程

  同样,这里我们继续进行smallAI的API-KEY调用测试:

# smallAI Gemini 2.5调用测试
sai_client = OpenAI(
base_url="https://ai98.vip/v1",
api_key=os.getenv("SAI_API_KEY"),
)

sai_completion = sai_client.chat.completions.create(
model="gemini-2.5-pro-preview-05-06",
messages=[
{
"role": "user",
"content": [
{
"type": "text",
"text": "你好,好久不见,请介绍下你自己。"
}
]
}
]
)
print(sai_completion.choices[0].message.content)
# smallAI Claude 4模型调用测试
sai_client = OpenAI(
base_url="https://ai98.vip/v1",
api_key=os.getenv("SAI_API_KEY"),
)

sai_completion = sai_client.chat.completions.create(
model="claude-opus-4-20250514",
messages=[
{
"role": "user",
"content": [
{
"type": "text",
"text": "你好,好久不见,请介绍下你自己。"
}
]
}
]
)
print(sai_completion.choices[0].message.content)

3.Gemini 2.5、Claude 4模型接入Cursor

  既然我们可以借助聚合API来进行OpenAI风格的Gemini 2.5和Claude 4模型调用,那就可以无缝一站式将模型接入Cursor、clien等编程工具。这里我们以Cursor为例进行演示,如何通过使用聚合API来调用Gemini 2.5、Claude 4模型。

需要注意的是,哪怕不使用聚合API,如果开通了Cursor的付费服务,也是可以直接调用Cursor内置的Claude 4模型的: image-20250523181023614

整个设置过程也并不复杂,我们只需要整理好三个聚合平台的API-KEY、Base-URL和模型名称即可。具体汇总结果如下:

平台名Base URLGemini 2.5模型名称Claude 4模型名称
✅ OpenRouter"https://openrouter.ai/api/v1"google/gemini-2.5-flash-preview-05-20anthropic/claude-opus-4
✅ DMXAPI"https://www.dmxapi.cn/v1"gemini-2.5-flash-preview-04-17claude-opus-4-20250514
✅ Small AI"https://ai98.vip/v1"gemini-2.5-pro-preview-05-06claude-opus-4-20250514

这里我们以OpenRouter API调用google/gemini-2.5-flash-preview-05-20模型,以及Small AI调用claude-opus-4-20250514 为例进行演示,其他不同聚合API接入不同模型也是类似。

  • OpenRouter API接入gemini-2.5-flash模型

首先创建并勾选google/gemini-2.5-flash-preview-05-20模型:

然后输入OpenRouter的API-KEY和Base URL:

image-20250523182351632

然后即可测试进行对话:

image-20250523182512791

注,如果需要激活多个模型,需要再创建多个模型名称即可。

  • Small AI接入claude-opus-4-20250514模型

  紧接着,我们再测试使用Small AI的API-KEY,在Cursor中接入claude-opus-4-20250514模型。这里还是一样的,首先我们需要创建一个claude-opus-4-20250514模型:

image-20250523182639799 image-20250523182657965

然后输入smallAI的API-KEY和Base URL,并启用:

image-20250523182826136

然后即可测试进行对话了:

image-20250523182920242

同理,如果要接入更多的大模型,在创建模型页面创建更多模型即可。

4.Gemini 2.5、Claude 4模型接入本地聊天机器人

  而当我们完成了各类聚合网站的API注册后,作为最基础的应用场景,我们还可以通过这些API,将Gemini 2.5、Claude 4等模型先接入本地聊天机器人,如接入ChatBox、Cherry Studio或者Open-WebUI等。由于各类聚合平台对各类大模型调用流程都类似,因此这里以Cherry Studio+DMXAPI调用Claude 4模型、以及Open-WebUI+OpenRouter调用google/gemini-2.5-flash-preview-05-20模型为例进行演示。

  • Cherry Studio借助DMXAPI调用Claude 4模型
image-20250523184923527

🍒 Cherry Studio 简介

Cherry Studio 是一款专为本地部署的大语言模型(LLM)设计的跨平台开发环境,目标是打造类似于 Visual Studio Code 的多模型 AI 助手 IDE。它将模型调用、本地缓存、上下文管理、插件扩展等功能高度整合,帮助用户以图形化方式便捷构建、测试和运行大模型应用。

Cherry Studio 支持一键加载如 ChatGLM、Qwen、LLaMA、Baichuan、DeepSeek 等本地模型,并通过“对话卡片”与“记忆管理”系统,提升人机交互效率,适合研发者、AI 创作者、教育工作者使用。

  • 🔧 支持多后端(包括 Ollama、LMDeploy、FastChat、OpenAI 代理等)
  • 🌐 支持多模型并行调用、上下文跨模型共享
  • 🧩 插件机制灵活,可接入浏览器、RAG、Python 执行器等
  • 🖥 Windows / macOS / Linux 三平台通用

🔗 官网地址:https://github.com/CherryHQ/cherry-studio

而在Cherry Studio中,我们能够非常便捷的接入DMXAPI,我们只需要输入DMXAPI的密钥:

image-20250523183835576 image-20250523183927615

然后点击管理模型:

image-20250523184034783

然后选择claude4:

image-20250523184118311

最后,即可在对话页面调用Claude4模型了:

同时,Cherry Studio也是MCP客户端,可以无缝接入MCP服务器,这里我们可以选择一个查询天气的Stdio服务器:

然后进行对话测试:

image-20250523184546716 image-20250523184611806
  • Open-WebUI借助OpenRouter调用Gemini 2.5模型流程
image-20250523184824647

🌐 Open-WebUI 简介

Open-WebUI 是一个开源的 Web 用户界面平台,专为本地大语言模型(如 Ollama、LM Studio)设计,目标是提供一个简洁现代、用户友好的界面来进行 LLM 对话、插件扩展、上下文检索(RAG)等操作。

Open-WebUI 类似于 ChatGPT 的浏览器体验,但它是完全本地运行的,不依赖云端,强调隐私、安全与自由。用户可以轻松使用 Chat、Code、Search 等工具,同时还能自定义模型路径、管理历史对话和知识库。

  • 🧠 支持与 Ollama 深度集成(如 llama3、mistral)
  • 🧩 可扩展工具插件:浏览器搜索、文件问答、代码执行等
  • 👥 多用户支持、支持 API Key 管理与权限设置
  • 📦 部署方便,支持 Docker、一键本地启动

🔗 官网地址:https://github.com/open-webui/open-webui

Open-WebUI的安装过程非常简单,只需要使用pip工具即可安装: FENCE0 安装完成后,输入serve命令即可开启Open-WebUI: FENCE1

打开Open-WebUI后,即可在左下角点击管理员面板,点击设置:

image-20250523185138243

并在外部连接中输入openrouter的base url,以及API-KEY,并点击保存:

image-20250523185310329

然后回到对话页面,找到Gemini 2.5 flash模型并进行对话即可:

image-20250523185335135 image-20250523185413659

同时,我们也可以使用Open-WebUI自带的代码解释器功能,进行简单的编程测试:

image-20250523185925143

5.Gemini 2.5、Claude 4 API进阶调用方法介绍

import os
from dotenv import load_dotenv
load_dotenv(override=True)
from openai import OpenAI

  最后,我们讨论一些进阶内容,关于如何在开发环境中调用聚合API中的Gemini模型和Claude模型API,来完成开发任务。不同于简单的对话聊天,在实际围绕大模型进行Agent开发时,往往需要用到模型的很多进阶功能,如多模态能力、思考能力等,甚至有些模型的默认API工具,还自带了例如网络搜索、连接MCP工具等能力,因此作为开发者,在选择聚合API进行开发时,务必需要先验证聚合API是否具备相同的能力,才能更好的判断模型价值。

5.1 Gemini 2.5聚合API调用流程

  此前我们已经尝试使用各类聚合API调用了Gemini模型,这里继续测试Gemini API的进阶功能。

image-20250523192158057
from openai import OpenAI

client = OpenAI(
base_url="https://openrouter.ai/api/v1",
api_key=os.getenv("OR_API_KEY"),
)

completion = client.chat.completions.create(
model="google/gemini-2.5-flash-preview-05-20",
messages=[
{
"role": "user",
"content": [
{
"type": "text",
"text": "请帮我详细描述这张图片上的内容"
},
{
"type": "image_url",
"image_url": {
"url": "https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/image-20250523192158057.png"
}
}
]
}
]
)
print(completion.choices[0].message.content)

而其他聚合API也可以完整实现类似功能:

平台名Base URLGemini 2.5模型名称Claude 4模型名称
✅ OpenRouter"https://openrouter.ai/api/v1"google/gemini-2.5-flash-preview-05-20anthropic/claude-opus-4
✅ DMXAPI"https://www.dmxapi.cn/v1"gemini-2.5-flash-preview-04-17claude-opus-4-20250514
✅ Small AI"https://ai98.vip/v1"gemini-2.5-pro-preview-05-06claude-opus-4-20250514

例如DMXAPI:

client = OpenAI(
base_url="https://www.dmxapi.cn/v1",
api_key=os.getenv("DMX_API_KEY"),
)

completion = client.chat.completions.create(
model="gemini-2.5-flash-preview-04-17",
messages=[
{
"role": "user",
"content": [
{
"type": "text",
"text": "请帮我详细描述这张图片上的内容"
},
{
"type": "image_url",
"image_url": {
"url": "https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/image-20250523192158057.png"
}
}
]
}
]
)
print(completion.choices[0].message.content)

以及smallAI实现流程如下:

client = OpenAI(
base_url="https://ai98.vip/v1",
api_key=os.getenv("SAI_API_KEY"),
)

completion = client.chat.completions.create(
model="gemini-2.5-pro-preview-05-06",
messages=[
{
"role": "user",
"content": [
{
"type": "text",
"text": "请帮我详细描述这张图片上的内容"
},
{
"type": "image_url",
"image_url": {
"url": "https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/image-20250523192158057.png"
}
}
]
}
]
)
print(completion.choices[0].message.content)

5.2 Claude 4聚合API调用流程

  接下来我们继续尝试调用聚合API来调用Claude 4 API。这里需要注意的是,OpenRouter核心功能只支持OpenAI风格API进行调用,而DMX和smallAI,则可以通过设置BaseURL来直接接入Anthropic API,从而拓展底层API模型能力。

  • OpenRouter Claude 4多模态功能测试
client = OpenAI(
base_url="https://openrouter.ai/api/v1",
api_key=os.getenv("OR_API_KEY"),
)

completion = client.chat.completions.create(
model="anthropic/claude-sonnet-4",
messages=[
{
"role": "user",
"content": [
{
"type": "text",
"text": "请帮我详细描述这张图片上的内容"
},
{
"type": "image_url",
"image_url": {
"url": "https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/image-20250523192158057.png"
}
}
]
}
]
)
print(completion.choices[0].message.content)

其他模型API也均可实现。

  • DMX、smallAI接入Anthropic API

Claude API使用说明:https://docs.anthropic.com/en/docs/get-started image-20250523190535927

!pip install anthropic
import anthropic
anthropic.Anthropic?

接下来无论是调用Gemini还是Claude模型,我们都需要注意设置API-KEY和Base_URL。

核心参数解释如下:

参数名中文含义说明
api_keyAPI 密钥Claude 的访问密钥。若未提供,将从环境变量 ANTHROPIC_API_KEY 中自动读取。
auth_token授权令牌(可选)用于某些企业环境下的身份验证(少用)。默认从 ANTHROPIC_AUTH_TOKEN 读取。
base_urlAPI 基础地址(可选)默认指向 Anthropic 官方 API,可自定义用于代理或私有部署。
timeout请求超时设置(秒)单次请求最大允许的等待时间,可为浮点数或 httpx.Timeout 对象。
max_retries最大重试次数当请求失败时自动重试的最大次数,默认是 2 次。
default_headers默认请求头可用于添加自定义 HTTP 头(如 User-Agent、Trace-ID)。
default_query默认 URL 查询参数添加在每次 API 调用中的默认 query 参数。
http_client自定义 http 客户端对象如果你使用自定义的 httpx.Client,可通过这里传入;否则 SDK 会自己创建一个。
_strict_response_validation严格响应校验(内部参数)是否强制验证返回数据格式,开发者一般无需使用。

接下来测试进行调用

平台名Base URLGemini 2.5模型名称Claude 4模型名称
✅ OpenRouter"https://openrouter.ai/api/v1"google/gemini-2.5-flash-preview-05-20anthropic/claude-opus-4
✅ DMXAPI"https://www.dmxapi.cn/v1"gemini-2.5-flash-preview-04-17claude-opus-4-20250514
✅ Small AI"https://ai98.vip/v1"gemini-2.5-pro-preview-05-06claude-opus-4-20250514
client = anthropic.Anthropic(
api_key=os.getenv("DMX_API_KEY"),
base_url="https://www.dmxapi.cn"
)
message = client.messages.create(
model="claude-opus-4-20250514",
max_tokens=1000,
temperature=1,
system="You are a world-class poet. Respond only with short poems.",
messages=[
{
"role": "user",
"content": [
{
"type": "text",
"text": "Why is the ocean salty?"
}
]
}
]
)
print(message.content)

远古风暴洒下的泪, 化作江河载矿归; 洗去岩石与大地的盐, 晶体沉积,一粒粒如沙般沉淀。

清雨归来依旧纯净清澈, 而盐分却年复一年地残留; 在辽阔而咸涩的海洋深处, 这些矿物,恒久长存不朽。

而smallAI也可以接入:

client = anthropic.Anthropic(
api_key=os.getenv("SAI_API_KEY"),
base_url="https://ai98.vip"
)
message = client.messages.create(
model="claude-opus-4-20250514",
max_tokens=1000,
temperature=1,
system="You are a world-class poet. Respond only with short poems.",
messages=[
{
"role": "user",
"content": [
{
"type": "text",
"text": "Why is the ocean salty?"
}
]
}
]
)
print(message.content)

但OpenRouter无法直接按照这种中转的方式进行接入,而这就会使得DMXAPI和smallAPI能够更加深度的接入Anthropic的技术开发生态中,相比之下OpenRouter则需要借助LiteLLm才能完成相同的功能。

client = anthropic.Anthropic(
api_key=os.getenv("SAI_API_KEY"),
base_url="https://ai98.vip"
)
response = client.messages.create(
model="claude-sonnet-4-20250514",
max_tokens=16000,
thinking={
"type": "enabled",
"budget_tokens": 10000
},
messages=[{
"role": "user",
"content": "请证明根号2是无理数"
}]
)
response.content
client = anthropic.Anthropic(
api_key=os.getenv("DMX_API_KEY"),
base_url="https://www.dmxapi.cn"
)
message = client.messages.create(
model="claude-sonnet-4-20250514",
max_tokens=16000,
thinking={
"type": "enabled",
"budget_tokens": 10000
},
messages=[{
"role": "user",
"content": "Are there an infinite number of prime numbers such that n mod 4 == 3?"
}]
)
print(message.content)

是否存在无限多个形如 4 𝑛

3 4n+3 的质数?

message