搭建完整的Agent系统：Function Calling与工具调用实战

2026/6/23 2:38:54

引言：从单次问答到自主行动的跨越

2026年，AI应用正在经历一次关键的范式转变：从"问答模式"（用户提问→模型回答）迈向"Agent模式"（用户给目标→模型自主规划、调用工具、执行任务）。

我参与的这个项目是一个企业内部的知识管理与自动化平台。需求听起来不复杂：让AI能够回答员工关于公司制度、技术文档的问题，同时能自动完成一些操作——比如查询系统数据、提交审批、发送消息等。

但真正做起来才发现，实现Agent有三个核心挑战：模型要理解工具、网关要稳定转发、成本要可控。在反复尝试后，我们选择基于玄鉴AI来完成这套系统。以下是这次实战的全过程分享。

一、为什么选择玄鉴AI来跑Agent？

在评估了几个备选平台后，我们选择玄鉴AI主要基于三个原因：

1. Function Calling兼容性
Agent的核心是模型能正确理解并调用工具函数。我们测试中发现，有些中转站虽然支持GPT的功能调用，但对Claude的工具调用支持有缺陷——返回格式不规范、Tool Call解析失败等。

玄鉴AI在协议层做了全面的标准化处理，无论是GPT的functions、Claude的tools还是DeepSeek的tool_use，都统一封装为OpenAI兼容格式。这意味着无论底层用什么模型，我们上层的Agent框架代码不需要改。

2. 模型真实性保障
Agent场景下，如果模型不是它声称的那个——比如你选择Claude Opus 4.7做推理，但实际跑的是Haiku——Agent在复杂任务链上的行为会完全不可预测。玄鉴AI的验真机制给了我们"放心用"的底气。

3. 混合模型策略
我们的Agent设计了一个"分级模型"方案：核心推理用Claude Opus 4.7，工具选择用GPT-5.2，简单对话用DeepSeek-V4 Flash。玄鉴AI统一的API接口让这套方案在代码层面只需要改model参数。

二、架构设计：一个三层Agent系统

我们的Agent系统分为三层：

用户输入 ↓ 第一层：意图路由器（GPT-5.2） - 判断用户意图类型（查询/操作/闲聊） - 分配到不同处理链路 ↓ 第二层：任务执行器（Claude Opus 4.7） - 执行多步骤复杂任务 - 通过Function Calling调用工具 ↓ 第三层：结果精炼器（DeepSeek-V4 Flash） - 格式化输出 - 补充相关信息 ↓ 返回用户

关键代码示例（基于玄鉴AI的OpenAI兼容API）：

importopenaiimportjson# 统一客户端client=openai.OpenAI(api_key="your_key",base_url="https://xuan-jian-ai.com/v1")# 定义工具tools=[{"type":"function","function":{"name":"search_knowledge_base","description":"搜索企业内部知识库","parameters":{"type":"object","properties":{"query":{"type":"string","description":"搜索关键词"},"limit":{"type":"integer","description":"返回结果数"}},"required":["query"]}}},{"type":"function","function":{"name":"create_ticket","description":"创建IT支持工单","parameters":{"type":"object","properties":{"title":{"type":"string"},"priority":{"type":"string","enum":["low","medium","high"]}},"required":["title","priority"]}}}]# Agent执行轮次defagent_loop(user_input,max_rounds=5):messages=[{"role":"user","content":user_input}]for_inrange(max_rounds):# 使用Claude Opus 4.7进行推理response=client.chat.completions.create(model="claude-opus-4-7",# 玄鉴AI上的模型名messages=messages,tools=tools,tool_choice="auto")msg=response.choices[0].messageifnotmsg.tool_calls:returnmsg.content# 最终回复# 执行工具调用messages.append(msg)fortool_callinmsg.tool_calls:func_name=tool_call.function.name func_args=json.loads(tool_call.function.arguments)# 实际执行工具result=execute_tool(func_name,func_args)messages.append({"role":"tool","tool_call_id":tool_call.id,"content":json.dumps(result)})return"Agent reached max rounds."

这段代码用最标准的OpenAI SDK格式完成了整个Agent循环。需要注意的是，玄鉴AI对Claude模型的Function Calling支持非常成熟——在测试中，Claude Opus 4.7的多步工具调用准确率达到94%以上，且未出现工具调用格式异常。

三、实战中遇到的问题与解决方法

问题1：工具调用键名不一致

现象：不同类型的模型，工具调用的返回JSON键名不同。GPT用function_call，Claude Anhtropic原生API用tool_usecontent block。

玄鉴AI的解法：它在网关层自动做了格式统一，无论底层是什么模型，返回给客户端的始终是OpenAI标准的tool_calls格式。我们不需要在Agent代码里做模型适配。

问题2：流式模式下工具调用混乱

现象：开启流式（stream=True）后，部分平台返回的工具调用信息不完整，需要在多个chunk中拼接。

玄鉴AI的解法：我们测试了几个主流平台的流式响应，玄鉴AI是其中处理最干净的——工具调用信息在一个chunk中完整返回，不需要手动拼接。

问题3：多轮函数调用时的成本爆炸

现象：Agent跑一个稍复杂的任务，可能需要3-5轮工具调用，每轮都在消耗Token。如果用Claude Opus跑所有轮次，成本很高。

玄鉴AI的解法：我们利用玄鉴AI的统一接口，实现了"混合模型"策略——推理轮次用Claude Opus 4.7，但简单的工具结果总结可以用DeepSeek-V4来做。代码里只需要改一个model参数名，接口完全兼容。

# 推理用Claude Opusresponse=client.chat.completions.create(model="claude-opus-4-7",messages=messages,tools=tools)# 后续简单总结用DeepSeek-V4response=client.chat.completions.create(model="deepseek-v4-flash",messages=messages)