一、面试题目
请详细描述ReAct框架的工作流程。在实际运行中,Reasoning(推理)、Action(行动)和Observation(观察)这三个环节是如何闭环协作的?它解决了大模型在处理复杂任务时的什么痛点?
二、知识储备
1. 核心背景:为什么要用 ReAct?
在 ReAct 出现之前,大模型要么只是“空想”(思维链 CoT,容易产生幻觉),要么只是“盲动”(单纯调用工具,缺乏逻辑)。ReAct 的本质是:让模型在行动之前先“思考”,在行动之后根据“反馈”再思考,从而实现逻辑与动作的解耦。
2. 三步走协作流程
ReAct 的运行是一个Loop(循环),直到目标达成或达到最大步数:
① 第 1 步:
Reasoning (Thought) —— “谋定而后动”模型基于当前问题或上一轮的结果,生成一段自然语言描述,分析当前的处境、缺失的信息以及下一步该做什么。
作用:减少幻觉,把复杂的任务拆解成可执行的小步骤。
② 第 2 步:
Action (Act) —— “与世界交互”模型决定调用哪个工具(Tool/Function)以及输入什么参数。这通常是输出一个特定的 JSON 或函数调用指令。
作用:让模型拥有“手”,能够获取外部实时信息(如搜索、查库)。
③ 第 3 步:
Observation (Obs) —— “看反馈结果”执行工具后,将得到的结果(如搜索出的网页内容、数据库返回的数字)反馈给模型。
作用:为下一轮推理提供事实依据,将“外部知识”转化为“上下文”。
3. 代码视角(逻辑伪代码)
① 在 Python 中实现一个简单的 ReAct 循环,具体代码如下。
import asyncio async def react_agent(goal: str): # 初始化上下文:定义目标和可用工具 context = f"目标: {goal}\n可用工具: [搜索, 计算器]" while True: # 1. Reasoning + Action: 模型根据当前上下文生成“思考”和“动作” # 提示词末尾强行拼接 "Thought:" 引导模型进入 ReAct 模式 response = await llm.generate(f"{context}\nThought: ") # 检查是否达成最终目标 if "最终答案:" in response: print("任务完成!") return response # 2. 执行 Action (解析模型输出并调用工具) # 假设 parse_action 会从文本中提取出 {'tool': '...', 'query': '...'} action = parse_action(response) # 动态调用工具字典中的函数 # 例如: tools = {"搜索": search_func, "计算器": calc_func} try: observation = await tools[action['tool']](action['query']) except Exception as e: observation = f"错误: 执行工具失败 - {str(e)}" # 3. Observation: 将执行结果(观察)拼接回上下文,开启下一轮推理循环 context += f"\n{response}\nObservation: {observation}" # 打印当前轮次的状态(可选,方便调试) print(f"--- 轮次观察: {observation} ---") # 使用示例 # asyncio.run(react_agent("查询 2026 年世界杯举办地并计算场馆平均容纳人数"))② 在 Node.js 中实现一个简单的 ReAct 循环,具体代码如下。
async function reactAgent(goal) { let context = `目标: ${goal}\n可用工具: [搜索, 计算器]`; while (true) { // 1. Reasoning + Action: 模型输出 Thought 和 Action const response = await llm.generate(context + "\nThought: "); if (response.includes("最终答案:")) return response; // 2. 执行 Action (模拟) const action = parseAction(response); // 比如 { tool: "搜索", query: "2026天气" } const result = await tools[action.tool](action.query); // 3. Observation: 将结果拼接回上下文,开启下一轮循环 context += `${response}\nObservation: ${result}`; } }4. ReAct 的核心优势
① 可解释性:开发者可以清晰看到模型的“心路历程”,知道它为什么调用这个工具。
② 错误纠正:如果 Observation 返回了错误信息,模型可以在下一轮 Thought 中意识到错误并尝试换个方法。
三、破局之道
在回答完流程后,通过这段话展现你对 Agent 底层设计的思考:
回答 ReAct 框架,核心要理解它是在构建一套“动态决策系统”。
你可以告诉面试官:ReAct 的伟大之处不在于它调用了工具,而在于它通过Thought强制模型在向量空间中进行自洽性检查,再通过Observation引入了外部世界的真实熵。它解决了 LLM 的 “闭环幻觉” 问题。在工程落地时,ReAct 就是 Agent 的逻辑神经系统,它让 AI 从一个 “只会聊天的文本框” 变成了一个 “能解决问题的数字员工”。