【AI面试临阵磨枪】ReAct 框架完整流程是什么？Reasoning → Action → Observation 如何协作？-酒店常州论坛

一、面试题目

请详细描述ReAct框架的工作流程。在实际运行中，Reasoning（推理）、Action（行动）和Observation（观察）这三个环节是如何闭环协作的？它解决了大模型在处理复杂任务时的什么痛点？

二、知识储备

1. 核心背景：为什么要用 ReAct？

在 ReAct 出现之前，大模型要么只是“空想”（思维链 CoT，容易产生幻觉），要么只是“盲动”（单纯调用工具，缺乏逻辑）。ReAct 的本质是：让模型在行动之前先“思考”，在行动之后根据“反馈”再思考，从而实现逻辑与动作的解耦。

2. 三步走协作流程

ReAct 的运行是一个Loop（循环），直到目标达成或达到最大步数：

① 第 1 步：

Reasoning (Thought) —— “谋定而后动”模型基于当前问题或上一轮的结果，生成一段自然语言描述，分析当前的处境、缺失的信息以及下一步该做什么。

作用：减少幻觉，把复杂的任务拆解成可执行的小步骤。

② 第 2 步：

Action (Act) —— “与世界交互”模型决定调用哪个工具（Tool/Function）以及输入什么参数。这通常是输出一个特定的 JSON 或函数调用指令。

作用：让模型拥有“手”，能够获取外部实时信息（如搜索、查库）。

③ 第 3 步：

Observation (Obs) —— “看反馈结果”执行工具后，将得到的结果（如搜索出的网页内容、数据库返回的数字）反馈给模型。

作用：为下一轮推理提供事实依据，将“外部知识”转化为“上下文”。

3. 代码视角（逻辑伪代码）

① 在 Python 中实现一个简单的 ReAct 循环，具体代码如下。

import asyncio async def react_agent(goal: str): # 初始化上下文：定义目标和可用工具 context = f"目标: {goal}\n可用工具: [搜索, 计算器]" while True: # 1. Reasoning + Action: 模型根据当前上下文生成“思考”和“动作” # 提示词末尾强行拼接 "Thought:" 引导模型进入 ReAct 模式 response = await llm.generate(f"{context}\nThought: ") # 检查是否达成最终目标 if "最终答案:" in response: print("任务完成！") return response # 2. 执行 Action (解析模型输出并调用工具) # 假设 parse_action 会从文本中提取出 {'tool': '...', 'query': '...'} action = parse_action(response) # 动态调用工具字典中的函数 # 例如: tools = {"搜索": search_func, "计算器": calc_func} try: observation = await tools[action['tool']](action['query']) except Exception as e: observation = f"错误: 执行工具失败 - {str(e)}" # 3. Observation: 将执行结果（观察）拼接回上下文，开启下一轮推理循环 context += f"\n{response}\nObservation: {observation}" # 打印当前轮次的状态（可选，方便调试） print(f"--- 轮次观察: {observation} ---") # 使用示例 # asyncio.run(react_agent("查询 2026 年世界杯举办地并计算场馆平均容纳人数"))

② 在 Node.js 中实现一个简单的 ReAct 循环，具体代码如下。

async function reactAgent(goal) { let context = `目标: ${goal}\n可用工具: [搜索, 计算器]`; while (true) { // 1. Reasoning + Action: 模型输出 Thought 和 Action const response = await llm.generate(context + "\nThought: "); if (response.includes("最终答案:")) return response; // 2. 执行 Action (模拟) const action = parseAction(response); // 比如 { tool: "搜索", query: "2026天气" } const result = await tools[action.tool](action.query); // 3. Observation: 将结果拼接回上下文，开启下一轮循环 context += `${response}\nObservation: ${result}`; } }

4. ReAct 的核心优势

① 可解释性：开发者可以清晰看到模型的“心路历程”，知道它为什么调用这个工具。

② 错误纠正：如果 Observation 返回了错误信息，模型可以在下一轮 Thought 中意识到错误并尝试换个方法。

三、破局之道

在回答完流程后，通过这段话展现你对 Agent 底层设计的思考：

回答 ReAct 框架，核心要理解它是在构建一套“动态决策系统”。

你可以告诉面试官：ReAct 的伟大之处不在于它调用了工具，而在于它通过Thought强制模型在向量空间中进行自洽性检查，再通过Observation引入了外部世界的真实熵。它解决了 LLM 的 “闭环幻觉” 问题。在工程落地时，ReAct 就是 Agent 的逻辑神经系统，它让 AI 从一个 “只会聊天的文本框” 变成了一个 “能解决问题的数字员工”。

企业官网建设流程全解析

一、面试题目

二、知识储备

1. 核心背景：为什么要用 ReAct？

2. 三步走协作流程

3. 代码视角（逻辑伪代码）

4. ReAct 的核心优势

三、破局之道

热门文章

文章分类

标签云

需要专业的网站建设服务？

企业官网建设流程全解析

一、面试题目

二、知识储备

1. 核心背景：为什么要用 ReAct？

2. 三步走协作流程

3. 代码视角（逻辑伪代码）

4. ReAct 的核心优势

三、破局之道

热门文章

文章分类

标签云

相关文章

ESP32-C3 利用Arduino实现UART1中断数据回显

Burst编译器1.8.2版本报错全解析：从原理到避坑指南

从台球碰撞到火箭发射：用Python模拟动量守恒定律的5个趣味案例

需要专业的网站建设服务？