Text2SQL：让 Agent 自己写 SQL 自己查-酒店常州论坛

Text2SQL：让 Agent 自己写 SQL 自己查

你正在做了一个内部数据分析平台，产品经理说："我想直接问问题就能看到数据，不想写 SQL了。"你说好，然后打开数据库，看了看那二十多张表、几十个字段，心想：这事要是 AI 能做不就爽歪歪？

用户说"上个月注册用户有多少"，Agent 理解语义，自动生成一条SELECT COUNT(*) FROM users WHERE ...，执行，把结果返回给用户。全程不需要人自己写 SQL。这个流程有个专门的名字，叫Text2SQL：自然语言转 SQL。拆开来看，核心就是"翻译 + 执行"两件事。本文将实现一个最小可用的 Text2SQL Agent。

整体流程

用户用自然语言说出问题，Agent 翻译成 SQL语句，然后执行，再把结果用自然语言总结回来。

四个环节中，有两次 LLM 调用，一次数据库查询。其实就是给模型加一个"翻译工具"和一个"执行工具"，和我们之前讲的 Tool Use 机制完全一样（见笔者主页）。

整个流程可以归纳为三步：

给模型看表结构：让AI知道数据库长什么样子
模型生成 SQL：根据用户的自然语言问题，生成对应的查询语句
执行 SQL 并返回：执行查询操作，用自然语言回复用户

第一步：告诉模型表结构

模型不知道你的数据库具体有哪些表、每个表有哪些字段。所以让他生成SQL之前得先把表结构告诉它。

在 Spring AI 中，我们可以用@Tool注解把"获取表结构"注册成一个工具，让模型在需要的时候主动调用。用DatabaseMetaData从数据库连接中动态读取表结构，比手动维护一份文本靠谱得多：

@Tool(description="获取数据库表结构信息。在执行SQL查询前，应先调用此方法了解表结构，"+"以便生成正确的SQL语句。返回所有表的名称、列名、数据类型和注释。"+"可传入表名查看指定表的结构。")publicStringgetDatabaseSchema(@ToolParam(description="可选，指定要查看的表名。不传则返回所有表的结构",required=false)StringtableName){try(Connectionconn=dataSource.getConnection()){DatabaseMetaDatametaData=conn.getMetaData();StringBuildersb=newStringBuilder("=== 数据库表结构 ===\n\n");try(ResultSettables=metaData.getTables(conn.getCatalog(),conn.getSchema(),tableName!=null?tableName:"%",newString[]{"TABLE"})){booleanfound=false;while(tables.next()){found=true;StringtblName=tables.getString("TABLE_NAME");Stringremarks=tables.getString("REMARKS");sb.append("【表: ").append(tblName).append("】");if(remarks!=null&&!remarks.isBlank()){sb.append(remarks);}sb.append("\n");try(ResultSetcolumns=metaData.getColumns(conn.getCatalog(),conn.getSchema(),tblName,"%")){while(columns.next()){StringcolName=columns.getString("COLUMN_NAME");StringtypeName=columns.getString("TYPE_NAME");intcolSize=columns.getInt("COLUMN_SIZE");StringcolRemarks=columns.getString("REMARKS");Stringnullable=columns.getString("IS_NULLABLE");sb.append(" - ").append(colName).append(": ").append(typeName).append("(").append(colSize).append(")");if("NO".equals(nullable)){sb.append(" [NOT NULL]");}if(colRemarks!=null&&!colRemarks.isBlank()){sb.append(" (").append(colRemarks).append(")");}sb.append("\n");}}sb.append("\n");}if(!found){return"未找到"+(tableName!=null?"名为 '"+tableName+"' 的":"")+"表";}}returnsb.toString();}catch(Exceptione){return"获取表结构失败: "+e.getMessage();}}

模型拿到这个工具后，遇到用户提问，会先调用getDatabaseSchema了解数据库长什么样，然后再生成 SQL。这就是 Tool Use 的机制：模型输出结构化的工具调用请求，代码端负责执行。

第二步：让模型生成 SQL

有了表结构信息，模型就能根据用户的自然语言生成 SQL 了。这里的关键是：不要让模型直接回复用户，而是让它先输出 SQL，交给工具执行。

在 Spring AI 中，我们用@Tool注解注册一个executeQuery方法，并在描述里写清楚"这是执行 SQL 的工具"。模型看到工具列表后，遇到数据查询类的问题，就会自动调用它：

@Tool(description="执行SQL查询语句。仅支持SELECT只读查询，"+"不支持INSERT/UPDATE/DELETE等写操作。"+"执行前请先调用getDatabaseSchema了解表结构。")publicStringexecuteQuery(@ToolParam(description="要执行的SQL SELECT语句，如 SELECT COUNT(*) FROM users")Stringsql,@ToolParam(description="最大返回行数，默认100，最大1000",required=false)IntegermaxRows){// ... 实现见下文}

注意描述里的那句"仅支持 SELECT 只读查询"。这是安全策略，只让Agent执行查询等无风险操作。

第三步：执行 SQL 并返回结果

模型生成了 SQL，接下来就是真正连数据库执行查询。来看executeQuery的核心实现：

@Tool(description="执行SQL查询语句。仅支持SELECT只读查询，不支持INSERT/UPDATE/DELETE等写操作。")publicStringexecuteQuery(@ToolParam(description="要执行的SQL SELECT语句")Stringsql,@ToolParam(description="最大返回行数，默认100，最大1000",required=false)IntegermaxRows){// 第一步：安全校验StringvalidationError=validateSql(sql);if(validationError!=null){return"=== 查询失败 ===\nSQL: "+sql+"\n错误: "+validationError;}// 第二步：确定返回行数上限intlimit=(maxRows!=null&&maxRows>0)?Math.min(maxRows,MAX_ALLOWED_ROWS):defaultMaxRows;try(Connectionconn=dataSource.getConnection()){conn.setReadOnly(true);// 设置连接为只读try(Statementstmt=conn.createStatement()){stmt.setQueryTimeout(queryTimeoutSeconds);// 设置查询超时booleanhasResultSet=stmt.execute(sql);if(!hasResultSet){return"=== 查询完成 ===\nSQL: "+sql+"\n该语句没有返回结果集";}try(ResultSetrs=stmt.getResultSet()){ResultSetMetaDatameta=rs.getMetaData();intcolumnCount=meta.getColumnCount();// 读取数据，不超过 limit 行List<String[]>rows=newArrayList<>();introwCount=0;while(rs.next()&&rowCount<limit){String[]row=newString[columnCount];for(inti=1;i<=columnCount;i++){Objectval=rs.getObject(i);row[i-1]=val!=null?val.toString():"NULL";}rows.add(row);rowCount++;}booleantruncated=rs.next();// 判断是否还有更多数据returnformatAsTable(sql,meta,columnCount,rows,truncated);}}}catch(SQLExceptione){return"=== 查询失败 ===\nSQL: "+sql+"\n错误: "+e.getMessage();}}

查询结果返回给模型后，模型会用自然语言总结结果，回复用户。比如用户问"上个月注册了多少新用户"，模型生成 SQL 查到数字是 1523，然后回复：“上个月共有 1523 名新用户注册。”

在 Spring Boot 中注册这个工具，只需要把它交给 Spring AI 的ToolCallbackProvider：

@BeanpublicSqlToolsqlTool(DataSourcedataSource){returnnewSqlTool(dataSource,100,30);}

Spring AI 会自动扫描@Tool注解，把getDatabaseSchema和executeQuery注册为模型可用的工具。模型看到工具列表后，遇到数据查询类问题，就会按顺序调用：先调getDatabaseSchema了解表结构，再调executeQuery执行 SQL。

跑一遍看看效果。假设 users 表有实际数据，流程大概是这样的：

两轮 LLM 调用，一次数据库查询，搞定。

安全问题

讲到Text2SQL，有一个绕不开的话题：安全。

让模型生成 SQL 然后直接执行，万一模型生成了一条DROP TABLE users怎么办？或者生成了DELETE FROM orders呢？

模型虽然被 prompt 约束了"只生成 SELECT"，但 prompt 不是铁板一块。精心构造的 prompt injection 可能绕过这个限制。

所以必须在代码层面做防护，不能只靠 prompt。来看validateSql方法的四道防线：

privateStringvalidateSql(Stringsql){if(sql==null||sql.isBlank()){return"SQL 语句不能为空";}Stringnormalized=sql.strip().replaceAll(";+\\s*$","").toUpperCase();// 第一道防线：只允许 SELECT 和 WITH（CTE 查询）if(!normalized.startsWith("SELECT")&&!normalized.startsWith("WITH")){StringfirstToken=normalized.contains(" ")?normalized.substring(0,normalized.indexOf(' ')):normalized;return"安全拦截 - 仅允许 SELECT 查询，检测到禁止的操作: "+firstToken;}// 第二道防线：禁止危险关键词（用正则精确匹配单词边界）String[]forbiddenKeywords={"INSERT","UPDATE","DELETE","DROP","ALTER","CREATE","TRUNCATE","REPLACE","MERGE","GRANT","REVOKE","EXEC","EXECUTE","CALL","INTO OUTFILE","INTO DUMPFILE","LOAD_FILE","COPY","PG_READ_FILE","PG_WRITE_FILE"};for(Stringkeyword:forbiddenKeywords){Patternpattern=Pattern.compile("\\b"+keyword+"\\b");if(pattern.matcher(normalized).find()){return"安全拦截 - 检测到禁止的关键字: "+keyword;}}// 第三道防线：禁止注释（防止绕过检查）if(normalized.contains("--")||normalized.contains("/*")){return"安全拦截 - SQL 中不允许包含注释";}returnnull;// 校验通过}

再加上executeQuery里的两道执行层防线：

防线	在哪	防什么
只允许 SELECT / WITH	validateSql	阻止写操作
正则匹配危险关键词	validateSql	防止嵌套攻击，如`SELECT * FROM users; DROP TABLE users`
禁止注释符号	validateSql	防止绕过检查，如`SELECT * -- ; DROP TABLE users`
`conn.setReadOnly(true)`	executeQuery	数据库层面拒绝写操作
`stmt.setQueryTimeout()`	executeQuery	防止慢查询拖垮数据库
行数上限`MAX_ALLOWED_ROWS`	executeQuery	防止全表扫描返回百万行数据

模型的输出永远不能被完全信任，所以必须在代码层面兜底。prompt 约束是第一层，validateSql是第二层，数据库连接的readOnly是第三层。三层配合才靠谱。

小结

Text2SQL 的核心思想：把"理解问题"交给模型，把"执行查询"交给代码，两者通过 SQL 这个桥梁连接。

实现一个 Text2SQL Agent，本质上就是在 AgentLoop 的基础上注册两个工具：getDatabaseSchema和executeQuery。模型负责理解用户意图、生成 SQL，代码负责连接数据库、执行查询、安全检查。整个过程和 Agent 调用 bash 工具没有区别，模型输出工具调用请求，代码端查注册表、执行、返回结果。

唯一需要额外注意的是安全。模型的输出不能被完全信任，必须在代码层面做防护：validateSql做关键词过滤，conn.setReadOnly(true)在数据库层面拒绝写操作，setQueryTimeout防止慢查询。prompt 约束是第一层，代码检查是第二层，数据库连接限制是第三层。三层都到位了，Text2SQL Agent 才能在生产环境安心使用。

企业官网建设流程全解析