助睿数智 Uniplore 实验报告|订单利润分流数据加工零代码 ETL 全流程——附完整操作步骤 + 踩坑指南,新手也能一次成功
2026/5/4 19:46:26 网站建设 项目流程

一、实验背景

1. 实验目的

本次实验基于助睿数智 Uniplore 平台,完成订单利润分流数据加工,核心目标:

  • 掌握零代码 ETL 全流程(数据读取→关联→计算→过滤→导出)
  • 熟练使用表输入、记录集连接、字段选择、过滤记录、Excel 输出等组件
  • 理解多表关联、利润计算、数据分流的业务逻辑
  • 按教程要求,实现盈利 / 亏损订单分流,并导出对应结果文件

2. 实验环境

  • 平台全称:助睿数智(Uniplore)一站式数据科学实验平台
  • 平台官网:https://www.uniplore.com/
  • 实验地址:https://lab.guilian.cn/
  • 数据源:MySQL 业务库business_anaylsis下两张表
    • 订单表:order_detail(含订单号、商品 ID、单价、数量)
    • 产品表:product(含商品 ID、成本价)
  • 实现方式:零代码可视化拖拽 ETL

3. 整体处理流程

数据读取(订单表 + 产品表)→多表关联→利润字段计算→按利润正负过滤分流→导出盈利订单 / 亏损订单两份 Excel 文件。

二、实验步骤

步骤 1:新建数据转换

  • 操作说明:登录 Uniplore 平台,进入「数据集成」模块,新建一个空白转换,命名为「订单利润分流数据加工」(图中为实验一)。
  • 配置要点:转换命名要清晰,方便后续查找和执行。

步骤 2:添加并配置表输入组件(读取订单数据)

  • 操作说明:从组件库拖入「表输入」组件,配置订单表数据源,编写 SQL 查询语句读取订单数据。
  • 配置要点
    • 测试数据库连接,确保连通性正常
    • SQL 语句示例:SELECT order_id, product_id, unit_price, quantity FROM business_anaylsis.order_detail;

步骤 3:添加并配置表输入组件(读取产品数据)

  • 操作说明:再拖入一个「表输入」组件,配置产品表数据源,读取商品成本信息。
  • 配置要点
    • 同样测试连接,确保数据能正常读取
    • SQL 语句示例:SELECT product_id, cost_price FROM business_anaylsis.product;

步骤 4:添加并配置记录集连接组件(多表关联)

  • 操作说明:拖入「记录集连接」组件,将两个表输入组件的数据进行内连接,关联字段为product_id
  • 配置要点
    • 保留字段:product_id,id
    • 连接类型选择「LEFT OUTER」,保留所有订单记录
    • 确认关联字段的数据类型一致,避免关联失败

步骤 5:添加并配置字段选择组件(字段筛选 + 利润计算)

  • 操作说明:拖入「字段选择」组件,保留需要的字段,并新增计算字段「profit」,计算每条订单的利润。
  • 配置要点
    • 保留字段:id
    • 利润计算公式:profit = (unit_price - cost_price) * quantity
    • 检查计算字段的数据类型,确保为数值型

步骤 6:添加并配置过滤记录组件(利润分流)

  • 操作说明:拖入「过滤记录」组件,按利润正负设置分流条件,将数据分为盈利订单和亏损订单两类。
  • 配置要点
    • 盈利订单:profit > 0
    • 亏损订单:profit <= 0
    • 两个分流分支分别对接一个 Excel 输出组件

步骤 7:添加并配置 Excel 输出组件(导出结果)

  • 操作说明:为每个过滤分支添加「Excel 输出」组件,配置文件路径和文件名,执行转换导出数据。
  • 配置要点
    • 文件名设置:盈利订单.xlsx亏损订单.xlsx
    • 执行转换前检查数据流连接是否正确

三、实验结果

1. 输出文件与数据结果

转换执行成功后,生成 2 个 Excel 文件:

  • 盈利订单.xlsx:包含利润 > 0 的订单数据
  • 亏损订单.xlsx:包含利润≤0 的订单数据

2. 结果验证与分析

  • 随机抽取订单数据核对:利润计算结果与公式推导结果一致,无计算错误
  • 分流结果验证:各文件数据量之和等于原始订单数据量,无重复或丢失记录
  • 字段完整性验证:导出文件包含所有需要的字段,无缺失或冗余字段

四、问题与解决

问题 1:表输入组件测试连接失败,无法读取数据

  • 问题现象:配置订单表输入时,点击「测试连接」提示连接超时 / 认证失败
  • 问题原因:数据库连接信息配置错误,或网络无法访问实验数据库
  • 解决方法
    1. 核对数据库地址、端口、用户名、密码信息,修正错误配置
    2. 切换到实验平台提供的默认数据源,确保网络正常连接
    3. 重新测试连接,成功后再继续配置 SQL 查询

问题 2:记录集连接后部分订单记录成本字段为空

  • 问题现象:左外连接后,部分订单的 cost_price 字段为 null
  • 问题原因:产品表中缺少部分商品 ID 的成本数据
  • 解决方法
    1. 检查产品表数据,确认缺失商品 ID 的成本信息
    2. 若无法补充数据,可在后续步骤中对 null 值进行处理,避免利润计算出错

问题 3:过滤记录组件分流结果为空,没有数据进入分支

  • 问题现象:执行转换后,Excel 文件为空,过滤条件不生效
  • 问题原因:利润字段的计算公式错误,或过滤条件的逻辑运算符使用错误
  • 解决方法
    1. 检查利润计算公式,确认字段名、运算符、括号都正确
    2. 先导出所有数据查看利润字段的值,再根据实际数据调整过滤条件
    3. 确认过滤条件的顺序和逻辑,避免条件冲突

五、实验总结

1. 实验收获

  • 熟练掌握了 Uniplore 平台零代码 ETL 的基本操作流程,理解了数据集成的核心逻辑
  • 学会了使用表输入、记录集连接、字段选择、过滤记录、Excel 输出等常用组件
  • 掌握了多表关联、自定义字段计算、数据过滤分流的实际业务应用方法
  • 提升了问题排查和解决能力,能独立处理数据加工过程中遇到的常见问题

2. 平台整体评价

助睿数智 Uniplore 平台的零代码可视化操作,让数据加工流程变得直观易懂,降低了 ETL 的学习门槛。平台组件丰富、配置便捷,适合数据初学者快速上手实践,同时也能满足复杂数据处理任务的需求,是一个非常不错的数据科学实验平台。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询