【CSDN 编者按】在 AI 大模型领域,“工业落地难”一直是个老生常谈的话题。核心挑战往往不在于模型的能力,而在于工业场景对数据隐私的极度敏感以及对物理常识的严苛要求。
本文介绍的 MachinaCheck 提供了一个极佳的范式:它没有盲目追求“大模型万能论”,而是采取了“确定性逻辑+智能分析”的分层架构,并利用 AMD MI300X 的高性能算力,在工厂本地完成了从 CAD 解析到生产建议的全链路闭环。
原文链接:https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/machinacheck
作者 |Syed Muhammad Sarmad
责编 | 梦依丹
出品 | CSDN(ID:CSDNnews)
走进一家传统的 CNC 加工车间,你会发现“人工读图”依然是决定生产效率的隐形天花板。
“经理拿着打印图纸,在车间反复走动核对库存与公差,每张图纸的评估耗时高达 1 小时。”
对于一家繁忙的工厂而言,每周数十次的询价意味着数百个小时的工时被困在这些重复性的可行性分析中。
因为依赖人工经验,难免会出现“接单后才发现刀具缺位”或“设备精度撑不住核心指标”的尴尬。这不仅导致零件报废、工时白费,更严重的是,这类盲目接单正在不断透支客户的信任与企业的利润。
MachinaCheck 如何用算力守住制造业的“核心机密”
多智能体系统 MachinaCheck 通过上传 STEP 格式 CAD 文件,并输入材料与公差需求,系统能在 30 秒内给出一份精准的“生产诊断书”。它不仅能告诉你“能不能做”,还会列出工具缺项与优化建议,从此告别盲猜。
MachinaCheck 相关链接:
HF Space:huggingface.co/spaces/lablab-ai-amd-developer-hackathon/MachinaCheck
GitHub:github.com/SyedMuhammadSarmad/Manufacturing-Agent
在高端制造业中,STEP 文件往往包含企业数年研发积累的几何专利信息,每一处孔位、每一个型腔设计都是价值连城的知识产权。将这些敏感数据发送给公有云端的 AI 接口(如 OpenAI 等),在严苛的保密协议下是绝对红线。
AMD Instinct MI300X 的出现彻底打破了这种制约。凭借其超大的 192GB HBM3 显存与惊人的带宽,能够将 Qwen 2.5 7B 这种高性能模型完全部署在工厂的本地服务器上。
数据无需离厂,计算在本地完成,确保了客户的核心知识产权“足不出户”。
这才是制造业真正需要的“隐私即设计”——它不仅仅是一纸空文的承诺,而是通过底层架构决策,让 AI 真正能够走进对安全极其敏感的工业客户的核心产线中。
加入 AMD AI 开发者计划,免费领 50 小时云算力券
进群月月抽显卡、AIPC,好运不停!
Agent 架构:严谨的“五级流水线”设计
MachinaCheck 的“大脑”是一套基于 LangChain 开发、通过 FastAPI 驱动的五级流水线架构。为了确保决策的绝对可靠,我们摒弃了“幻觉”风险,采用了分层处理策略。
组件 1:STEP 文件解析器,坚持“数学算术”
在解析 CAD 核心数据时,他们没有使用传统的视觉识别或 OCR 技术,而是引入了基于 OpenCASCADE 内核的 Python 库 cadquery。
简单来说,它的工作方式是:
数学级读取:系统直接拆解文件的底层几何参数,而非通过图片去“猜”形状;
毫厘不差的提取:无论是孔的直径与深度、平面的面积,还是倒角、圆角及整体包围盒尺寸,数据完全从数学模型中提取,准确率 100%。
为什么坚持这么做?
因为工业制造容不得“近似值”。如果是 Ø6.0mm 的孔,系统给出的输出就是标准的 Ø6.0mm,绝不会因为 OCR 的细微偏差或像素抖动而导致加工精度失准。通过将“数学硬核”与“智能分析”剥离,保证了系统输出的第一手数据就是零误差的基石。
def extract_features(step_file_path: str) -> dict: model = cq.importers.importStep(step_file_path) shape = model.val() bb = shape.BoundingBox() holes = {} for face in model.faces().vals(): adaptor = BRepAdaptor_Surface(face.wrapped) if adaptor.GetType() == GeomAbs_Cylinder: radius = adaptor.Cylinder().Radius() diameter = round(radius * 2, 3) holes[diameter] = holes.get(diameter, 0) + 1 return { "bounding_box_mm": {"length": round(bb.xlen, 3), ...}, "holes": [...], "flat_surfaces_count": len(flat_surfaces), }Agent 1——工艺分类器(Qwen 2.75B)
当 CAD 文件被解析成一堆数学数据后,剩下的工作就交给了驻扎在 AMD MI300X 上的 Qwen 2.5 7B 模型。
AI 的任务很明确:
它不仅仅是“看图”,而是要结合材料学知识与加工工艺,回答一个核心问题:“造这个零件,到底需要什么样的设备和刀具?”
懂行,才是真正的工业 AI:
材料匹配:它知道 304 不锈钢硬度高,必须配套硬质合金刀具,否则就是“废刀”;
工艺避坑:它能识别出圆柱孔用钻头更高效,而不是瞎用立铣刀;
精度把控:当公差要求达到 ±0.005mm 时,它会直接判定标准铣床无法达标,必须调度精密加工设备。
这就像是一个经验老道的老师傅坐镇后台,在零件生产前,就已经预判了所有的工艺雷区。
Agent 2——库存管家,拒绝一切花哨的幻觉
该智能体不使用 LLM,也是 MachinaCheck 项目中极具工程哲学的一环。
坚守确定性:刀具库存查询不需要大模型去“思考”,只需要实打实的数据库匹配;
极致效率:直接通过 Python 进行确定性的查询与对比。
因为在大模型处理数据库查询时,往往会带来不必要的计算延迟,甚至可能产生错误的“幻觉”。在这里,代码的逻辑远比 AI 的概率计算更可靠。
Agent 3——可行性决策(Qwen 2.75B)
当前面的零件几何数据、工艺需求以及库存匹配结果全部到位后,所有的信息再次汇聚到 Qwen 2.5 7B 手中。
综合推理:它不再关注局部,而是从上帝视角对整个项目进行评估;
结构化输出:它会把复杂的分析过程“压缩”成一份清晰、可执行的决策文档,直接告诉经理:这单能接吗?如果不能,缺哪个刀具?哪个精度要求超标了?
{ "decision": "CONDITIONAL", "confidence": "HIGH", "reason": "All tools available except M10x1.5 tap", "action_items": ["Purchase M10x1.5 tap ($15)"], "risk_flags": ["Verify spindle speed for Steel 304"], "estimated_setup_hours": 2.5}Agent 4——报告生成器(Qwen 2.5 7B)
如果前面的 Agent 是负责“干活”的工程师,那这最后一个 Agent 就是负责“做总结”的生产经理。
全盘整合:它将复杂的几何分析、工艺拆解、库存匹配结果进行统一梳理;
一站式结论:它输出的不是零碎的数据点,而是一份专业的可制造性分析报告——从执行摘要到机床适配度,从刀具缺失清单到最后的“接单建议”。
至此,MachinaCheck 的五级流水线设计已全盘呈现。回顾这套方案,大家能清晰地看到一个严谨的工业逻辑:
感知层(解析):由 cadquery 负责,追求 100% 的数学精确;
认知层(工艺分析):由大模型赋予制造常识,模拟老师傅的经验;
业务层(库存匹配):由纯 Python 逻辑控制,保证数据处理的零延迟与零幻觉;
决策层(可行性判定):综合推理,给出全局判断;
交付层(报告生成):将数据转化为直观的决策建议。
这种架构的核心哲学只有一句话:能用规则解决的,绝不使用 AI,必须用 AI 的地方,才引入大模型。
相较于通用的 GPT 模型,MachinaCheck 的真正护城河在于它被注入了“制造业常识”。
它不仅仅是一个能聊天的 AI,而是一个深度嵌入车间工作流、懂得工程限制、并严格遵循物理规律的工业专家。这种“物理常识与深度算力”的完美结合,正是
工业大模型落地场景中的精髓所在。
硬核实战:在 AMD MI300X 上跑通 AI,只需一步
对于开发者而言,最头疼的往往是复杂的算力适配与环境部署,但在这次项目中,基于 AMD 的技术栈让他们体验到了“丝滑”的部署感。
生态无缝衔接:通过 ROCm 软件平台配合 vLLM 推理框架,成功在 MI300X 上部署了 Qwen 2.5 7B 模型;
开箱即用:不需要繁琐的环境配置,直接使用 AMD 开发者云提供的 vLLM 快速启动镜像,所有的依赖和配置项都已经预装妥当。
python -m vllm.entrypoints.openai.api_server \ --model Qwen/Qwen2.5-7B-Instruct \ --host 0.0.0.0 \ --port 8000 \ --dtype float16 \ --gpu-memory-utilization 0.5通过设定 gpu-memory-utilization 0.5,系统仅占用 192GB 显存中的 96GB,在保证高性能的同时留足了系统余量。
实测显示,智能体调用平均延迟不到 3 秒,几乎感受不到等待。
借助 vLLM 提供的 OpenAI 兼容接口,LangChain 的集成过程如丝般顺滑。只需要几行代码,即可调用本地部署的 Qwen 大模型,让复杂的工业逻辑实现“一键即达”。
from langchain_community.llms import VLLMOpenAIllm = VLLMOpenAI( openai_api_base="http://localhost:8000/v1", openai_api_key="EMPTY", model_name="Qwen/Qwen2.5-7B-Instruct", temperature=0.1, max_tokens=1000)成绩
选取了 GrabCAD 上的真实零件模型进行“压力测试”,结果非常亮眼:
特征解析仅需不到 1 秒;
从接收图纸到给出最终评估,整套流程仅耗时 25 到 40 秒,相比人工的 1 小时,效率提升了一个数量级;
在所有的测试零件上,系统对“可制造性”的判定均完全准确,表现出远超预期的逻辑判断力;
在整个处理链条中,对外传输的原始几何数据为零字节,彻底守住了企业的核心知识产权底线。
MachinaCheck 由 Syed Muhammad Sarmad 与 Sabari Doss R 在 2026 年 5 月的 AMD 开发者黑客松中联合开发完成。
推荐阅读:
人均奖金达610万?SK海力士回应;微信灰度测试转账「组合支付」;黄仁勋:应届生们别怕AI,当下是开启事业的最佳时机 | 极客头条
AI 隐藏“思维链”,是怕被人类监督污染!OpenAI首席科学家访谈:驾驭工程会越来越通用
“今年还没亲手写过一行代码”,Claude Code之父自曝:CC诞生源于“偶然”,现主要在手机上干活
加入AMD AI 开发者计划与全球极客共筑开源
加入即领 50 小时免费云算力
进群抽显卡、AIPC,好运不停
活动与工作坊,早鸟名额优先锁定
AMD Al Academy 官方课程,加速
立即扫码加入⬇️⬇️