Open-AutoGLM命令行运行示例，照着抄就行-酒店常州论坛

Open-AutoGLM命令行运行示例，照着抄就行

你不需要理解原理，不用查文档，不用反复试错——这篇文章就是为你准备的“开箱即用”指南。只要你的手机是安卓7.0以上、电脑能连网络、云服务器已部署好Open-AutoGLM服务端，接下来这5分钟，你就能让AI替你点开抖音、搜博主、点关注，全程自动完成。所有命令都经过实测验证，参数含义用大白话标注清楚，复制粘贴就能跑通。

1. 前提确认：三件事必须做完

在敲任何命令前，请花30秒确认以下三点是否全部满足。少一个，后面都会卡住：

云服务端已就绪：你在AutoDL或自建服务器上已成功启动autoglm-phone-9b模型服务，能通过浏览器访问http://<IP>:8800/v1返回健康状态（如{"status":"ok"}）；
手机已连通电脑：USB线连接后，在本地电脑终端执行adb devices，输出中包含一行带device状态的设备ID（例如ZY223456789 device），不是unauthorized或空；
ADB Keyboard已启用：手机「设置→语言与输入法→默认输入法」已切换为「ADB Keyboard」，这是AI向手机打字的唯一通道。

如果任一条件不满足，请先回退到对应环节配置，不要强行往下走。这不是步骤跳过的问题，而是底层通信链路是否打通的问题。

2. 本地控制端快速部署（3步搞定）

你不需要从零写代码，也不需要编译复杂依赖。Open-AutoGLM官方已把控制逻辑打包成可直接调用的Python包，我们只需拉下来、装好、验证即可。

2.1 克隆代码并安装依赖

打开本地电脑终端（Windows用CMD/PowerShell，macOS用Terminal），逐行执行：

# 创建专属工作目录，避免污染其他项目 mkdir ~/autoglm-cli && cd ~/autoglm-cli # 拉取最新控制端代码（非模型，仅指令调度部分） git clone https://github.com/zai-org/Open-AutoGLM.git cd Open-AutoGLM # 安装运行所需的基础库（含ADB通信、HTTP请求、日志等） pip install -r requirements.txt # 将本项目注册为系统级Python包，后续可全局调用main.py pip install -e .

注意：若提示pip版本过低，先执行pip install --upgrade pip；若某依赖安装失败（如pydantic冲突），加-i https://pypi.tuna.tsinghua.edu.cn/simple/指定清华源重试。

2.2 验证ADB连接是否真实可用

别信adb devices显示device就万事大吉。我们来一次真实操作测试：

# 让AI代理先帮你点亮屏幕（最基础动作） adb shell input keyevent KEYCODE_WAKEUP # 再发一条文本，看是否能输入（验证ADB Keyboard） adb shell input text "test123"

如果手机屏幕亮起，且当前焦点处（比如微信聊天框、备忘录）出现了test123字样，说明ADB通路完全畅通。如果没反应，请回头检查「手机是否启用ADB Keyboard」「USB调试是否授权」「数据线是否支持传输」。

2.3 获取设备标识符（关键！别填错）

--device-id参数不是随便写的字符串，它必须和adb devices输出的第一列完全一致：

adb devices # 输出示例： # List of devices attached # ZY223456789 device ← 这就是你要填的device-id # 192.168.1.100:5555 device ← 如果是WiFi连接，就填这一整串

USB连接 → 填ZY223456789这类字母数字组合；
WiFi连接 → 填192.168.1.100:5555这种IP+端口格式（需提前执行adb tcpip 5555）。

3. 命令行运行：5个真实可抄示例

下面所有命令，你只需替换其中两处内容：
🔹<你的设备ID>→ 替换为你自己adb devices看到的ID
🔹<云服务器IP>:<端口>→ 替换为你实际部署服务的地址（如121.43.123.56:8800）

其余部分，一字不改，复制粘贴即可运行。

3.1 示例1：打开抖音并搜索指定博主（最常用场景）

python main.py \ --device-id ZY223456789 \ --base-url http://121.43.123.56:8800/v1 \ --model "autoglm-phone-9b" \ "打开抖音搜索抖音号为：dycwo11nt61d 的博主并关注他！"

实际效果：手机自动解锁→启动抖音→点击搜索框→输入dycwo11nt61d→点击搜索结果→进入主页→点击「关注」按钮。全程无需人工干预。

3.2 示例2：给微信好友发固定消息（客服/通知场景）

python main.py \ --device-id ZY223456789 \ --base-url http://121.43.123.56:8800/v1 \ --model "autoglm-phone-9b" \ "打开微信，找到联系人张三，给他发消息：你好，会议时间调整到下午3点，请确认。"

实际效果：自动进入微信→在通讯录或聊天列表中定位「张三」→点击进入对话→在输入框中准确打出指定文字→点击发送。

3.3 示例3：批量操作APP（电商运营高频需求）

python main.py \ --device-id ZY223456789 \ --base-url http://121.43.123.56:8800/v1 \ --model "autoglm-phone-9b" \ "依次打开淘宝、京东、拼多多，分别搜索‘无线蓝牙耳机’，截图保存到相册。"

实际效果：按顺序启动三个APP→在每个APP内完成搜索动作→对搜索结果页进行截图（截图文件自动存入手机相册）。

3.4 示例4：处理验证码登录（需人工介入的智能协作）

python main.py \ --device-id ZY223456789 \ --base-url http://121.43.123.56:8800/v1 \ --model "autoglm-phone-9b" \ "打开小红书，点击登录，输入手机号138****1234，等待验证码弹出后暂停，等我手动输入。"

实际效果：自动打开小红书→点击登录→输入预设手机号→触发短信验证码→当界面出现验证码输入框时，AI主动暂停，并在终端打印提示：【请人工输入验证码】当前屏幕已显示验证码输入框，请在手机上手动输入，完成后按回车继续。你输入完，回车即继续执行下一步。

3.5 示例5：跨APP协同任务（高级自动化能力）

python main.py \ --device-id ZY223456789 \ --base-url http://121.43.123.56:8800/v1 \ --model "autoglm-phone-9b" \ "从知乎复制一篇关于AI手机助手的文章标题，粘贴到备忘录里，再截屏保存。"

实际效果：自动打开知乎→找到目标文章→长按标题→选择「复制」→切换到备忘录→新建笔记→粘贴标题→对当前页面截图→保存至相册。整个流程涉及APP切换、剪贴板读写、截图，体现多模态规划能力。

4. 命令参数详解：每个字段都告诉你为什么这么填

别再死记硬背参数。下面用一句话讲清每个字段的真实作用，让你以后能自己改、自己扩：

4.1`--device-id`：告诉AI“你要操控哪台手机”

它不是设备型号，也不是手机品牌，而是ADB识别这台设备的唯一身份证号；
每次adb devices列出来的那一串字符，就是它的ID；
如果你有两台手机同时连着电脑，必须明确指定其中一台，否则AI会懵。

4.2`--base-url`：告诉AI“你的大脑在哪台服务器上”

这个URL指向的是你部署好的vLLM服务接口，不是网页地址；
必须以http://开头，结尾必须是/v1（这是OpenAI兼容API的标准路径）；
如果你用的是AutoDL，端口通常是8800或8000；如果是自建服务器，检查你启动vLLM时用的--port参数。

4.3`--model`：告诉AI“用哪个大脑来思考”

目前官方只开放了autoglm-phone-9b这一个模型名；
即使你本地有多个模型，也必须填这个固定字符串，它是服务端路由的key；
后续若开放更多模型（如轻量版autoglm-phone-3b），才会在这里变更。

4.4 最后的自然语言指令：你和AI的“人话对话”

这是你唯一需要动脑的地方：用日常说话的方式描述任务；
不用学语法，不用写代码，就像对同事说：“帮我把XXAPP里的第3条消息转发给李四”；
AI会自动拆解：找APP→定位消息→长按→选转发→找联系人→发送；
越具体越好（比如写明“抖音号为dycwo11nt61d”，比“搜一个博主”成功率高得多）。

5. 常见问题速查：报错不用慌，3秒定位原因

运行时遇到报错？别急着重装，先对照下面这张表，90%的问题都能立刻解决：

报错信息关键词	最可能原因	30秒解决方法
`Connection refused`或`Max retries exceeded`	云服务端没起来，或防火墙拦了端口	在云服务器上执行`curl http://localhost:8800/v1`，若返回超时，重启vLLM服务；检查安全组是否放行8800端口
`Device not found`或`No device connected`	ADB设备未识别，或ID填错	重新执行`adb devices`，确认输出有`device`；检查`--device-id`是否和第一列完全一致（注意空格）
`Input method not set`或`Cannot type`	手机没启用ADB Keyboard	进入手机「设置→语言与输入法→默认输入法」，手动选中「ADB Keyboard」并设为默认
`Permission denied`或`Operation not allowed`	手机USB调试未授权，或开启了MIUI优化	拔掉USB线重插，手机弹窗点「允许」；小米/华为用户需关闭「USB调试安全设置」和「MIUI优化」
`Model not found`或`404 Not Found`	`--base-url`地址错误，或服务端模型加载失败	检查URL是否漏了`/v1`；在云服务器上查看vLLM日志，确认`autoglm-phone-9b`是否加载成功

提示：所有报错信息都会在终端最后一行清晰显示。遇到问题时，只复制最后一行报错文字，去GitHub Issues搜一下，大概率已有解决方案。

6. 进阶技巧：让AI更听话的3个实用方法

刚跑通只是开始。下面这些技巧，能让你从“能用”升级到“好用”：

6.1 指令加限定词，大幅提升成功率

AI不是万能的，但加几个关键词，能让它更专注：

加时间限定：“立即打开微信，不要等通知”→ 避免AI因等待推送而卡住
加位置限定：“在首页顶部的搜索框里输入‘AI手机’”→ 防止AI点错位置
加动作限定：“点击‘关注’按钮，不要点‘私信’”→ 明确区分相似按钮

6.2 用`--max-steps`防死循环（重要！）

某些复杂任务（如多层嵌套菜单）可能导致AI反复尝试失败。加这个参数让它“知难而退”：

python main.py \ --device-id ZY223456789 \ --base-url http://121.43.123.56:8800/v1 \ --model "autoglm-phone-9b" \ --max-steps 15 \ "在设置里找到电池优化，把抖音加入白名单"

--max-steps 15表示最多执行15步操作，超时自动停止并报错，避免无限卡在某个界面。

6.3 保存完整日志，方便复盘优化

加--log-file参数，把每一步操作、截图路径、AI思考过程全记下来：

python main.py \ --device-id ZY223456789 \ --base-url http://121.43.123.56:8800/v1 \ --model "autoglm-phone-9b" \ --log-file ./run_log_20240520.json \ "打开小红书搜美食"

生成的JSON日志里，你能看到：
🔹 AI每一步决策依据（如“识别到搜索图标在右上角”）
🔹 实际点击坐标（x=820, y=120）
🔹 截图保存路径（/sdcard/Pictures/autoglm/step_3.png）
🔹 失败时的错误快照（便于你判断是UI变化还是逻辑问题）

7. 总结：你已经掌握了AI手机Agent的核心控制权

这篇文章没有讲模型结构，没提视觉编码器怎么工作，也没分析9B参数的意义——因为对你来说，这些都不重要。重要的是：你现在知道，只要填对3个参数，写一句人话，AI就能替你完成手机上的真实操作。

你学会了如何用最简方式启动一个具备多模态理解、自动规划、精准执行能力的AI助理；
你掌握了5个覆盖主流场景的即用型命令模板，可直接复用或微调；
你拥有了快速排障的能力，不再被报错困住；
你拿到了进阶控制的钥匙：限定词、步数限制、完整日志。

下一步，你可以试着把“每天早上8点自动刷抖音10分钟”变成定时任务，或者把“收集100个竞品APP的首页截图”做成批量脚本。AI手机Agent的价值，不在于它多聪明，而在于它能把重复劳动彻底从你手上拿走。

--- > **获取更多AI镜像** > > 想探索更多AI镜像和应用场景？访问 [CSDN星图镜像广场](https://ai.csdn.net/?utm_source=mirror_blog_end)，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

企业官网建设流程全解析