Open-AutoGLM命令行运行示例,照着抄就行
你不需要理解原理,不用查文档,不用反复试错——这篇文章就是为你准备的“开箱即用”指南。只要你的手机是安卓7.0以上、电脑能连网络、云服务器已部署好Open-AutoGLM服务端,接下来这5分钟,你就能让AI替你点开抖音、搜博主、点关注,全程自动完成。所有命令都经过实测验证,参数含义用大白话标注清楚,复制粘贴就能跑通。
1. 前提确认:三件事必须做完
在敲任何命令前,请花30秒确认以下三点是否全部满足。少一个,后面都会卡住:
- 云服务端已就绪:你在AutoDL或自建服务器上已成功启动
autoglm-phone-9b模型服务,能通过浏览器访问http://<IP>:8800/v1返回健康状态(如{"status":"ok"}); - 手机已连通电脑:USB线连接后,在本地电脑终端执行
adb devices,输出中包含一行带device状态的设备ID(例如ZY223456789 device),不是unauthorized或空; - ADB Keyboard已启用:手机「设置→语言与输入法→默认输入法」已切换为「ADB Keyboard」,这是AI向手机打字的唯一通道。
如果任一条件不满足,请先回退到对应环节配置,不要强行往下走。这不是步骤跳过的问题,而是底层通信链路是否打通的问题。
2. 本地控制端快速部署(3步搞定)
你不需要从零写代码,也不需要编译复杂依赖。Open-AutoGLM官方已把控制逻辑打包成可直接调用的Python包,我们只需拉下来、装好、验证即可。
2.1 克隆代码并安装依赖
打开本地电脑终端(Windows用CMD/PowerShell,macOS用Terminal),逐行执行:
# 创建专属工作目录,避免污染其他项目 mkdir ~/autoglm-cli && cd ~/autoglm-cli # 拉取最新控制端代码(非模型,仅指令调度部分) git clone https://github.com/zai-org/Open-AutoGLM.git cd Open-AutoGLM # 安装运行所需的基础库(含ADB通信、HTTP请求、日志等) pip install -r requirements.txt # 将本项目注册为系统级Python包,后续可全局调用main.py pip install -e .注意:若提示
pip版本过低,先执行pip install --upgrade pip;若某依赖安装失败(如pydantic冲突),加-i https://pypi.tuna.tsinghua.edu.cn/simple/指定清华源重试。
2.2 验证ADB连接是否真实可用
别信adb devices显示device就万事大吉。我们来一次真实操作测试:
# 让AI代理先帮你点亮屏幕(最基础动作) adb shell input keyevent KEYCODE_WAKEUP # 再发一条文本,看是否能输入(验证ADB Keyboard) adb shell input text "test123"如果手机屏幕亮起,且当前焦点处(比如微信聊天框、备忘录)出现了test123字样,说明ADB通路完全畅通。如果没反应,请回头检查「手机是否启用ADB Keyboard」「USB调试是否授权」「数据线是否支持传输」。
2.3 获取设备标识符(关键!别填错)
--device-id参数不是随便写的字符串,它必须和adb devices输出的第一列完全一致:
adb devices # 输出示例: # List of devices attached # ZY223456789 device ← 这就是你要填的device-id # 192.168.1.100:5555 device ← 如果是WiFi连接,就填这一整串- USB连接 → 填
ZY223456789这类字母数字组合; - WiFi连接 → 填
192.168.1.100:5555这种IP+端口格式(需提前执行adb tcpip 5555)。
3. 命令行运行:5个真实可抄示例
下面所有命令,你只需替换其中两处内容:
🔹<你的设备ID>→ 替换为你自己adb devices看到的ID
🔹<云服务器IP>:<端口>→ 替换为你实际部署服务的地址(如121.43.123.56:8800)
其余部分,一字不改,复制粘贴即可运行。
3.1 示例1:打开抖音并搜索指定博主(最常用场景)
python main.py \ --device-id ZY223456789 \ --base-url http://121.43.123.56:8800/v1 \ --model "autoglm-phone-9b" \ "打开抖音搜索抖音号为:dycwo11nt61d 的博主并关注他!"实际效果:手机自动解锁→启动抖音→点击搜索框→输入dycwo11nt61d→点击搜索结果→进入主页→点击「关注」按钮。全程无需人工干预。
3.2 示例2:给微信好友发固定消息(客服/通知场景)
python main.py \ --device-id ZY223456789 \ --base-url http://121.43.123.56:8800/v1 \ --model "autoglm-phone-9b" \ "打开微信,找到联系人张三,给他发消息:你好,会议时间调整到下午3点,请确认。"实际效果:自动进入微信→在通讯录或聊天列表中定位「张三」→点击进入对话→在输入框中准确打出指定文字→点击发送。
3.3 示例3:批量操作APP(电商运营高频需求)
python main.py \ --device-id ZY223456789 \ --base-url http://121.43.123.56:8800/v1 \ --model "autoglm-phone-9b" \ "依次打开淘宝、京东、拼多多,分别搜索‘无线蓝牙耳机’,截图保存到相册。"实际效果:按顺序启动三个APP→在每个APP内完成搜索动作→对搜索结果页进行截图(截图文件自动存入手机相册)。
3.4 示例4:处理验证码登录(需人工介入的智能协作)
python main.py \ --device-id ZY223456789 \ --base-url http://121.43.123.56:8800/v1 \ --model "autoglm-phone-9b" \ "打开小红书,点击登录,输入手机号138****1234,等待验证码弹出后暂停,等我手动输入。"实际效果:自动打开小红书→点击登录→输入预设手机号→触发短信验证码→当界面出现验证码输入框时,AI主动暂停,并在终端打印提示:【请人工输入验证码】当前屏幕已显示验证码输入框,请在手机上手动输入,完成后按回车继续。你输入完,回车即继续执行下一步。
3.5 示例5:跨APP协同任务(高级自动化能力)
python main.py \ --device-id ZY223456789 \ --base-url http://121.43.123.56:8800/v1 \ --model "autoglm-phone-9b" \ "从知乎复制一篇关于AI手机助手的文章标题,粘贴到备忘录里,再截屏保存。"实际效果:自动打开知乎→找到目标文章→长按标题→选择「复制」→切换到备忘录→新建笔记→粘贴标题→对当前页面截图→保存至相册。整个流程涉及APP切换、剪贴板读写、截图,体现多模态规划能力。
4. 命令参数详解:每个字段都告诉你为什么这么填
别再死记硬背参数。下面用一句话讲清每个字段的真实作用,让你以后能自己改、自己扩:
4.1--device-id:告诉AI“你要操控哪台手机”
- 它不是设备型号,也不是手机品牌,而是ADB识别这台设备的唯一身份证号;
- 每次
adb devices列出来的那一串字符,就是它的ID; - 如果你有两台手机同时连着电脑,必须明确指定其中一台,否则AI会懵。
4.2--base-url:告诉AI“你的大脑在哪台服务器上”
- 这个URL指向的是你部署好的vLLM服务接口,不是网页地址;
- 必须以
http://开头,结尾必须是/v1(这是OpenAI兼容API的标准路径); - 如果你用的是AutoDL,端口通常是
8800或8000;如果是自建服务器,检查你启动vLLM时用的--port参数。
4.3--model:告诉AI“用哪个大脑来思考”
- 目前官方只开放了
autoglm-phone-9b这一个模型名; - 即使你本地有多个模型,也必须填这个固定字符串,它是服务端路由的key;
- 后续若开放更多模型(如轻量版
autoglm-phone-3b),才会在这里变更。
4.4 最后的自然语言指令:你和AI的“人话对话”
- 这是你唯一需要动脑的地方:用日常说话的方式描述任务;
- 不用学语法,不用写代码,就像对同事说:“帮我把XXAPP里的第3条消息转发给李四”;
- AI会自动拆解:找APP→定位消息→长按→选转发→找联系人→发送;
- 越具体越好(比如写明“抖音号为dycwo11nt61d”,比“搜一个博主”成功率高得多)。
5. 常见问题速查:报错不用慌,3秒定位原因
运行时遇到报错?别急着重装,先对照下面这张表,90%的问题都能立刻解决:
| 报错信息关键词 | 最可能原因 | 30秒解决方法 |
|---|---|---|
Connection refused或Max retries exceeded | 云服务端没起来,或防火墙拦了端口 | 在云服务器上执行curl http://localhost:8800/v1,若返回超时,重启vLLM服务;检查安全组是否放行8800端口 |
Device not found或No device connected | ADB设备未识别,或ID填错 | 重新执行adb devices,确认输出有device;检查--device-id是否和第一列完全一致(注意空格) |
Input method not set或Cannot type | 手机没启用ADB Keyboard | 进入手机「设置→语言与输入法→默认输入法」,手动选中「ADB Keyboard」并设为默认 |
Permission denied或Operation not allowed | 手机USB调试未授权,或开启了MIUI优化 | 拔掉USB线重插,手机弹窗点「允许」;小米/华为用户需关闭「USB调试安全设置」和「MIUI优化」 |
Model not found或404 Not Found | --base-url地址错误,或服务端模型加载失败 | 检查URL是否漏了/v1;在云服务器上查看vLLM日志,确认autoglm-phone-9b是否加载成功 |
提示:所有报错信息都会在终端最后一行清晰显示。遇到问题时,只复制最后一行报错文字,去GitHub Issues搜一下,大概率已有解决方案。
6. 进阶技巧:让AI更听话的3个实用方法
刚跑通只是开始。下面这些技巧,能让你从“能用”升级到“好用”:
6.1 指令加限定词,大幅提升成功率
AI不是万能的,但加几个关键词,能让它更专注:
- 加时间限定:
“立即打开微信,不要等通知”→ 避免AI因等待推送而卡住 - 加位置限定:
“在首页顶部的搜索框里输入‘AI手机’”→ 防止AI点错位置 - 加动作限定:
“点击‘关注’按钮,不要点‘私信’”→ 明确区分相似按钮
6.2 用--max-steps防死循环(重要!)
某些复杂任务(如多层嵌套菜单)可能导致AI反复尝试失败。加这个参数让它“知难而退”:
python main.py \ --device-id ZY223456789 \ --base-url http://121.43.123.56:8800/v1 \ --model "autoglm-phone-9b" \ --max-steps 15 \ "在设置里找到电池优化,把抖音加入白名单"--max-steps 15表示最多执行15步操作,超时自动停止并报错,避免无限卡在某个界面。
6.3 保存完整日志,方便复盘优化
加--log-file参数,把每一步操作、截图路径、AI思考过程全记下来:
python main.py \ --device-id ZY223456789 \ --base-url http://121.43.123.56:8800/v1 \ --model "autoglm-phone-9b" \ --log-file ./run_log_20240520.json \ "打开小红书搜美食"生成的JSON日志里,你能看到:
🔹 AI每一步决策依据(如“识别到搜索图标在右上角”)
🔹 实际点击坐标(x=820, y=120)
🔹 截图保存路径(/sdcard/Pictures/autoglm/step_3.png)
🔹 失败时的错误快照(便于你判断是UI变化还是逻辑问题)
7. 总结:你已经掌握了AI手机Agent的核心控制权
这篇文章没有讲模型结构,没提视觉编码器怎么工作,也没分析9B参数的意义——因为对你来说,这些都不重要。重要的是:你现在知道,只要填对3个参数,写一句人话,AI就能替你完成手机上的真实操作。
- 你学会了如何用最简方式启动一个具备多模态理解、自动规划、精准执行能力的AI助理;
- 你掌握了5个覆盖主流场景的即用型命令模板,可直接复用或微调;
- 你拥有了快速排障的能力,不再被报错困住;
- 你拿到了进阶控制的钥匙:限定词、步数限制、完整日志。
下一步,你可以试着把“每天早上8点自动刷抖音10分钟”变成定时任务,或者把“收集100个竞品APP的首页截图”做成批量脚本。AI手机Agent的价值,不在于它多聪明,而在于它能把重复劳动彻底从你手上拿走。
--- > **获取更多AI镜像** > > 想探索更多AI镜像和应用场景?访问 [CSDN星图镜像广场](https://ai.csdn.net/?utm_source=mirror_blog_end),提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。