【OpenHarmony/HarmonyOs 】限时答题状态机实践:倒计时、暂停、自动提交与实况窗结束态设计
2026/7/6 1:20:04
【免费下载链接】UI-TARS项目地址: https://gitcode.com/GitHub_Trending/ui/UI-TARS
每天重复点击手机上百次?还在为繁琐的App切换和长按操作烦恼吗?UI-TARS(UI任务自动化与识别系统)正是为你量身打造的智能助手。本文将带你从零开始,彻底掌握这款革命性的手机自动化工具。
传统手机操作存在三大痛点:
UI-TARS通过上图所示的智能工作流程,完美解决了这些问题。它能够理解你的自然语言指令,自动生成操作脚本,让手机真正变得"聪明"起来。
| 功能维度 | 传统操作 | UI-TARS自动化 |
|---|---|---|
| 应用启动 | 手动查找图标点击 | 一键启动,支持名称/包名识别 |
| 长按操作 | 手指长时间按压 | 智能长按,自动识别坐标和时长 |
| 跨应用流程 | 逐个手动操作 | 端到端自动化,无缝衔接 |
| 学习门槛 | 需要编程知识 | 自然语言驱动,零基础可用 |
| 设备兼容 | 部分设备需Root | 非侵入式设计,安全无风险 |
从性能对比图可以看出,UI-TARS在多个GUI基准测试中表现优异,相比传统SOTA方法有显著提升。
git clone https://gitcode.com/GitHub_Trending/ui/UI-TARS cd UI-TARS/codes pip install .创建一个简单的微信启动脚本:
# 启动微信应用 open_app(app_name="微信") # 等待界面加载完成 wait()运行脚本,观察微信是否自动启动。恭喜你,已经完成了第一个自动化任务!
长按是移动应用中常见的交互方式,UI-TARS让这一操作变得异常简单:
基础语法:
long_press(point='<point>x y</point>')坐标获取两种方式:
上图展示了UI-TARS如何通过智能坐标处理,在不同分辨率设备上保持操作准确性。
UI-TARS的应用启动功能支持多种场景:
基础启动:
open_app(app_name="抖音")包名启动(更精确):
open_app(app_name="com.ss.android.ugc.aweme")应用切换组合:
# 返回主页 press_home() # 启动新应用 open_app(app_name="支付宝")codes/README.mdcodes/tests/UI_TARS_paper.pdfREADME_deploy.mdUI-TARS项目正在持续迭代,未来版本将带来:
立即开始你的手机自动化之旅吧!UI-TARS将彻底改变你使用手机的方式,让繁琐操作成为历史,让智能生活触手可及。
【免费下载链接】UI-TARS项目地址: https://gitcode.com/GitHub_Trending/ui/UI-TARS
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考