全部回复(1)以下是安卓机部署Open‑AutoGLM的3步快速上手清单,走“电脑控制+云端模型”路线,无需Root、无需强GPU,优先用智谱免费API,最快15分钟跑通Demo。
一、准备工作(5分钟)
1. 手机端(Android 10+,推荐真机) - 开启开发者选项:设置→关于手机→连续点击版本号7次 - 开启USB调试(小米/Redmi额外开“USB调试(安全设置)”) - 连接WiFi,开启“无线调试”(可选,后续可无线控制) - 安装ADB Keyboard(必须,用于文字输入),并在设置→输入法启用 - 保持屏幕常亮、解锁、无锁屏密码/指纹
2. 电脑端(Windows/macOS/Linux) - 安装Python 3.10+,并配置pip - 安装Android Platform Tools(ADB),并添加到系统环境变量 - 验证ADB:USB连接手机,终端输入adb devices,能看到设备号即正常
3. 关键账号(免费) - 智谱AI账号:申请API Key,用于autoglm‑phone模型(免费) - 可选:硅基流动账号(语音转文字,免费)
二、部署与启动(8分钟)
1. 拉取代码并安装依赖 bash git clone https://github.com/zai‑org/Open‑AutoGLM.git cd Open‑AutoGLM pip install -r requirements.txt
2. 启动Agent(核心命令) bash python run_agent.py \ --device-id 你的设备号(adb devices获取) \ --base-url https://open.bigmodel.cn/api/paas/v4 \ --model autoglm-phone \ --api-key 你的智谱API Key
3. 验证启动 - 看到“Agent started successfully” - 手机自动打开目标App并执行操作,日志实时输出步骤
三、首次跑通Demo(2分钟)
1. 输入指令(如“打开微信给李四发消息‘测试Open‑AutoGLM’”)
2. 观察执行:模型识别屏幕→规划步骤→模拟点击/输入→完成任务
3. 常见问题与修复 - ADB连接失败:重插USB、重启手机开发者选项、重新授权 - 无法输入文字:确认ADB Keyboard已启用,重启手机 - 模型响应慢:切换稳定网络,或改用更高算力的云端服务 进阶建议 - 想本地部署模型:用RTX 4090(24GB)或A100(40GB)显卡,拉取AutoGLM‑Phone‑9B模型并本地启动API - 想无线控制:手机与电脑同WiFi,通过无线调试端口连接,命令中加--connect 手机IP:端口 - 想加语音控制:安装Termux:API并配置硅基流动API,实现语音指令输入