手把手部署 Open-AutoGLM:打造你的“豆包手机”级 AI 智能体
最近,“豆包手机助手”频频登上热搜——它不仅能跨应用自动比价下单、查物流、发消息,还能像真人一样操作手机完成复杂任务。这种系统级 AI 智能体(Agent)被视为下一代人机交互的入口,也引发了关于安全、公平与生态变革的广泛讨论。
就在这一风口之上,智谱 AI 于 2025 年 12 月 9 日正式开源了其核心 Agent 模型 —— AutoGLM。这意味着,我们普通人也能在自己的设备上运行类似“豆包手机”的智能体!
今天,我就带大家从零开始,在 Windows + 安卓环境下部署 Open-AutoGLM,亲手体验这个国产多模态 AI Agent 的强大能力。
🌟 实际效果预览
先看几个官方演示(动图已加载):
-
“打开美团搜索附近的火锅店”
→ 自动启动美团、输入关键词、展示结果。
-
“打开高德地图,并导航至钱塘小学软件园教学点”
→ 精准识别地点并开启导航。
-
“打开微信,找到二货,发送最近的一张图片给他”
→ 跨应用调取相册、选择最新图片、完成发送。
是不是有点像科幻电影?但这一切,现在你也能做到!
🛠️ 一、环境准备
本文面向 Windows 电脑 + 安卓手机 用户(鸿蒙用户需使用 HDC 工具,此处略)。请确保满足以下条件:
1. Python 环境
- 推荐 Python 3.10 或更高(我用的是 3.13.1)
- 建议使用
conda创建独立环境,避免依赖冲突
1 | python --version |
2. 安装 ADB(Android Debug Bridge)
ADB 是控制安卓设备的命令行工具。
-
解压到任意目录(如
C:\platform-tools) -
将该路径加入系统环境变量(PATH)

验证安装:
1 | adb version |
3. 手机设置
-
开启开发者模式:进入「设置 → 关于手机」,连续点击「版本号」7 次。

-
启用 USB 调试:进入「系统和更新 → 开发人员选项」,打开「USB 调试」。

-
连接电脑时,选择 “传输文件” 模式。
验证连接:
1 | adb devices |
4. 安装 ADB Keyboard(关键!)
由于 AutoGLM 需要模拟文本输入,必须安装 ADB Keyboard:
- 下载 APK:ADBKeyboard.apk
- 安装到手机后,务必在「设置 → 系统 → 语言与输入法 → 键盘」中启用它,否则无法输入文字!
📦 二、部署 Open-AutoGLM
1. 克隆项目
1 | git clone https://github.com/zai-org/Open-AutoGLM.git |
或直接下载 ZIP 并解压。
2. 安装依赖
1 | pip install -r requirements.txt |
3. 获取大模型 API 凭据
AutoGLM 本身是 Agent 控制器,需调用远程 LLM(可以选择通义千问、GPT、智谱等等,本人选择智谱GLM)。
- 登录 智谱开放平台
- 创建 API Key,记录以下信息:
base_url:https://open.bigmodel.cn/api/paas/v4model:autoglm-phoneapi_key: 你的密钥(形如xxxx.qLnEujLCWGcfHl25)
⚠️ 注意:API Key 属于敏感信息,请勿公开泄露!
▶️ 三、运行 AutoGLM
方式一:命令行调用
1 | python main.py \ |
你可以替换最后的指令,尝试各种任务!
方式二:Python 脚本集成
1 | from phone_agent import PhoneAgent |
这种方式更适合嵌入到自己的自动化项目中。
🔒 安全与思考
虽然 AutoGLM 极大降低了 AI Agent 的使用门槛,但也带来新的挑战:
- 手机权限高度开放,存在隐私泄露风险;
- 自动化操作可能被滥用于刷单、作弊等场景;
- 未来是否会出现“AI 劳工”?如何监管?
技术本身无善恶,关键在于我们如何使用它。作为开发者,既要拥抱创新,也要保持敬畏。
✅ 结语
通过不到 1 小时的配置,我们就拥有了一个能自主操作手机的 AI 智能体。这不仅是技术的胜利,更是 AI 民主化的体现。
如果你对 Agent 技术感兴趣,不妨动手试试 Open-AutoGLM。或许下一个改变人机交互范式的应用,就出自你的手中!