首款无需电脑的开源 AI 手机自动化助手 | AI Phone Automation Assistant

基于视觉语言模型 (VLM) · 原生 Android Kotlin · 多 Agent 协作架构

核心特性

🤖 智能 AI Agent

基于先进的视觉语言模型(VLM),能够"看懂"屏幕内容

自然语言指令,说人话就能操作手机

智能决策,根据屏幕状态自动规划下一步操作

🎨 精心设计的 UI

这可能是所有手机自动化开源项目中 UI 做得最好看的。

现代化 Material 3 设计语言

流畅的动画效果

深色/浅色主题自适应

精心设计的首次使用引导

完整的中英文双语支持

🔧 高度可定制

支持多种 VLM:阿里云通义千问、OpenAI GPT-4V、Claude 等

预设 API 服务商:阿里云、OpenAI、OpenRouter 一键切换

从 API 动态获取可用模型列表,支持模糊搜索

可配置自定义 API 端点,支持本地模型(Ollama、vLLM 等)

🔐 安全保护

API Key 使用 AES-256-GCM 加密存储

检测到支付、密码等敏感页面自动停止

任务执行全程可视,悬浮窗显示进度

随时可以手动停止任务

可选的云端崩溃上报(可在设置中关闭)

🔓 Root 模式支持

当 Shizuku 以 Root 权限运行时,肉包可以启用 Root 模式:

Root 模式:解锁更多系统级操作能力

su 命令:允许执行 su -c 命令(需谨慎使用)

自动检测:自动检测 Shizuku 权限等级(ADB/Root),非 Root 环境下该选项为灰色不可用

前置要求

Android 8.0 (API 26) 或更高版本

WiFi 网络 - Shizuku 无线调试依赖 WiFi 连接,确保手机已连接 WiFi

Shizuku - 用于获取系统级控制权限

VLM API Key - 需要视觉语言模型的 API 密钥(如阿里云通义千问)

安装步骤

1. 安装并启动 Shizuku

Shizuku 是一个开源工具,可以让普通应用获得 ADB 权限,无需 Root。

Google Play

GitHub Releases

启动方式(二选一):

无线调试(推荐,需 Android 11+)

进入 设置 > 开发者选项 > 无线调试

开启无线调试

在 Shizuku App 中选择"无线调试"方式启动

电脑 ADB

手机连接电脑,开启 USB 调试

执行:adb shell sh /storage/emulated/0/Android/data/moe.shizuku.privileged.api/start.sh

2. 安装肉包

Releases 页面下载最新 APK 安装。

3. 授权与配置

打开肉包 App

在 Shizuku 中授权肉包

⚠️ 重要:进入设置页面,配置你的 API Key

获取 API Key

阿里云通义千问(推荐国内用户)

访问 阿里云百炼平台

开通 DashScope 服务

在 API-KEY 管理中创建密钥

OpenAI(需要代理)

访问 OpenAI Platform

创建 API Key

GitHub地址:https://github.com/Turbo1123/roubao

备用地址:https://bgithub.xyz/Turbo1123/roubao

声明:本站内容均收集于互联网,如不慎侵犯到您的版权利益,请附带相关证明文件来信本站将立即予以下架删除。