最近,苹果居然给谷歌鸣不平了。日前有消息称,苹果公司向欧盟发出警告,指出后者要求谷歌向第三方AI开放Android系统相关权限,让用户自由选择AI服务的提案,将会威胁用户隐私、安全,以及设备完整性。

据悉,苹果在提交给欧盟的相关文件中指出,按照欧盟的设想,任何AI公司理论上都可以在用户不知情的情况下通过Android系统向外发送电子邮件、订购餐食。对此苹果方面警告称,“如果这些措施得到确认,将对用户隐私、安全性以及设备完整性和性能构成深远的风险”。
此前在4月末,欧盟认定谷歌在Android系统中给予Gemini系统级优先待遇,限制ChatGPT、Grok等第三方AI服务调用系统功能、屏幕上下文、本地数据和硬件能力的行为,违反了《数字市场法》。为此,欧盟方面要求第三方AI应用能通过唤醒词或按键在Android系统内启动,应能在用户授权后读取屏幕上下文,以及允许它们获得类似Gemini代用户操作App的能力。
就在谷歌于The Android Show | I/O Edition活动中推出Gemini Intelligence,进一步将Gemini人工智能能力整合进Android系统的关键节点,苹果选择了坚定站在谷歌这一边。
其实苹果为谷歌叫屈并不奇怪,因为双方关于“系统级AI需要掌握在自己手中”是有共识的。

由于苹果也有自己的Apple Intelligence,并且已经确定Gemini将作为其未来基础模型的最主要技术支持,所以双方在AI赋能移动操作系统这件事上有着共同的利益。随着苹果与谷歌达成拒绝向第三方开放系统级AI能力的共识,也就意味着第三方Agent在手机端彻底没有了未来,以后可能只有豆包手机助手这类GUI Agent还有存在的价值。
没错,在手机AI层面,被业界认为只是“过渡方案”的GUI(图形用户界面),反而要比CLI(命令行界面)更有前景。而CLI Agent的典型代表是当下热门的OpenClaw(龙虾),这类产品的特点就是开发门槛更低、Token消耗更少、自动化程度更高。
事实上,如今的AI大模型是在数十年累积的Unix文档、GitHub代码上训练,它们对CLI工具的理解是"刻在了DNA里"的。只不过CLI Agent想要指挥设备中的各个应用来干活,也有前提条件,那就是需要应用开放API。大家不妨回忆一下,在两个月前龙虾爆红时,腾讯的QQ、字节跳动的飞书、阿里的钉钉等应用是不是都在争先恐后地宣布开放API?

但现在的情况是谷歌和苹果以用户隐私、安全以及设备完整性为由,实质上拒绝向Agent开放API。可没有API,Agent又要如何使用App的能力帮用户干活?豆包手机助手这类GUI Agent就成了唯一的选项,其实GUI Agent的逻辑很简单,那就是“既然不开放API,我就像人一样用你的软件”。
大家在使用Android、iOS的系统功能时不需要通过API,GUI Agent自然也不用。比如,豆包手机助手是通过Android系统的无障碍服务和INJECT_EVENTS权限,允许自身向系统注入模拟的用户输入事件,从而实现模拟点击和读屏的效果,最终完成跨App连续操作。
当然,GUI Agent这个路线也存在问题,毕竟让AI看屏幕、点按钮、处理弹窗,不仅用户有不安全感,App开发者同样也不爽。因为GUI Agent会让开发者不知道使用者到底是人还是AI,一旦是后者,那么他们App上的广告又要给谁看呢。所以豆包手机助手一推出,很快就引来了腾讯、阿里、美团的围攻。

问题在于,如今苹果和谷歌的态度是拒绝第三方系统级AI存在,以维护自家生态系统的封闭性和控制权,避免因强制开放而丧失核心竞争力。所以CLI Agent路线在Android和iOS上已经不存在拿到官方API的机会,但没有API的支持,CLI Agent直接就变成了“瞎子”,而不受欢迎的GUI Agent好歹还有当“瘸子”的机会。
因此除非欧盟回心转意,否则一切面向Android、iOS的Agent,可能都得重新去向豆包手机助手学习。
