编者按:苹果最近的开发者大会也许是最近十年最值钱的一次发布会,因为这让该公司的市值一下子涨了5000多亿美元。为什么?因为推出了设备端的人工智能,强化版的Siri,以及对用户的进一步锁定。文章来自编译。
在近日一年一度的全球开发者大会(WWDC)上,苹果宣布了人工智能的三大发展策略:
- 内置人工智能(AI):苹果将采用隐私优先、设备内置的做法,给既有软件注入AI功能。
- 强化版 Siri:语音助手 Siri 正在成为软件的元层,协调工作流,减少用户花在app上的时间。
- 生态体系演变:苹果的每款设备(iPhone、iPad 及 Mac)均可协同工作,产生1+1>2的效果。
这些元素确实可以改善我们的工作与生活方式。几个世纪以来,新技术已经逐渐让我们以前从事的体力劳动自动化。现在是时候让新技术对脑力劳动做同样的事情了。很快,你不需要导航到网站或app即可体验生成式人工智能——因为它将内置到你在智能手机和计算机上所做的一切上。
数学魔法(内置人工智能)
大会展示的app当中给人留下最深刻印象的是 iPad 计算器应用。这家公司此前曾承诺,除非能“做得非常出色”,否则不会给 iPad 开发计算器app。这一等就是 14 年,但苹果确实做到了。
来源:苹果
这款计算器与 iPhone 上的计算器类似,但加入了人工智能元素。你可以用 Apple Pencil 写数学表达式,只要你写出等号,计算器就会帮你算出结果——而且模仿的是你自己的笔迹。它还可以实时创建图表,并在你更新图表方程的变量时调整输出。这款app直观好看,是数学老师噩梦里面的恶魔——而且完全靠在设备侧运算的人工智能驱动。(这款app显然赢得了当天最热烈的欢呼声)。
除了那款应用之外,苹果还展示了大量机器学习能力的例子,而那些能力均增强了现有的原生应用与硬件。照片现在可以对联系人进行语义搜索。输入“摩根在树前拥抱枫树”,照片应用就会调出一张我妻子与小狗在白松前玩耍的照片。iMessage 可以用图像生成模型生成自定义的表情符号。Apple Watch 可以用机器学习来分析你锻炼付出了多大努力。电话应用可以记录和转录对话——这对世界各地的作者来说都是一大福音。我可以用一整天——并说出这些功能会干掉哪些初创企业。
要点是生成人工智能的主要功能(比方说在大型数据集里面查找数据、语义理解和与图像生成)会出现在所有的 iPhone app之中。
*阿诺德施瓦辛格的声音* 我会自动化的(增强版 Siri)
一段时间以来我一直有这么一个观点,即软件里面人工智能的最终形式是“元层”(meta-layer),可以自动执行跨多个应用的重复任务。所以我得谢谢苹果的这帮家伙,他们证明了我的观点是对的。Siri 正是我所说那样。Siri 升级的人工智能意味着你可以做你想让它去做的所有事情。苹果在演示当中分享了一个例子,当问“妈妈搭乘的航班什么时候降落?”时,Siri会搜索妈妈发给你的消息,了解她什么时候分享了航班号,查询航班进度,并告诉你最新的到达时间。Siri 还可以管理通知、电子邮件以及消息,总结长消息,并显示最重要的信息。
来源:苹果
当你回复这些传入的信息时,Siri 可以在应用当中替你生成文本或采取行动。比方说Siri 可以在电子邮件中替你撰写答案或为你回复短信。这些功能我们以前在人工智能应用里面也见过,但从来都没不是在强调隐私的设备型号上执行的。跟苹果芯片、苹果设备、苹果人工智能基础模型进行全面垂直整合的价值在于,这些模型经过了苹果数据的训练,有一种独特的竞争优势。
如果(要打一个很大的问号)苹果的产品与今天的演示相符,那么对于超过 10 亿 iPhone 用户来说,这将是计算能力的重大改进。当然,演示从定义上讲是经过修饰的视频而不是实际的产品。在看过数百个人工智能的演示之后,我的经验告诉我,这些发布的产品要想大规模实施几乎是不可能完成的挑战。细节很棘手,很难做到正确。苹果在定制芯片、资源和安装基础方面拥有众多优势,因此也许它最终会成为实现这一目标的公司。如果成功,很容易想象 Siri 会扩展到 MacBook 的更强大工作流之中。
元层人工智能的每一项改进,都会导致软件应用的威力有所下降。Siri 会拥有更多数据和更多访问权限,而且这将是免费的(对 SaaS 公司来说是最糟糕的)。我生活当中有很多应用是我希望永远都不需要再用的。希望很快Siri 就能让我摆脱它们。从最根本来讲,每个应用会变成存储数据的地方,在它们之上会有一个 LLM,可以生成见解并采取后续行动。销售代表弄好电话录音就像,不必再使用 CRM,因为人工智能可以将这些电话转录到数据库之中,提取必要的信息,填写必填字段,并安排下一次会议——这些都不需要进入应用程界面。我们进入到一个需要图形用户界面的软件少得多的世界。我们距离“一切无头化(headless)”的世界还有很多年的时间,但你可以看到这个基础正在奠定。
更新的东西还有很多,远不止是人工智能方面的。
给我一大块平台蛋糕(生态体系演进)
当我从一个设备切换到另一个设备时,我觉得苹果的设备就像会巫术一样。在 iPhone 上复制某些内容就能无缝粘贴到 Mac 上,搞得我总要打开衣柜看看是不是藏着黑猫和毒蘑菇。苹果扔给继续改善其生态体系优势——这次则是推出了一款新的密码管理器应用。
来源:苹果
密码应用即将登陆 MacOS、iOS 以及 VisionOS(苹果 Vision Pro 头戴设备操作系统)。密码应用并不新鲜,但苹果的产品因为细节而出众。有个集中存储密码的地方会非常有用。
Vision Pro 的平台升级在视觉上更加令人印象深刻,增加了将 2D 照片转换为 3D“空间”照片的功能。饱含感情发自肺腑的照片与视频是 Vision Pro 的杀手级功能,很高兴苹果正在把现有照片变成 3D。该公司还改进了出色的 Mac Virtual Display,让你将 MacBook 的屏幕变成 Vision Pro 上的超宽显示屏。
来源:苹果
这些升级拆开来看都不足以成为购买苹果设备的理由。但当你把它们堆到一起时,这个生态体系就会让你拥有的每台设备都是由苹果制造的,这很值得。它不像 Uber 或 Instagram 等平台那样具有强大的网络效应,但生态体系锁定的程度很高。
Apple Intelligence(苹果智能)
尽管拥有尖端技术,但苹果用的还是老套路。在Windows 和 Android 上已出现多年的功能在发布时获得了雷鸣般的掌声?没错。窗口平铺功能(可让窗口轻松贴合到屏幕周围)终于出现在 Mac 上。把现有技术用品牌话术包装,做滑稽可笑的营销?好吧,跟人工智能大哥招呼吧——现在它叫 Apple Intelligence。
尽管我对此嗤之以鼻,但这家公司的牌的确打对了。根据早期报道,LLM 是该公司技术栈的组成部分,且大部分是内部开发的,就像用到的绝大多数人工智能一样。该公司与 ChatGPT 等领导者建立了合作伙伴关系,来处理发生平台以外的那些高风险的查询。
从微软、谷歌到现在的苹果,技术格局并没有发生太大变化。事实证明,互联网和移动计算模式的所有优势都可以巧妙地转移到人工智能上。iPhone 的定制硅片可以重新用来跑 Siri 查询。用作定向广告的数据可用来定制工作流。这些公司都没有坐以待毙——它们都在积极行动,投入数十亿美元。越来越多的迹象表明,LLM将进一步巩固现有的科技巨头的地位。也许新世界跟旧世界还是一模一样,但成本要高出 20%,因为现在我们必须支付人工智能的成本了。