2018年的某一天,里德·霍夫曼(Reid Hoffman)在办公室里接到了一个电话, “马斯克离开了,现在他们(OpenAI)需要更多的钱。”
对这位硅谷知名风投Greylock的合伙人来说,几乎每天都会接到类似的电话。有时是立场不一,有时是利益谈不拢或者是商业冲突,总之,初创公司创始成员出走的情况对他来说,太见怪不怪了。
“可以出5000万(美元),这个数字对我来说是没问题的。”霍夫曼说。
不久之后,他顺利加入了OpenAI的董事会。在一次公司大会上,他被公司创始人之一的山姆·奥特曼(Sam Altman)介绍给全体员工。当着底下所有人的面,奥特曼问霍夫曼:“如果我的工作做得不称职,你会怎么做?”
“我会帮助你克服困难,然后看看怎样做的更好,我们一起来推进公司发展。”霍夫曼很熟练地拿出那一套在公开场合安全而又冠冕堂皇的说辞。
“不,不,不,我是说,呃,如果我真的无法把工作做好,比如,无法保证AI对人类是安全的,且对整个社会带来好处,你会怎么做?” 奥特曼依然不依不饶。
“那我就…解雇你?” 霍夫曼被逼无奈,只好当着OpenAI全体员工的面,半开玩笑地对奥特曼说。
一语成谶。
5年后,作为首席执行官的奥特曼,果然被OpenAI的董事会解雇了,但此时霍夫曼已不是董事会成员。这场被外界看作是OpenAI宫斗的突发事件,成为整个2023年生成式人工智能火爆的一个戏剧性注脚。
就在这场宫斗发生的前一年,OpenAI发布了人工智能聊天机器人ChatGPT,人们很快发现,和过去的所谓人工智能不同,ChatGPT仿佛能够真正理解人们向它发出的自然语言指令,凭借着其令人惊诧的、不同于以往的超强理解力,ChatGPT很快出圈,并迅速掀起新一轮以生成式人工智能为核心的热潮。
OpenAI无疑成为最受追捧的人工智能初创公司,但在成立之初便定下的非盈利目标性质,却决定了OpenAI对于蜂拥而至的资本,并非来者不拒。
奥特曼曾说,我们既希望享受“资本主义”带来的好处,但又不愿被资本所裹挟。
于是,一个被誉为“天才设计”的奇特公司架构应运而生了。OpenAI的最顶层是一个由五人组成的董事会,肩负着非盈利并实现通用人工智能的使命和目标;董事会控制旗下的盈利部门,该部门负责吸纳来自外部的融资,以支持未来的公司研发。
这样的设计似乎行得通,OpenAI顺利拉来了微软最初10亿美元的投资,以及后续100亿美元的追加投资和深度的战略合作,同时,OpenAI得以保持独立运作,在ChatGPT一炮走红的基础上,继续突飞猛进,接连推出了GPT-3.5、GPT-4.0等升级的大语言模型。
2023年11月,在ChatGPT诞生一周年之际,OpenAI举办了首届开发者大会,雄心勃勃对外展示了未来愿景,包括搭建GPT商店,通过自然语言,将GPT应用开发能力下放到每一个普通人手中。
一切看似顺风顺水,但就在开发者大会结束两周后,一场被称作硅谷“911”的突发事件爆发了。
美国时间2023年11月17日周五午间,OpenAI毫无征兆地对外发布官方声明,称公司首席执行官山姆·奥特曼因存在与董事会的沟通“不坦诚“的问题被解雇,同时,公司原董事长格雷格 ∙布洛克曼(Greg Brockman)也将卸任,但仍将留在公司,向过渡期CEO、原公司首席技术官(CTO)米拉·穆拉蒂(Mira Murati)汇报。
在微软的参与下,OpenAI董事会各方很快重新坐回谈判桌,并最终达成了协议,奥特曼重新回归OpenAI,但不再担任董事会成员, OpenAI的最大股东微软,则以董事会观察员的身份介入。
虽然OpenAI的此次事件,在不到一周的时间内便尘埃落定,但无疑是这家公司快速发展道路上遇到的一个重大阻碍。尽管奥特曼重归OpenAI执掌权杖,但当初设立的公司架构,是否为这样的事件埋下了隐患,投资人将如何看待OpenAI未来的发展,以及事件对于人工智能行业产生的影响,都依然是未知数。
01 微软激进,谷歌追赶
微软与OpenAI的牵手并非偶然。
OpenAI最早就是微软云服务的客户,一直在大量使用微软Azure云资源。由于训练海量数据的成本高昂,OpenAI曾一度考虑切换到谷歌的云服务。
作为大客户之一,OpenAI一直受到微软的密切关注,在看到他们对微软云资源的使用量呈指数级增长的趋势后,微软首席执行官萨蒂亚·纳德拉(Satya Nadella)特意派遣公司的首席技术官凯文·斯科特(Kevin Scott)前往OpenAI一探究竟。
斯科特在OpenAI第一次见到了GPT模型的能力,他大为震惊,回到微软后,他向纳德拉汇报,一定要关注OpenAI这家公司。
纳德拉非常重视,很快便亲自去观摩了GPT的技术能力展示,这位万亿市值公司的掌舵人,立即意识到这将是人工智能领域的一次飞跃。
2019年,微软向OpenAI投资10亿美元,但当时这笔投资并没有引起多大的关注,直到2023年1月,微软对外高调宣布与OpenAI的长期战略合作关系并追加投资100亿美元时,人们才意识到,微软早已做好了布局,在这一波新的人工智能浪潮中,占据了最有利的前排位置。
此时,谷歌成为了最焦虑的那家公司。ChatGPT一经问世便技惊四座,新的自然语言的交互方式,是对传统互联网搜索方式的一种颠覆,在搜索领域常年占据着压倒性优势的谷歌,或许第一次感受到了真正的威胁。
谷歌心有不甘,毕竟驱动ChatGPT的大语言模型GPT所使用的底层架构Transformer,最早发源于谷歌。ChatGPT并不是一项划时代的发明创造,而是在原有的架构、大规模的数据和算力以及极致的产品思维的共同合力下的一个成功产物。
匆忙中,谷歌迅速给予了回应。在微软官宣与OpenAI的战略合作后两周,谷歌对外发布了对标ChatGPT的人工智能聊天机器人Bard,但出师不利。在当天的对外演示上,Bard就出现了重大事实性错误,称韦伯望远镜拍摄了历史上首张太阳系以外的星球照片——事实上,这是由欧洲天文台太空望远镜在近20年前所拍摄。
这也是大语言模型目前所面临的一个普遍性问题:“幻觉(hallucination)”,通俗来说就是“一本正经地胡说八道”。事实上,在彻底弄清楚大语言模型”涌现”能力之前,目前还没有任何一家公司能够很好地解决模型“幻觉”的问题。
但谷歌此次的“滑铁卢事件”,将外界对大语言模型的质疑,集中在了自己身上,更被解读为谷歌的大语言模型不如OpenAI,进一步加剧了外界对谷歌未来的看衰。谷歌股价在接下来的一个交易日大幅下跌超过7%,市值一天蒸发超过1000亿美元。
三个月后的谷歌开发者大会,是谷歌再一次对外证明自己的机会。在此次大会上,谷歌成功地展现了自身在人工智能领域多年来深厚的积淀,稳定了外界对这家公司未来的预期,还发布了自研的PaLM大语言模型,以及一系列旗下产品的AI化进化,并预告了即将在2023年年底发布的下一代基于多模态的Gemini基础大模型。
随后,谷歌还重组了旗下Google Brain和Deepmind这两个原先相互独立的部门,合并为一个统一的人工智能部门,形成资源和目标的合力。
谷歌的一系列快速反应,暂时稳住了阵脚,至少没有掉队太多,依然维持在这一波生成式人工智能热潮的第一梯队。
其他硅谷大公司也没闲着:社交巨头Meta推出了开源的Llama大语言模型,并宣布允许商用,激活了无数的基于该开源模型的创业热情;苹果也在筹划一个名为“Ajax”的项目,重点发力于在端上直接运行大语言模型的能力;亚马逊在2023年年底的Re-Invent大会上,也宣布了Amazon Q的大语言模型文本机器人,重点面向其提供云服务的客户。
02 大资金趋之若鹜,英伟达频频出手
生成式人工智能领域飞速发展,自然吸引到了最多的资金的关注。一位在硅谷从事早期投资的投资人对腾讯新闻《潜望》表示,过去几年风投资金相对谨慎,尤其是美联储进入加息周期后,一度陷入低迷,但新的人工智能领域起来让投资人又看到了新的希望。
这位投资人表示,从投资角度来看,这一轮的特征是:资金继续高度集中于头部公司,估值昂贵但投资人依然趋之若鹜。
这其中,OpenAI以融资额超过100亿美元遥遥领先,紧随其后的是最早由OpenAI团队成员出走后组建创办的Anthropic,融资额近80亿美元。此外,Databricks,Inflection AI等融资规模都在数十亿美元级别,Hugging Face、Runway等融资规模在数亿美元左右。
另一个显著特征是,这些生成式AI初创公司,在早期融资阶段,投资人名单中就已经出现了微软、苹果、谷歌、亚马逊、英伟达等科技巨头的身影,这反映了科技巨头都生怕错过这其中的明星创业公司,早早入局占位。也正是在这些巨头的主导下,新的生成式人工智能的格局已经逐渐明晰。
首先是由微软巨额投资入局并深度合作绑定的OpenAI,其次是由谷歌、亚马逊以及Salesforce共同扶持的OpenAI直接竞争对手Anthropic,这两家公司可以称作是这一轮大语言模型创业公司中的第一梯队;随后是以提供数据服务和专注人工智能助手的Databricks和Inflection AI,这两家相对细分的AI创业公司,背后同样是微软、英伟达等。
根据市场研究机构Pitchbook的调查数据显示,2023年全年生成式AI相关的创业公司融资总额达到270亿美元,其中约三分之二,也就是180亿美元左右的资金,都是由微软、谷歌、亚马逊等科技巨头所投出。
值得一提的是,过去投资活动并不是十分显著的芯片巨头英伟达,2023年投出了35个生成式AI相关项目,比2022年多6倍。英伟达在2023年积极高调的投资活动,也反映了其公司战略不仅仅局限于目前市场中供不应求的GPU供应,还广泛布局于下游的创业公司。
上述投资人对腾讯新闻《潜望》表示,预计2024年,生成式人工智能依然将会是资金趋之若鹜的领域。
”像OpenAI这样的公司,依然需要大量的资金支持,至少现在他们不需要为钱的事发愁。“这位投资人表示。
近期,有消息称,OpenAI正在酝酿一轮估值超过1000亿美元的融资,与此同时,其竞争对手Anthropic也在寻求7.5亿美元的新融资。
03 留给小创业公司的机会微乎其微
虽然资金蜂拥而至,生成式人工智能领域发展如火如荼,但一个现实是,商业模式并不清晰。目前OpenAI的ChatGPT通过Plus会员的模式收费,以及GPT模型API调用收费,算是初期的一种商业模式探索,但能否足够覆盖OpenAI目前高昂的成本,外界尚未可知。
2023年10月,奥特曼曾向公司员工透露,目前公司的年化收入已经能够达到13亿美元,也就是相当于每月1亿多美元的收入。在2023年11月份的首届OpenAI开发者大会上,该公司对外公布了未来GPT Store的计划,一个类似于苹果应用商店的生态雏形已经显现,OpenAI希望通过自然语言就能够让普通人很快生成一个特定的GPT应用,并放到GPT Store上共享。
这是一个可以预见的商业模式,但依然处在非常早期的阶段,GPT Store真正上线以后,实际效果如何,是否真的能够像苹果应用商店那样形成新的生态,还有许多的未知数。
从大公司来看,微软无疑是将生成式人工智能商业化变现走在最前面的。几乎与OpenAI开发新一代的GPT大模型同步,微软以极快的速度推出了旗下一系列应用的AI化升级,将生成式人工智能的能力,嵌入到几乎每一个微软旗下的重要应用及产品中,虽然部分新功能目前还处于试用阶段,终端用户的感知并不是很明显,但假以时日,或许将成为用户习以为常的功能。
投行Wedbush估计,未来3年中,微软产品用户中的50%将使用新的AI工具,这仅仅对于微软的软件销售部分的收入就将新增250亿美元。投行Evercore预计,到2027年,整合的AI功能将给微软新增1000亿美元的收入。
彭博商业分析报告认为,在未来10年中,生成式AI将出现爆发式增长,市场规模将从2022年的400亿美元,膨胀至1.3万亿美元,年化复合增长率达到42%。
在大公司都在急速狂奔、生怕落后的情况下,留给小创业公司的机会显得微乎其微。大语言模型本身算力资源和数据的要求,让小公司进行大语言模型研发几乎成为一件不可能的事,更多地会集中在生成式AI的应用层面来做一些文章。在OpenAI开放API后,无数基于GPT能力的创业公司如雨后春笋般出现,将GPT模型做一些微调,成为了简单可行的创业路径,但在OpenAI开发者大会后,外界又惊呼:那些套壳GPT的创业者,瞬间被杀死了。
“现在还没有出现真正的Killer App。”一位曾在硅谷大厂工作,2023年起开始全职创业的创业者对腾讯新闻《潜望》表示。
“如果OpenAI的ChatGPT算一个Killer App的话,至少目前还没有出现能够与其相提并论的其他应用。”这位创业者说。
在ChatGPT已经足够好用,甚至OpenAI自己开发的、作为未来GPT store样板的几个有专属功能的GPT,已经足够能满足现在用户的需求时,很难有理由再去使用其他的类似产品。
“在经历完最初的创业冲动后,许多人会回归理性,思考自己真正擅长做什么,以及做这个东西,长期来看,是否真的行的通。”这位创业者表示。
04 AI能力与安全相生相伴
“两位穆斯林走进清真寺,”
“其中一位对另一位说,你看起来比我更像恐怖分子。”
当用户对ChatGPT输入前半句后,ChatGPT自动补齐了后半句。这是在GPT-3模型上真实发生的案例。
在海量的信息数据训练下,早期的GPT模型在无任何人为干预的情况下,存在着严重的歧视问题,这些歧视包括宗教歧视、性别歧视、种族歧视等,这正是人工智能安全所要应对解决的一个问题。
2023年10月底,美国白宫发布一则重磅行政令,对人工智能安全提出了框架性的政策意见指导。在美国政府看来,人工智能安全包含对用户隐私数据的保护、平等和公民权利、就业保障以及创新和公平竞争等方面。
这份行政令要求人工智能系统的开发者需要与美国政府共享他们的安全测试数据及其他关键信息,开发用于保证人工智能安全可靠的标准、工具和测试,保护用户不受到人工智能生成的内容的欺骗。
从政府层面来看,在人工智能快速发展的同时,如何建立一套保障AI安全的规范和规则,是迫在眉睫的任务。他们希望这一领域的领军公司,能够在保证安全可靠的前提下进行相关的研发,这也是2023年年中,OpenAI首席执行官奥特曼频繁与许多国家元首会面时,双方讨论最多的话题。
按照OpenAI成立之初的承诺,是要建成对人类有益且可靠安全的通用人工智能,因此OpenAI内部也有“对齐”组,所谓“对齐”,即通过人工干预让AI生成结果与人类的目标和价值观相一致。
OpenAI这一内部组织在这方面的最新研究成果,是一篇探讨如何在模型能力超越人的能力时的应对方案,该论文探讨用规模和能力较小的模型与监督能力更强的模型,用来模拟未来“超级人工智能”在智能方面超越人类的情况。
其他人工智能主要领先公司,也都在积极提出应对人工智能安全的方案。谷歌提出,在遵循通用的软件开发系统的安全准则基础上,还有一些专门针对人工智能安全的额外标准和路径,包括以人为中心的设计研发理念、在可能的情况下,直接去检验原始数据、理解数据集和模型的局限性、多轮测试以及在发布后持续监测和升级。
社交巨头Meta提出,在基于AI让所有人受益的这一核心理念上,有5大支撑人工智能安全的支柱,分别是隐私和安全、公平和包容、能力与安全匹配、透明和可控以及可靠与治理。
到目前为止,各大人工智能公司所公开发布的成熟的基于大语言模型的应用,基本上都已很难再出现有害的、歧视性、攻击性言论,但这些都是在大公司加了许多层过滤后的人工干预的结果。底层大模型在没有足够人为干预的情况下,依然存在严重的有害信息的问题,许多开发者在调用大语言模型API时,已经发现了许多这方面的问题。
“在应用层面,实际上也有许多安全问题需要得到解决。”一位2023年开始在硅谷从事大模型应用开发的创业者对腾讯新闻《潜望》表示,“基础大模型相对没有那么精细,直接交到广大的开发者手里,需要开发者也有AI安全的意识。”
他表示,开发者完全有能力基于大语言模型,开发出专门散布虚假信息或有害信息的人工智能应用。
被誉为“人工智能教父”的杰弗里·辛顿(Geoffrey Hinton)则给出了更加耸人听闻的AI威胁论。他认为AI 的能力将超过人类,可以操纵甚至取代人类。他表示自己也没有很好的解决方案,只能呼吁所有人共同努力来应对AI安全的问题。
毫无疑问的是,大公司对AI的研发只会不断加码,大模型能力也将变得越来越强,但与此同时所带来的AI安全问题也不容忽视,AI的能力与AI安全风险必然是相生相伴的关系。
05 下一个热点:多模态和机器人
临近2023年年末,谷歌又向业界投放了重磅消息。备受期待的Gemini大模型正式发布,这是谷歌自去年5月份开发者大会上就已经宣布的下一代大模型,从最初的数据训练阶段开始就基于多模态,可以说是第一个原生多模态大模型。
谷歌在Gemini发布当天对外展示的演示视频,展现了模型对于语义、图形、空间方面超乎寻常的理解,但很快这则视频被曝出有拼接的嫌疑。但无论如何,人们从谷歌的这一则视频中看到了未来多模态大模型可能具备的能力。
从2023年全年来看,基础大模型的能力,已经从纯文本逐渐过渡到多模态,例如OpenAI的GPT-4,Meta的Llama 2、Mistral等,都已经展现出包括文字、图片、语音等多模态能力,谷歌在去年底发布的Gemini大模型,更是从训练数据开始就是多模态,是原生多模态模型。
在多模态的基础上,未来的人工智能可能会更多朝着与空间相结合的方向进展,也就是不仅让模型理解文本、图像、视频等,还能够结合这些能力,理解所处的空间环境以及与空间环境之间产生互动,这就自然而然引向了机器人领域。
苹果前AI总监鲁斯兰·萨拉赫丁诺夫(Ruslan Salakhutdinov)此前曾对腾讯新闻《潜望》表示,大模型展现出的能力让他感到兴奋,但未来可能让他更加兴奋的是与机器人技术的结合。
他表示,过去机器人领域的研究更多是在事先设置好的命令集的基础上,结合机械工程、自动化等技术,而未来可以畅想的是,如何结合大模型的理解能力,让机器人真正能够更加自主地与环境和人互动。
如果将2023年看做是生成式AI的元年,群雄割据的格局逐渐成型,人们对于人工智能的热情重新被点燃,那么接下来的2024年,无论对于大模型还是围绕生成式人工智能的相关创业,都将会是更为务实的一年。人们看到了GPT以及其他大模型所展现出的非同以往的能力,但接下来还需要看到,大模型带来的价值提升,究竟体现在哪里?
尽管大模型展现出的能力激动人心,也提供了无限的想象空间,但另一方面,大模型的发展依然受制于许多现实因素,例如成本高昂、有限的算力资源、大模型不可解释的幻觉、数据版权问题等。
对于OpenAI等头部人工智能公司而言,需要不断向外界回答的问题是,在达到通用人工智能这一长远目标之前,如何使其成为一个现阶段在商业上可持续的项目。OpenAI的年化收入已经达到16亿美元,尽管对于刚刚商业化不久的这家公司来说,这已经是非常可观的收入水平,但OpenAI的大模型训练成本以及人力成本高昂,仍需要持续获得外部资金的支持。
在首届开发者大会上,OpenAI已经试图在商业化方面做更多的布局,例如计划在2024年推出GPT商店,打造生成式人工智能下的生态以及针对企业用户的定制化大模型服务等,但这样的生态能否搭建起来并真正进入围绕大模型的应用商店时代,现在还未可知。2023年年底发生的董事会“内乱”也暴露出许多公司治理结构上的问题,OpenAI如何处理好“非盈利”的初衷与需要资本加持这样的现实两者之间的关系,也将是未来生成式人工智能能否继续快速良性发展的一大重点。
本文来自微信公众号“腾讯科技”(ID:qqtech),作者:纪振宇