通过通用模型将人工智能带入物理世界
近日,一家官宣靠推特、连官网都没做好的公司——Physical Intelligence(简称Pi,π),却凭借7000万美元的融资“光荣出道”,连OpenAI、红杉资本等重量级投资机构都纷纷押注。
如今,想要在人满为患的AI赛道里出头堪比“地狱级难度”,更不要说得到“AI顶流”和风投巨头的首肯注资。
来势汹汹的Pi,究竟有什么独特魅力,引得业界大佬竞相抛出橄榄枝?
答案或许就藏在它的创业理念之中:将通用人工智能引入物理世界,为机器人或任何物理设备构筑大脑、提供动力。
天才云集的超级团队
点开Physical Intelligence官网,你会发现除了一则公告外什么都找不到,简陋得宛如毛胚房。
官方账号也只发了4条消息,看起来似乎平平无奇,主打一个神秘主义。但点开关注列表,才发现:鲁莽了。
斯坦福大学教授、加州大学伯克利分校教授、DeepMind研究员、Google Brain科学家……可谓群星闪耀,我以为的“天降紫微星”,原来是AI大牛们攒的高端局。
公司联合创始人兼CEO是Karol Hausman,曾是DeepMind资深科学家,也是斯坦福大学兼职教授,主要研究如何帮助机器人在现实世界获得通用技能,曾引起广泛热议、被成为机器人界“ChatGPT”的RT-2、RT-X模型,也有他的参与。
公司另一位联合创始人Sergey Levine,是斯坦福计算科学博士、加州大学伯克利分下电气工程与计算机科学系的“网红教授”,也曾在谷歌工作,是深度强化学习领域的“顶刊狂魔”,研究引用量超12.7万次。
并肩作战的,还有曾先后在谷歌Brain、DeepMind团队任职的Brian Ichter;曾在谷歌Brain任职的斯坦福助理教授Chelsea Finn;DeepMind前研究员王权;丰田研究院ML团队前科学家Suraj Nair;以及知名投资人Lachy Groom也将为Pi未来的商业化提供独到见解和宝贵经验。
“造物主”为机器人“造脑”
通用人工智能一直是学界所憧憬的终极目标,与狭义人工智能只能在特定领域发挥作用不同,通用人工智能能够应对并学习广泛的任务,甚至应对当前还不存在的任务。
Pi的宏伟愿景是为机器人构建"大脑",赋予它们通用的智能。就像大语言模型为自然语言处理带来了革命性的进步一样,Pi希望开发出一种通用的人工智能模型,能像人类大脑那样,不仅能理解语言,还能操控机器人在现实世界中完成各种任务。
然而,要实现这一宏愿并非易事。
虽然近年来自然语言处理等领域的人工智能取得了长足进步,但机器人领域的发展依然相对滞后。主要原因在于,与可借助海量文本训练语言模型不同,机器人需要从物理世界采集训练数据,这个过程无疑更加耗时耗力。
过去,虽然也有公司尝试开发通用的机器人软件,但都未能取得根本性的突破。比如Willow Garage公司曾在2006年成立,致力于构建可在多个机器人平台之间共享的软件系统,但最终在2014年结束了业务。
因此,Pi的首要任务就是突破这一瓶颈,并计划从规模化、通用化这两个关键领域着手。
首先是收集规模更大、多元更丰富的机器人数据集。正如该公司联合创始人Karol Hausman所言:"我们的目标是通过一个通用模型将人工智能带入物理世界,这个模型可以为任何机器人或任何物理设备提供动力,基本上适用于任何应用程序。"有了大规模数据的支撑,AI模型将能从中学习到更多知识和技能。
其次是通用化。传统的机器人系统往往是为特定场景和任务而量身定制的,缺乏通用性。Pi希望开发出一种能够适用于各种机器人平台、各种物理环境和任务的基础模型,这就需要创新的模型架构和训练算法,将机器人控制和大型多模态模型训练相结合。
融资阵容惊人
据知情人士透露,Pi目前已从Thrive Capital、OpenAI、红杉资本、Greenoaks Capital Partners、Lux Capital 和 Khosla Ventures 筹集了 7000 万美元。
其中,OpenAI和红杉资本的身影最为瞩目。OpenAI最为当前人工智能领域炙手可热的“辣子鸡”,明显已不限于“非营利组织”的初心,正不断向外扩张版图,建造自己的商业王国,作为当前AI技术力的代名词,其投资标的也代表了最前沿的技术方向。
另外,OpenAI的最大股东之一Thrive Capital和Vinod Khosla也在投资人行列中。OpenAI的联合创始人萨姆·奥特曼和Khosla有着千丝万缕的联系,这或许也为PI背后的投资阵容提供了一些线索。
而红杉作为硅谷最知名的顶级风投之一,虽然“得红杉者得天下”的话过于夸张,但能得到红杉看好,足以证明Pi有两把刷子。
不过,Pi面临的竞争也不容忽视。同样致力于开发通用人形机器人的Figure公司,不久前刚从英伟达、OpenAI等巨头那里筹集了高达6.75亿美元的天价融资,估值飙升至26亿美元。不难看出,在机器人AI这个新兴领域,一场巨头争夺战已经打响。
技术路线颇受争议
尽管Pi的远大目标和资金实力令人矍目,但它所走的技术路线却也饱受争议。
根据披露信息,Pi计划购买各种现成的机器人硬件平台,然后在上面训练自己的AI模型,而不是自主研发机器人硬件。这种"买现成统一标准"的做法是否能最终实现通用智能,存在很大疑问。毕竟机器人硬件的差异性很大,统一训练或许难以充分发掘每个平台的性能潜力。
相比之下,一些竞争对手如Figure AI则选择自主研发机器人硬件,并与软件相结合。这种"软硬件一体化"的路线或许更有利于最终实现通用智能,但代价是成本和周期都大大增加。
另一个值得关注的争议是,Pi决定暂时搁置类人型机器人的研发重心。相比之下,Figure等竞争对手则豪赌于让机器人能够像人类一样行动和思考。到底是否需要追求拟人化,目前也没有定论。
Pi联合创始人之一的Lachy Groom曾表示“我认为,人们用人形机器人构建的东西真的很酷,但从根本上来说,让人类变得有趣的是大脑,而不是我们的硬件。”他们认为,通过教会任何形态和构造的机器人学习,才是解决根本问题的办法。
写在最后
在人工智能领域,语言模型无疑是近年来最耀眼的明星。从ChatGPT到如今的万模大战,大语言模型的惊人表现让全世界看到了人工智能的巨大潜力。然而,要真正实现人工通用智能的梦想,仅凭语言世界是远远不够的。物理世界才是人工智能需要真正征服的领域。
Physical Intelligence的诞生,传递出AI从虚拟世界向物理世界延伸的强烈信号。或许这将成为一个里程碑式的转折点,预示着机器将掌控现实,为人类带来全新的科技革命体验。
Pi当前走的路,是AI的最后疆域,是一条道阻且长的崎岖之路。机器人系统大脑何日激荡现实?我们只能拭目以待,希望这支由顶尖人才组成的团队能不负众望,在人工智能征途上书写浓重的一笔
上一篇:人形机器人掀起家庭服务新浪潮
下一篇:匹兹堡机器人网络任命新董事会成员
- 使用 Cypress Semiconductor 的 MB3793-27D 的参考设计
- 使用 Analog Devices 的 LT8609SIV 的参考设计
- LT3755IUD-2 降压模式 1.4A LED 驱动器的典型应用电路
- EVL6564H-25W-BB、使用 L6564H 的 25W 宽范围高功率因数降压-升压转换器演示板
- AD587JNZ 低功耗电压基准、12 位 CMOS DAC 应用的典型应用电路
- SC431可调并联稳压器的典型应用
- TPA6120桌面耳放
- 使用 NXP Semiconductors 的 MC32BC3770CS 的参考设计
- LT3970EDDB-3.42 5V 同步降压转换器的典型应用
- LTC1650CS 低毛刺 16 位电压输出 DAC 的典型应用电路