目前,还有不少企业因成本和安全性问题仍对生成式 犹豫不决。但时间不等人,随着 Google、率先入局,国产的达闼、追觅乃至稚晖君创业的「智元(AGIBot)」紧随进场,还有前段时间很火的斯坦福大学「炒菜机器人」,AI 已经逐渐掀开了机器人技术革命的帷幕。
当地时间 3 月 13 日,一家仅成立不足两年却已估值 26 亿美元的机器人创业 Figure 引爆了 AI 圈。这家公司的团队成员曾供职于波士顿动力、特斯拉、谷歌 DeepMind 及 Archer Aviation 等机构,他们在昨天首次公开展示了与新晋投资者及战略伙伴—— OpenAI 的合作成果,其表现令人赞叹不已。
Figure 公司的联合创始人兼 CEO Brett ock 在 X 上发布了 Figure 01(读作“Figure One”)这款「全尺寸人形机器人」的演示,展现出其与周边人类及环境进行交互的能力。视频中,Figure One 成功按照人类指示行动,找到并递送一只苹果,实时描述自身动作,并与人进行交流(目前看来,其响应速度相较于正常人与人间对话略显滞后),还能够独立识别、策划并实施有用的行动(比如清理垃圾并将餐具放入沥水架)。
这段视频的整体观感堪称“科幻片”,甚至给人一种毛骨悚然的氛围感。开场时,人类向 Figure One 发问:“嘿,Figure One,你现在能看到什么呢?”
Figure One 则迅速回应:“我看到桌子中间盘子里有一个红苹果,旁边有个挂着杯子和盘子的沥水架,还有你站在边上,手搭在桌子上。”
人类接着询问:“那能给我找点吃的吗?”
Figure One 自信回应:“没问题。”随后精确而稳当地抓取苹果递给人类,识别出眼前唯一可供食用的对象,无需人类具体指定。
视频接下来的画面则是 Figure 机器人将地面垃圾捡起,并有序地把盘子和杯子放入沥水架内的过程。众星捧月
GPT+机器人的这个组合可谓来得迅猛。
3 月 1 日,OpenAI 与总部位于加利福尼亚州的机器人初创企业 Figure 建立新的合作关系,计划将其大模型技术集成到人形机器人中,标志着 AI 开始迈向实体化应用的新阶段。
在这场合作中,Figure 成功获得了 6.75 亿美元的风险投资资金,使得其资本估值达到 26 亿美元。除了 OpenAI,Figure 的投资方涵盖了微软、、创新基金等巨头,同时还有杰夫·贝索斯的一笔额外投资。其他主要投资者还包括 Parkway Venture Catal、 Capital、Align Ventures 以及 ARK Invest。
其中,Parkway Venture Capital 是最早看到 Figure 潜力的投资者之一,在 2023 年向 Figure 注资 7000 万美元。
此外,在和微软的合作中,还让 Figure 得到了微软云这一“神兵利器”。这家初创公司可以直接利用 Microsoft Azure 进行基础设施、培训和存储,甚至访问微软的人工智能基础设施和服务,以支持人形机器人的部署,从而协助完成现实世界的应用程序。
目标驾驭十亿算力
cock 在推文中透露:“Figure 机器人搭载的摄像头所捕捉的画面输入到由 OpenAI 训练的一个大型视觉语言模型(VLM)中。”
但目前尚不清楚这个模型是 GPT-4 的某种版本,还是对现有模型进行微调后的版本,抑或是全新的模型——比如很多人在 OpenAI 官推下“逼问”了一整个月的 GPT-4.5 Turbo。
令人印象深刻的是,Adcock 还指出:“视频展示的是端到端的系统。背后没有任何远程操控。此外,这段视频是以 1.0x 的真实速度连续拍摄的。”
这段演示视频中的机器人能和人自然交流、听从指令、理解需求,并且动作流畅度远超以往许多同类公司和研究团队所展示的样品。而且,目前这还只是一个演示阶段的 Demo,离真正达到商业化标准并推向企业和个人市场,还需要大量的后续开发工作。
Adcock 在推文中还立志“训练一个世界级的人工智能模型,使其能够驾驭十亿级别的计算能力去操控人形机器人。”
在Figure 公司的官网上,Adcock 也阐述了他的宏大蓝图——事实上,官网真的有一个叫作“宏大蓝图”(Master Plan)的页面:“Figure 旨在研发出能对人类生活产生积极影响、为后代创造更美好生活环境的通用型人形机器人。这类机器人有望消除那些既危险又不受欢迎的工作,从而让我们拥有更加幸福、更有价值的生活。”
他同时也不忘强调:“达成这一愿景需要数十年的努力,组建一支矢志不渝追求这一使命的顶尖团队,投入数十亿美元的资金,并通过工程技术创新来实现大规模的市场影响力。我们当前面临的风险极高,成功的可能性相对较低。”
在 OpenAI 的技术支持下,Figure 无疑将给包括特斯拉、亚马逊和众多初创企业在内竞争对手带来压力。与此同时,这个赛道甚至仍在不断涌入新玩家,例如本周刚刚成立的Physical Intelligence 以及众多熟悉的 Hugging Face公司。
审核编辑:刘清
- 【单片机】 N32G430C8L7开发板
- 使用 Analog Devices 的 LTC1775CS 的参考设计
- 蜗牛C机箱专用CSPS转ATX模块
- 具有关断功能的 LT1086CM-3.6 5V 稳压器的典型应用
- 使用 NXP Semiconductors 的 TEA1523 的参考设计
- SLWSTK6020B,基于 EFR32BG13 无线 SoC 的 EFR32 Blue Gecko 蓝牙入门套件
- 基于 LT3024 的设计电路用于对稳压器的启动进行排序
- pi断连重启
- LT8705AIFE 12V、15A 输出转换器的典型应用接受 7.5V 至 55V 输入
- STR-FUSB3307MPX-PPS-GEVK:带 PPS 板的 Strata Enabled FUSB3307 单端口 USB-PD