还记得红遍网路的 ALOHA 家务机器人吗?最近计画导师史丹佛电脑科学与电机工程系教授 Chelsea Finn 在 X 宣布,与其他柏克莱大神学者、Google DeepMind 科学家共同创业,全力为机器人打造智慧大脑。
新公司名叫Physical Intelligence,简称Pi或π,目标是开发「为各种机械设备添加高级智慧的软体」,最终构建控制任何机器人执行任何任务的通用AI模型。Chelsea Finn解释这极具挑战性,需整合机器人跨平台策略、从视觉和语言模型迁移学习,并透过模仿学习掌握灵活技能。
共同创办人兼CEO Karol Hausman也兴奋表示,收集前所未见机器人数据,改进演算法和训练超大模型,攻坚一切将AI引入物理世界所需的技术。为此他们组建一支「世界级团队」,迫不及待开始这趟新冒险。
创立不到一个月,Pi已被OpenAI和早期投资者Khosla Ventures、美国红杉资本、Lux Capital等多家创投机构提前锁定,拿下7千万美元高额融资,这不仅因为公司机器人赛道前景无比看好,更代表对创始团队实力充满信心。
十人团队,人均大神,一位华人成员
Pi官网介绍是「Physical Intelligence是将通用人工智慧带入物理世界的新公司」。「我们是一群工程师、科学家、机器人学家和公司创建者,正在开发驱动当今机器人和未来实体设备的基础模型及学习演算法。现在还处於初期阶段,欢迎有兴趣的夥伴加入! 」
成员目前只有十人:Michael Equi、Adnan Esmail、Chelsea Finn、Lachy Groom、Karol Hausman、Brian Ichter、Sergey Levine、Suraj Nair、Lucy Shi、Quan Vuong。虽然展示方法「太朴素」,但团队阵容其实相当豪华,几乎都是大神。加入Pi以前,各自都有不小研发成果,好几位都是业界响当当的名号。
首先是Chelsea Finn和Karol Hausman的另一位联创Sergey Levine。
Sergey Levine现任UC Berkley电机工程与电脑科学系助理教授,专注研究自主智慧体透过学习获复杂行为的通用演算法,集中机器学习决策与控制领域,并开发点到点深度神经网路训练策略,曾带领团队与Google共同开发RT-X机器人专案,是强化学习领域的领头者之一。
(Source:MIT Technology Review)
然而让这男人扬名立万的是「学术狂魔」之名。Sergey LevineGoogle学术引用量超过13万,顶级国际会议和期刊发表过大量研究论文,接收量长期居前,且经常霸榜。
如NeurIPS 2019和2020他分别有12篇论文采纳,名列NeurIPS榜单第一。2019年ICML论文采纳量并列第二。2022年更是投稿ICML 30篇论文,并以16篇采纳量断崖式登顶作者Top1,简直是令人闻风丧胆的「论文收割机」!
此外,Sergey Levine还是柏克莱人气超高的「网红教授」,成就十分突出。他开设的深度学习课程(Deep Reinforcement Learning,代号CS285)在学生中反应极为热烈,很受欢迎。线上影片YouTube和Bilibili都可以观看,广为传播。
新公司Pi「创业声明」他说,希望为机器人领域带来类似「大语言模型之於自然语言处理」等通用解决方案。「过去我们多次看到,机器学习在大资料库与小资料库的问题大不相同。我们研究很有实用性价值,相信也会为基础研究突破打开大门。」
开头的提到的Chelsea Finn也是共同创办人之一。她从MIT大学毕业後在柏克莱取得博士学位,介绍学习演算法毕业论文获2018年ACM博士论文奖,指导老师就有Sergey Levine。
(Source:Chelsea Finn)
目前Chelsea Finn担任史丹佛大学电脑科学和电机工程助理教授,专注学习和互动发展机器人等智能体等广泛智慧行为。如点到点视觉感知和机器人操控,从经验学习通用技能,以及快速学习新概念和行为学习演算法等。
Chelsea的Google学术引用量虽没有Sergey多但也很突出,超过4.9万次。她也曾在Google Brain担任五年研究科学家,开发机器人深度预测模型。
Pi执行长Karol Hausman是Google Brain高阶科学家,同时也是史丹佛大学兼任教授,兴趣为使机器人在真实世界以最小监督自动习得通用技能,并因「对可扩展的机器人学习演算法做出重大贡献」获2023年IEEE机器人与自动化学会行业职业奖。
(Source:Karol Hausman)
除了这三位,还有擅长机器人运动规划和基础模型的前Google研究科学家Brian Ichter;巴基斯坦裔杰出工程师、特斯拉前自动驾驶和硬体专家(设计Model X独特的上翘式猎鹰门)、Anduril Industries高级副总裁兼电气工程负责人Anduril Industries;Chelsea得意门生、丰田研究所机器学习、机器人学和计算机视觉研究科学家Suraj Nair;以及支付公司Stripe前高层、着名科技投资人Lachy Groom等业界大牛。
这份名单还有一位华人成员Lucy Shi,来自人大附中,取得USC电脑科学学士学位,现为史丹佛学生研究员,由Chelsea Finn教授指导。曾与NVIDIA 资深研究科学家兼通用具身智慧团队负责人Yoke Zhu和资深研发经理Jim Fan合作。
最近她刚於X公开史丹佛与柏克莱合作的Yell At Your Robot(YAY Robot)计画,展示机器人从语音纠正即时改进,据人类口语回馈学习提升,执行灵巧操作任务的研究成果。
Lucy Shi个人页面分享以「第一位实习生」身分加入Physical Intelligence的讯息。自我介绍写道:「我对机器人学习有广泛兴趣,研究目标是创造通用型机器人,在日常生活无缝执行复杂长期任务……我深信人类的创造力和人工智慧的潜力。未来20年,我希望成为大学教授,建立新贝尔实验室──这改变世界的创新思想工厂。」
让我们欣喜看到又一位智慧与理想兼具、前途无量的年轻学者。
迎面而上的智慧机器人大脑缔造者
科幻小说和电影,人们总梦想有真正听懂需求的机器人,它会思考、有情绪,陪伴我们,帮助解决生活种种难题,像朋友全能。然而现实机器人虽说可在工厂搬运重物、打扫家里,但与日益通用化的聊天机器人相比,能执行的任务范围相对局限。
Chatbot和LLM崛起得益於网路语料的大量资料。OpenAI和Google可透过喂养大语言模型数十亿人类语言样本训练,但从真实世界收集类似规模资料极其困难,这也限制近年人工智慧对物理机器人的进步。
Physical Intelligence认为,现在正是采用新方法推广通用型机器人的好时机。
Figure 01透过接入ChatGPT做到人形机器人智慧化「看听说」互动,让人们看到大模型与机器人结合的巨大潜力。Pi也希望建构语言模型的先进技术与自家机器控制和指令结合,创建任何硬体、任何平台可用,有广泛任务执行能力的通用人工智慧系统。
团队表示,Pi并不专注特定类型的机械手臂或工业机器人,而是开发用於多种型机器人的软体。他们也不会制造硬体,创业後第一步是解决工程问题、搭建模型,以及购买各种机器人训练,目的就是积累迄今最大规模机器人数据。
Karol Hausman接受公开采访时强调,团队要开发通用模型,将人工智慧从电脑带入物理世界,「它能为任何硬体设备提供动力,任何应用。」这显然不只是Pi的愿景,除了Figure AI和特斯拉等对手竞争,几十年来,人们也一直努力改进驱动机器人的软体。
Pi宣布成立同周,有七年历史、知名AI科学家Pieter Abbeel和三位博士生创立的Covariant公司就推出基础模型RFM-1,提供类似ChatGPT的语言理解和生成能力。经过一般网路资料和丰富现实世界互动资料的共同训练,RFM-1可让机器人理解自然语言指令并产生正确动作,并能处理突发状况,获得大量好评。
如今强强联合,正式上战场的Pi,到了将团队多年潜心累积的卓越成果集大成的时候了。加上OpenAI支持,能否凑齐龙珠召唤神龙,推动通用机器人开启新时代?
「我们的目标是帮机器取得人类的基本能力。」Lachy Groom 说,「我认为建造人形机器人非常酷,但其实让人类有趣的是大脑,而不是硬体──我们才是终极通才。」
(本文由 品玩 授权转载;首图来源:shutterstock)