个人场外配资 从春晚舞台跳舞到实际场景干活,这家公司将马斯克的设想变为现实

作者|Li Yuan
编辑| 郑玄
今年春晚的舞台,差不多被机器人给占了。
热闹是挺热闹的,但我盯着看,发现一个挺有意思的变化。和去年那些机器人比起来,今年登台的,好多都长出了手。
沈腾和马丽那个节目,《我最难忘的今宵》,镜头就对着那双手停了老半天。盘核桃,串烤肠,拿东西放东西,动作细得很。
这么一来,机器人的感觉就变了。不那么像机器,倒有点人干活的那个意思了。
人形机器人火了一年,可总有人问,它们真能干活吗。这个问题问得挺对。能不能干活,关键就看那双手。一双能量产、靠得住、够灵巧的手,才是分界线。
造手这件事,其实比造个机器人身子骨难多了。
马斯克聊过这个难题,他说一半以上的工程麻烦,都出在手上。2025年9月,The Information也爆过料,说特斯拉机器人量产一直往后推,卡就卡在灵巧手的设计上。
手为什么这么要命。按人体运动模型那种算法,全身常用的活动关节大概八十个,一只手就占了二十多个。两只手加起来超过四十,比一半还多。
人手不光能动得复杂,还能摸出感觉。高自由度的力道控制,加上触觉,全要塞进巴掌大的地方。这简直是逼着工程师挑战极限。
春晚那双手,差不多把大家对灵巧手的想象都给演出来了。
我顺着镜头往下挖,发现一个更有意思的事。那双手,不是银河通用自己做的。它来自一家平时几乎听不到声音的公司,Sharpa。
Sharpa背后的故事,可能比台上那些机器人打架更有看头。
01
神秘低调的行业大佬终于站在聚光灯下
在这个圈子里,Sharpa一直有点神神秘秘的。
我第一次注意到这家公司,是在2025年5月的ICRA。那是机器人领域的一个顶级学术会议。
那时候,好多人的心思还在机器人走路别摔跤这件事上。少数意识到灵巧操作有多重要的人,觉得高自由度的灵巧手离稳定可靠还远着呢,几乎有点没指望。Sharpa就在这个时候冒出来了,或者说,是硬生生挤进了大家的视线。他们的展位,成了现场最抓眼球的那个。
ICRA展会上,Sharpa做了一件让很多人愣住的事。它从一副牌里,单独抽出了一张牌。不是抓,是抽。这个动作在当时的灵巧手领域,几乎没人见过。它不再只是完成一个设定好的抓握指令,它开始进入需要实时判断和精细反馈的真实互动了。现场的人心里都清楚,这东西,已经是全球最好的灵巧手之一。
评价高,主要高在两个地方。一是它对高自由度手指的稳定控制,那么多关节,动起来却一点不散。二是它解决了触觉这个老大难问题。它的指尖塞进去超过一千个触觉单元,密密麻麻排成阵列,能分辨出小到五毫牛的力。五毫牛是什么概念,差不多是半克重量的东西放在上面带来的压力变化。它能感觉到这个。
触觉才是那双真正的眼睛。
没有它,再灵巧的手也像得了帕金森。
我们生活里太多精细活其实不靠看。扣纽扣的时候,谁还盯着那个小孔呢。指尖蹭过布料,摸到纽扣边缘的弧度,位置就对了。拉拉链也是,卡扣对没对上,滑得顺不顺,手指头一碰就知道。稍微有点涩,力道自己就收住了。
就连翻书页这么简单的事,也得靠触觉来拿捏那个劲。多一分怕撕了,少一分翻不动。
这些事眼睛帮不上什么忙。
或者说,视觉在这里退居二线了。它给出一个大概的方位,剩下的全部交给手指尖去感受和判断。那是一种更直接、更底层的对话,发生在皮肤和物体表面之间。我们习惯了,甚至意识不到这个过程有多复杂。机器要理解这个,得从另一个维度去重建感知。不是看见,是摸到。摸到厚度,摸到纹理,摸到那股细微的、即将卡住的阻力。这比识别一个图像难多了。图像是平的,触觉是立体的,而且带着时间的流动。你得在发生的同时做出反应,没有延迟。一延迟,动作就变形了。
所以很多号称灵巧的机械手,做演示看起来眼花缭乱。一蒙上眼睛,全露馅了。
它们还在用视觉的那套逻辑去处理触觉的问题,路就走错了。触觉不是视觉的补充,它是另一套完全不同的语言。你得从头学起。
春晚那个盘核桃的节目,本质上是个触觉问题。
光靠眼睛看,机器人大概知道手里有个圆东西。它转没转,滑没滑,哪边快捏不住了,这些信息眼睛给不了。
触觉是另一套语言。
你得感觉到接触点在皮肤上滚动,那种细微的、随时在变的摩擦力。视觉只能给个大概其的轮廓,它告诉你东西还在那儿,但也就到这儿了。东西是不是已经开始悄悄往外溜,哪一侧的支撑正在变虚,这些关键的变化,都藏在皮肤和物体接触的那层感觉里。
这感觉没法看,只能摸。
所以你看那些试图模仿这个动作的机器,它们的动作总显得有点愣,或者说,过于精确了。它们按照预设的轨迹转动,但手里那个核桃是活的,表面的纹路、重量分布带来的微小失衡,都在制造变数。人类手指能即时处理这些变数,靠的不是计算,是反馈。是皮肤告诉大脑,这边有点松了,那边得加点力,一套瞬间完成的、无需思考的调整。
机器缺的就是这套即时反馈的语言系统。
视觉像是个远距离观察者,它报告全局。触觉才是贴身的对话,它报告每一刻的、局部的真实状态。盘核桃这个动作,精髓不在转,而在通过转,持续地、动态地感知并调整。你手里转的不是两个核桃,是一连串稍纵即逝的、需要立刻回应的触觉信号。
没了这个,动作就只剩下空壳了。
指尖的触感,是机器人最后的安全绳。
当视觉和算法都失效,压力、滑动、那些细微的形变,就成了它理解世界的唯一语言。它得靠这个,在核桃掉下去之前,知道自己抓错了地方,然后悄悄调整手指的姿势和力道。
这不是锦上添花,是底线。触觉必须实时,必须细腻,必须在接触状态改变的瞬间,身体就做出反应。慢零点几秒,东西就没了。
Sharpa 自己就明白这个道理。
2025年5月,在ICRA的展台上,它干过这么一件事。它自己低下头,在桌面上找到一台相机,对准观众,按下快门。接着,它用食指去摸相机侧面的那个小拨杆,不是戳,是轻轻拉动,把拍好的照片从机器里取出来,最后递出去。
整个过程,你看不到任何停顿和犹豫,像早就排练过无数遍。但内行知道,这份丝滑底下,全是触觉感知和快速控制系统的功劳。它得感觉到拨杆的凸起,感觉到照片纸的边缘,感觉到递出去时手指该用多少力。
就凭这个,它成了那几天展馆里最引人注目的角色。我听说,同一个机器人,就这么拍了几千张照片,没失手过。
Sharpa出现在春晚舞台这件事,现在回头看,一点都不奇怪。
过去一年玩灵巧手的人确实多了。但把自由度、尺寸、负载、可靠性还有触觉这些指标全摆出来,能同时做到并且做得好的,一下子就少了。Sharpa这种在行业里闷头干了很久的角色,被推到台前几乎是必然的。
圈子里有人把他们的产品叫灵巧手里的劳斯莱斯。这话听着像玩笑,但里面有两层很实在的意思。一个是性能确实被认,另一个是价格也确实摆在那儿。十万美元一双,没什么商量余地。
有消息说他们的货根本不够分。从去年十月开卖算起,国内和硅谷叫得上名字的科技公司、机器人公司基本都下了单,而且订单量不小。
Sharpa Wave这东西,短时间内成了硬通货。论坛上谁晒个开箱,底下全是羡慕的。谁先拿到手,谁就能在“真实操作物理世界”这个环节抢到一点先机。灵巧手不决定模型能跑多高,但它决定了哪些能力能从论文和仿真里走出来,哪些永远走不出来。
它变成了弹药。最要紧的那种。
02
Sharpa:春晚炫的是顶级的硬件,
CES 上展的是顶级的 AI 能力
靠灵巧手出了名,但Sharpa自己很少说自己是做灵巧手的公司。稍微往里看看就明白,灵巧手对他们来说,可能只是个开始。那是他们技术体系里最先成熟、也最容易被外界看见的一块。
他们真正在挖的护城河,是围绕灵巧操作和触觉搭起来的那套东西,软件硬件绑在一起的AI模型能力,还有那个跑得很快的数据采集和训练体系。
今年一月的CES上,这点看得特别清楚。
CES的展台上,Sharpa的人形机器人North在走动。他们这次没怎么炫耀那只灵巧手能单独拧开瓶盖,重点变了。整个演示看下来,连贯性很强,一个任务接一个任务,背后驱动的是他们自研的VTLA模型,CraftNet。
这个模型的结构有点意思。
CraftNet是端到端的分层架构。他们额外加了个东西,叫System 0。这个层不处理语言,也不做视觉分析,它只管物理接触。靠触觉和力反馈直接干活,控制频率拉到差不多100赫兹。这么说吧,比通常的控制层快了十倍。
快十倍意味着什么。
意味着那些需要瞬间反应的细微操作,可能不再是瓶颈了。机器人抓一个鸡蛋,或者扶住一个快要倒的杯子,靠的就是这种毫秒级的调整。以前这类动作总显得有点笨拙,或者需要极其复杂的预编程,现在看起来,路径不太一样了。
他们没明说,但展示的逻辑很清晰。单个高难度动作是技术实力的勋章,而连续完成复杂任务,才是真正走向实用的门票。CraftNet,尤其是那个System 0,像是给这张门票加了个防伪芯片。
当然,展台演示是一回事。真正的物理世界要混乱得多,也苛刻得多。不过这个思路,至少指出了一个明确的技术演进方向。不再只是让手更巧,而是让整个系统对“接触”这件事,反应得更快,更直接。
这或许比做出一个完美的后空翻,更值得琢磨。
机器人第一次摸到了东西。
不是那种预设好的抓取,是带点试探,带点调整,手指头能感觉到力反馈,然后自己知道该用多大力气,该往哪个方向挪一挪。这感觉,差不多就是我们说的“手感”。
三周后,Figure那边也更新了。
他们给那个叫Helix的架构底下,加了个新层级,叫System 0。公告里说,这东西管的是高频接触、身体平衡和全身协调。名字和它要干的活儿,跟之前Sharpa提出的模型结构,像得有点过分了。不是细节像,是骨架和分工的逻辑,几乎一个模子。
结构层级,职责边界,都对得上。
CES上Sharpa的North机器人,玩了手更花的。
它那双手确实灵巧,但这回重点不在这。它开始干一件有头有尾的事了。它坐在赌桌后面,当起了发牌荷官,陪观众玩二十一点。从洗牌,到发牌,到收牌,一整条线下来,没人插手。它就那么坐着,一张一张地发,一轮一轮地来。
任务闭环了。
灵巧手以前是秀单项技术,现在成了这个闭环里一个顺理成章的部件。技术展示还在,但味道变了,它现在更像是在演示一个完整的、能自己转起来的服务场景。那个场景里,机器人知道自己每一步做完,下一步该干什么。
机器人打牌这件事,听起来有点荒诞。
但现场的人盯着看,看的不是输赢。
它得先弄明白规则,不是那种死记硬背的指令,是真正理解什么时候该出什么牌。这第一步就筛掉了很多只会按剧本表演的机器。
然后才是手上的功夫。扑克牌又薄又滑,还容易粘在一起,人的手指都觉得麻烦。机械手要稳稳地捏住,准确地抽出其中一张,再放到该放的位置,这套动作的精度要求不低。
最后是整场牌局。它不能只做对一次,得在连续的判断和动作里,一直保持稳定,不出错。这就像让一个人不停地做精细活,时间一长,手也会抖。机器人的系统能不能扛住这种长程的消耗,才是真正的考验。
牌局只是个小测试。
到了CES那个折叠风车的演示,味道就更对了。那是一个更漫长,步骤更繁琐的任务。你得看着它,一步一步,把那些薄片折来折去,最后变成一个会转的东西。中间任何一个环节卡住,整个表演就垮了。
它没垮。
这种稳定感,比任何语言上的宣传都来得直接。观众站在那儿,看的就是这个。看它会不会中途死机,看它手里的零件会不会突然掉下来。没掉下来,任务完成了,那种沉默的说服力就形成了。
事情大概就是这样。
让机器人折纸,这事儿听起来就透着股别扭。
纸这东西,软塌塌的,你手一碰它就变形。边缘自己会卷起来,折过的地方力道全变了,摩擦的感觉也时时刻刻不一样。你没法提前给它编好一套死程序,告诉它第一步手放哪儿,第二步用多大力。它得自己摸,自己感觉,自己在那儿不停地微调。
North这个机器人干的就是这个。它得在动态里找平衡。
更关键的是,它好像学会了变通。你把纸片悄悄挪个地方,或者桌面突然没那么滑了,它不会愣住,也不会傻乎乎地从头再来一遍。它会停一下,大概是在心里重新算了一遍,然后接着往下干。这种能力,我们一般管它叫抗干扰。
或者说,是一种面对混乱局面的镇定。
他们总在说最后一毫米。
叠风车的时候,眼睛看准了没用。手指头真正碰上去那一下,才是开始。风车的纸边会弯,会滑开,会给你一个意料之外的力。你得跟着它动,手指头得有自己的主意,在那一毫米里面不停地调,调力道,调角度,调那种说不清道不明的接触感。
差一点,就散了。
Sharpa的模型突破在于,它把触觉放进了控制闭环里。
机器人叠衣服的时候,最后那一毫米总是最难。
现在它知道自己摸到的是什么,也知道该怎么调整力道和角度了。
那点微妙的触感,从最不稳定的环节,变成了可以反复复现的固定动作。
他们这次在CES上又这么干了。
四天,每天八小时,机器就在那儿不停地叠,不停地打乒乓球,不停地和人玩牌。
风车叠了四百多个,球打了八百场,牌局开了九百次,还顺手拍了两千多张照片。
没停过。
外行可能觉得,现场演示和录个视频放出来,能有多大区别。
区别大了去了。
对圈里人来说,这根本是两种东西。一种是演给外面看的,另一种,是摆上台面给同行看的。
视频可以剪。
哪怕一百次里只成功一次,只要把那一次拍下来,画面就是完美的,无懈可击。
展会上不行。光线在变,人在走来走去,设备状态会有波动,任何一点意外都可能让动作失败。失败一次,可能就被围观的人拍下来,发到网上。
然后所有人都看见了。
失误会被放大,不停地被传播。
所以很多公司,包括那些名字很响亮的,Figure、1X,还有Tesla,更愿意发视频。
现场演示不是没有,但翻车的情况也不少。
(当然,翻车本身也是一种信息。)
Sharpa这种近乎偏执的选择,像是一种技术上的审美。
或者说,是一种提醒。
现在大家一提到机器人,都在谈论泛化能力,说它能不能适应新场景。这当然重要。
但Sharpa想说的是,别忘了鲁棒性。
忘了可靠性。
一个只能在实验室里成功百分之一的Demo,永远走不进工厂的大门,更别说普通人的家里了。它首先得能稳定地工作,重复一千次,一万次,不出错。
03
隐形的独角兽,
和它背后的团队
在主流视野里,Sharpa没什么声音。
它不像那些人形机器人公司,隔三差五就有新闻出来。网上流传的它的视频,大多是观众在展会上用手机拍的,画面有时候还晃得厉害。
你甚至找不到一个它的官方公众号。
投资圈的人知道它估值早过了十亿美元,但想找上门去聊,往往还得托好几层关系。结果通常是一样的,被客气地回绝。
但在该看见它的地方,它一直都在。
他们的传播很窄,也很深,只出现在那些行业展会、学术会议和技术论坛上。曝光量不是他们要的,他们只关心是不是被“对的人”看见了。
这个策略,很有效。
全球那几个顶级的机器人学术会议,已经能看到不少论文在用Sharpa的硬件平台。他们的AI科学家,名字也开始和学界的大牛一起,出现在论文的作者栏里。
英伟达给了他们一个明确的信号,邀请他们在2026年的GTC大会上,专门讲讲那个CraftNet模型。
这家公司的背景,是最近才被慢慢挖出来的。
公开信息显示,Sharpa在2024年底成立,三个联合创始人都来自禾赛科技。向少卿,李一帆,孙恺。
这个组合,一看就是干实事的路子。
禾赛的故事很多人知道。
他们花了差不多十年,在一个曾经被美国公司牢牢握在手里的行业,把激光雷达的成本打了下来,降了百分之九十九点五。他们建起了车规级的量产和质量体系,一年能产几百万台,做到了全球市场份额第一,公司也实现了盈利。
在那个领域,他们几乎成了唯一成功的范本。
这种从工程、到产业、再到市场全部打通的经历,或许比任何技术口号都更能说明问题。我是说,或许。
禾赛的激光雷达今年上了春晚,装在宇树机器人里,让它能躲开东西,还能和别的机器人一起干活。
这事说明,Sharpa那帮创始人没在闭门造车。
他们一直和顶级的机器人团队、工厂还有大学实验室混在一块儿,太清楚现在机器人到底卡在哪儿了。
所以你看,Sharpa几乎把所有力气都花在了最要命的地方。
怎么让操作别出岔子,怎么让动作看起来像人一样自然,怎么把眼睛看到的和手上摸到的感觉拧成一股绳,还有,怎么把最后那一点点、总是搞不定的精细活儿,从一个碰运气的问题,变成一个能按步骤解决的技术活儿。
这么一想,Sharpa不爱出声,可能不是怕见人。
那更像是一种干工程的人才会有的判断,被现实敲打过很多次之后形成的判断。他们不是头一回走这种“看着慢,但必须稳”的路了,之前在禾赛搞激光雷达,已经完整地走了一遍。
激光雷达那会儿,禾赛干成了一件特别难的事。
他们先不管别的,把东西做得足够结实,扔到工厂里、车上别坏。等这个没问题了,再想办法让它的性能变得比别人都强。最后一步,才是琢磨怎么大规模生产,把价钱打下来。这条路听着不聪明,不讨喜,但偏偏就这么一步步跨过了量产、良品率、还有能不能卖出去这些大坑。
李一帆说过好几次,这其实就是对付“不可能三角”的办法。
质量,性能,成本,这三样你没法同时都要。你得排个队,先抓住质量,再冲性能,成本是最后才考虑的事。
现在,这套办法被原封不动地搬到了Sharpa。
灵巧手和通用机器人面前,摆着一个更麻烦的三角:手指关节越多越灵活,但越容易坏,成本还越高。很多团队的选择是,先把一个能动的样子做出来,拍个视频,剩下的麻烦以后再说。Sharpa选的是另一边,在没搞清楚能力的边界到底在哪儿之前,不急着做很多,更不急着降价,先把最难的工程问题啃下来。
看他们怎么测试灵巧手就明白了。
现在这些手大多在实验室或者很干净的地方用,但Sharpa在内部把它往狠了用。连续按了超过三百万次,在不同的东西上摩擦了超过五千米,不锈钢、大理石、木头、橡胶,什么都试。做出来当然要紧,但他们更在乎的是,这东西在真实世界里,能不能反复用,用很久。
这大概就是工程思维和演示思维的区别。
一个想着怎么活下去,另一个想着怎么被看见。
Sharpa这家公司的结构,一眼就能看出它的野心。
总部在新加坡,研发和制造在上海,业务运营在硅谷。这种布局不是为了好看,它把技术研发、工程实现和市场落地这三件事,硬生生拧成了一股绳。一种为长期存在而设计的形态。
他们在CES上说了一句话,算是他们的使命宣言。
We manufacture time by making robots useful.
制造时间。这话听起来有点大。但他们的逻辑很具体,就是搞定那“最后一毫米”的活儿。那些重复的,精确的,让人疲惫的细微操作。春晚的聚光灯照过他们,但他们的目的,据他们说,是为了最终把光还给人类。
不是替代,是接管。
他们想做的,是用软件和硬件的结合,让机器人能和现实世界进行复杂的交互。工厂里,商场里,甚至以后在家里。去处理那些琐碎的、消耗性的任务。
人省下来的不只是力气。
那是一种更根本的东西,时间和精力的所有权。你可以把这些资源重新分配,去琢磨一个更好的方案,去陪家人吃一顿不用看表的饭。或者说,去成为更接近你想象中样子的自己。
从这个角度看,制造时间这个说法,倒也不算夸张。
它是个比喻,但也是个非常实际的承诺。
*头图来源: Sharpa
本文为极客公园原创文章个人场外配资,转载请联系极客君微信 geekparkGO
犀牛配资提示:文章来自网络,不代表本站观点。




