
各位伴侣早上好,,,,,今天极度欣喜受邀到这里做演讲,,,,,首先祝贺丽江创投25周年,,,,,丽江创投对丽江的发展与创新立下了汗马业绩,,,,,了不得!我们各人都感激丽江创投做出的巨大贡献。。。。。。
我从事人为智能机械人方面的钻研或许40年,,,,,今天想跟各人分享一下这方面的思虑,,,,,求教于诸位。。。。。。人为智能发展到今天,,,,,无论是大说话模型、机械视觉,,,,,自动驾驶汽车,,,,,似乎根基上都到了一个顶端,,,,,那么,,,,,下一个突破口到底在哪里???????
最近这段功夫,,,,,不少投资界的伴侣,,,,,无论是国内的还是国表的,,,,,蕴含来自硅谷的,,,,,都到我家里来问我统一个问题:人为智能有没有泡沫???????我给出的回覆是:有,,,,,并且是巨大的。。。。。。由于从价值(valuation)来看,,,,,如今险些所有与人为智能有关的投资都是出于狂热。。。。。。但是也不要太消极,,,,,我给人为智能的泡沫下了一个界说——这是一个“真实的泡沫”。。。。。。所谓“真实”,,,,,体此刻几个关键点:

第一,,,,,人为智能的突破是底子性的。。。。。。从美国的曼哈顿打算起头,,,,,到今天,,,,,可能还没有任何一项科学技术能像人为智能这样,,,,,获得如此巨大的突破,,,,,拥有这么沉大的影响力,,,,,这可能是人类汗青上的第一次,,,,,把稳,,,,,我说的是底子性突破!
第二,,,,,智能从此刻起头成为了商品,,,,,出产力的潜力是巨大的,,,,,会渗入到各行各业,,,,,影响到千家万户,,,,,所有的行业城市产生刷新,,,,,有着巨大的出产力提升空间。。。。。。
第三,,,,,人为智能已经形成了产业。。。。。。这一点其实极度了不得,,,,,回首互联网早期的发展,,,,,产业化的过程并不顺利。。。。。。而今天,,,,,人为智能已经形成了一个相当规模的产业系统。。。。。。把稳,,,,,形成产业后,,,,,事件是很难扭转的,,,,,我是一辈子随着产业走的,,,,,我喜欢给工业界做照拂,,,,,给好多驰名企业都做过照拂。。。。。。我的一个别味是:产业上来了以来,,,,,它会反过来疏导你,,,,,甚至是不罢休的。。。。。。举个例子,,,,,今天所有的工业都用到的齿轮,,,,,有一天若是我说不用齿轮了,,,,,这件事件是做不到的,,,,,为什么???????由于齿轮已经形成了一个产业了,,,,,它有做齿轮的机械和产业在那里,,,,,这是肯定会做下去的,,,,,不会罢休的。。。。。。我们都知路渐开线齿轮不是最好的,,,,,我从学生时期就知路,,,,,到此刻还改不了,,,,,由于产业已经形成了。。。。。。人们都关注科技对产业的影响,,,,,我想提醒各人产业对科技的影响也是巨大的。。。。。。
第四,,,,,国度的战术支持,,,,,这是极度沉要的。。。。。。浚????D芄徽乒苋蔚厮担航慈宋悄艿木赫,,,,,就是中美两国之间的较量。。。。。。去年这个时辰,,,,,我还不能这么注定地说这句话,,,,,此刻能够说了,,,,,明年会更显著。。。。。。这意味着什么???????两个国度的情况跟几个国度的情况是不一样的,,,,,几个国度是讲竞争(competition),,,,,而两个国度是讲对峙(rival),,,,,一旦形成这种关系,,,,,就不会等闲停下来。。。。。。
基于以上几点,,,,,我的分析是:人为智能是一个真实的泡沫,,,,,发展远景极度之大。。。。。。

那么我们先回首一下现实世界中的人为智能到底发展到了哪一步,,,,,我们此刻在哪里???????目前的人为智能或许在五个领域:一是说话模型,,,,,蕴含语音、文本,,,,,所有与说话有关的器材;;;;;二是Transformer架构,,,,,就是把稳力的散布(attention-based),,,,,它加强了说话的职能,,,,,当然也有好多职能。。。。。。
三是扩散模型;四是图像天生,,,,,图像这件事件已经做了好多年,,,,,但图像的天生这两年做得出格好;;;;;五是代码,,,,,代码是这几年起头的,,,,,我幼我的判断是,,,,,到今年年底,,,,,自动天生上百行代码会十吩煺遍,,,,,代码天生会像语文课写作文造句一样,,,,,系统会自己衍生出来。。。。。。至于其他方面的器材,,,,,有没有太大的性质性进取呢???????我以为没有。。。。。。
若是把这些近况放在一路看,,,,,人为智能今后应该往哪里走???????首先,,,,,我们要从“说话”过渡到“非说话”,,,,,肯定要从“说话」剽个框里走出去。。。。。。除人类以表,,,,,世界上佑装智能”的器材,,,,,你去看看,,,,,好比说鸟、兔子、蛇,,,,,它们有说话吗???????没有。。。。。。
其次,,,,,要从“推算”到“非推算”,,,,,“非推算”指的不是“没罕见字”,,,,,指的是除了“数据(data)”以表的器材,,,,,以及数据自身代表的“智能”水平。。。。。。此刻都是萦绕着数据转。。。。。。正是在这个从“说话”走向“非说话”、从“推算”走向“非推算”的过程中,,,,,产生了“具身智能”。。。。。。
什么叫具身智能???????就是基于物理的、身段的,,,,,通过感知及与周边的交互来进前进建和进化。。。。。。譬喻说,,,,,你看到了我手在动,,,,,我的手是有感知的,,,,,是在与周边交互的,,,,,若是你们不在的话,,,,,我会这么动吗???????这个过程就是具身智能。。。。。。
具身智能的沉点,,,,,首先是要有感知,,,,,没有感知是不能的,,,,,人都是有感知的,,,,,像眼、耳、鼻、舌、身等等。。。。。。说话只是感知的一个特殊的方面。。。。。。其次是要有交互,,,,,好比说我看到你们在听我的讲演,,,,,通过听、看、互换,,,,,形成一种互动。。。。。。最后是要有进建,,,,,这是人为智能傍边最底子的、不能健忘的三点。。。。。。

讲到具身智能,,,,,此刻好多人都以为是在讲人型机械人,,,,,我想与各人讲,,,,,这可能是误区。。。。。。人型机械人是从90年代起头的,,,,,其时日本的科学家搞得很欢,,,,,但其他国度的大部门科学家并不太认同,,,,,为什么???????由于人类创造机械人的主张,,,,,正本就不是要造一个“齐全包办身类”的存在。。。。。。所谓“机械人”,,,,,只是“像机械一样的人”或者“像人一样的机械”,,,,,你能够说它不是人,,,,,但它又几多带着一点人的特点。。。。。。所以,,,,,人类造的机械人并不愿定非得像个“人”,,,,,而只是拥有人类(或非人类)的某些能力或特点的机械而已。。。。。。
此刻各人一窝蜂在做人型机械人,,,,,这其实不是唯一的路,,,,,我在硅谷还见过一家做“炒菜机械人”的创业公司:就是用一个机械臂拿着铲子在锅里翻炒。。。。。。我其时看了只感触很可笑——若是你只是想让机械炒菜,,,,,为什么非得给它一只“手”,,,,,再让它去拿一把“铲子”???????我们齐全能够直接让机械从底下把菜翻起来就好。。。。。。人是由于做不到这样翻菜,,,,,才发了然铲子。。。。。。所以,,,,,用机械臂握着铲子炒菜,,,,,其实挺傻的。。。。。。真正要做具身智能,,,,,要把人为智能带入千家万户,,,,,必要另辟蹊径,,,,,不能只盯着人形机械人这一条路。。。。。。人形机械人做出来,,,,,各人看了会很开心,,,,,去上春晚,,,,,有关部门也会很开心。。。。。。这是能够的,,,,,但用不着所有人都去做人形机械人。。。。。。

做人为智能的主张到底是什么???????40年前我们做人为智能、做机械人,,,,,z6首页初心是这样:首先,,,,,是为了让人远离危险。。。。。。好比,,,,,昔时我地点的处所有一家全球最大的核电站公司,,,,,核电站有故障,,,,,人是进不去的,,,,,由于太危险了,,,,,那能不能让机械人进去建理呢???????因而,,,,,第一是预防危险;;;;;第二是去实现那些超过人类极限的事件。。。。。。我们去到表太空,,,,,表太空环境可能是零下 250度,,,,,人类无法在那里生计,,,,,那机械人能不能去???????这些都是“极限场景”的问题。。。。。。另表,,,,,是为了脱节沉复劳动。。。。。。我们为什么要造机械人、为什么要发展人为智能???????就是为了让人从危险、极限、沉复的工作中被解放出来,,,,,而不只是单一地“造一幼我来包办身”。。。。。。

那么,,,,,人类是不是这个世界上做各类工作或活动都最严害的动物呢???????其实并不是。。。。。。好比,,,,,在平展的路上,,,,,我们人类走一走还能够,,,,,但速度并不快,,,,,车就比我们快得多。。。。。。我们也不会飞,,,,,人类想要飞行已经折腾了两千多年,,,,,但始终没能让自己飞起来。。。。。。此刻的飞机其实也不是“会飞的鸟”,,,,,比鸟差远了。。。。。。鸟有两只会拍动的同党,,,,,飞机的机翼却动不了,,,,,只是做成一个类似鸟的状态,,,,,中央挖个洞,,,,,把人装进去而已。。。。。。所以,,,,,在好多方面,,,,,人类其实并不如其他动物。。。。。。
每天早上我城市在院子里缓步,,,,,我很喜欢看鸟,,,,,观察它们是怎么飞的,,,,,而鸟的飞行方式和虫豸的飞行又齐全分歧;;;;;在海滩,,,,,我钻研过螃蟹、龙虾,,,,,两者也有分歧,,,,,它们适应分歧的海滩环境,,,,,在沙岸上,,,,,人爬得再快也比不外螃蟹;;;;;丛林里面你看松鼠,,,,,爬树爬得很好,,,,,我们做了好多“爬树机械人”,,,,,但是比松鼠还是差一点。。。。。。我们能不能把天然界的其他动物的“智能”学出来???????

此刻稍微讲一下动态与静态,,,,,我幼我其实更喜欢钻研动态系统,,,,,不外今天功夫有限,,,,,就不具体发展了。。。。。。人类对“动态」剽件事其实相对比力陌生,,,,,这也是具身智能的空缺处,,,,,但动态自身有着极度有趣的智能。。。。。。最单一的例子就是自行车。。。。。。如果你从来没见过自行车,,,,,也不知路它是用来骑的,,,,,忽然有人递给你一辆车,,,,,通知你这个器材能够骑,,,,,你第一反映注定是不相信:骑上去不是要跌倒吗???????但事实刚好相反——骑得越快,,,,,越不容易倒。。。。。。这就是典型的“动态系统的平衡”。。。。。。伴侣们,,,,,静态系统的智能和动态系统的智能,,,,,是齐全不一样的。。。。。。在我们尝试室里,,,,,就有一些依附动态平衡工作的机械人。。。。。。
前面我们讲了那么多具身智能、动物的智能,,,,,还有动态与静态的智能,,,,,此刻回到一个更底子的问题:人类最高档次的智能到底是什么???????这个问题其实牵扯到教育的范式,,,,,也就是——我们到底该若何教z6首页孩子???????在座的各位好多都有孩子,,,,,孩子在学堂上学,,,,,若是教员跟你说:“你家孩子很聪明。。。。。。” 那这个“聪明”到底指的是什么???????依照我自己的钻研结论,,,,,或许是:75%是影象,,,,,20%是理性,,,,,5%是表白。。。。。。我已经分析过前五年的高考试卷,,,,,大体就是这么一个结构。。。。。。里面险些没佑装感性”、“设想”、“直觉”,,,,,以及“创造”的内容。。。。。。但刚好在今天这个分享里,,,,,我要极度当真地说:人的最高智能,,,,,是直觉。。。。。。我还是要强调:若是人为智能不往“直觉」剽个档次走下去,,,,,我看这出戏即便唱得下去,,,,,也是不杰出的。。。。。。为什么这么说???????接下来我举两个单一的例子:

好比说打篮球。。。。。。你去打球的时辰,,,,,队友把球传过来,,,,,有些真正的高手,,,,,接球的一瞬间“啪”一下就出手投篮了。。。。。。这个出手的决定是怎么做出来的???????他会先算一算:前面防守的人有多高、阻力队员几多、投进的概率是几多,,,,,而后再决定要不要投吗???????不会。。。。。。这个过程不是理性的推算,,,,,也不是靠影象,,,,,而是纯正凭直觉实现的。。。。。。所有高阶的器材,,,,,背后险些都是直觉在起作用。。。。。。
再举个例子。。。。。。前两天有一位已经毕业的同学来我办公室跟我说她快成婚了。。。。。。我说:那祝贺你啊。。。。。。她说:祝贺什么,,,,,家里吵得很严害。。。。。。
我问为什么???????她说她的妈妈不喜欢她的男伴侣,,,,,她把男伴侣带回家后,,,,,妈妈后来问她:“你说说看,,,,,这个男伴侣到底好在哪里???????”她自己也讲不明显,,,,,只好说:“他个子很高啊。。。。。。”
妈妈就说:“我上次给你介绍的那个男孩,,,,,个子也很高啊。。。。。。”后来两幼我来来回回说了好多,,,,,归正她妈妈就是不中意。。。。。。
她最后问我:“校长,,,,,我妈妈说得对不合???????”
我对她说:“你妈妈说的是对的。。。。。。”
她脸一下就拉下来了,,,,,不措辞了。。。。。。我接着说:“但是,,,,,你选的男伴侣也是对的。。。。。。”
她顿时就不理解了:“这不成能啊。。。。。。若是我妈妈是对的,,,,,那我选的男伴侣就是错的;;;;;若是我选的是对的,,,,,那我妈妈注定就是错的。。。。。。”
我说:“不是这样的。。。。。。你妈妈说得 ‘对’,,,,,是指她是用理性、用逻辑在评价。。。。。。而你在选男伴侣的时辰,,,,,是用直觉。。。。。。你的直觉里当然也蕴含理性的成分,,,,,但不只限于理性,,,,,还有好多说不清路不明的器材。。。。。。”
所以,,,,,伴侣们,,,,,我们每幼我在生涯傍边城市遇到以上这种类似情况:直觉在起决定性作用。。。。。。这也是我为什么说,,,,,直觉其实是人类第一流此外智能。。。。。。
“直觉” 这个说法不定是最正确的,,,,,英文里叫 intuition,,,,,或者 heuristics,,,,,里面其实蕴含了很强的 “经验” 成分。。。。。。也正由于如此,,,,,我在学堂里一向强调 “实际” 有多沉要。。。。。。在我看来,,,,,进建大体有四个阶段:学、思、践、悟。。。。。。第一是 “学” ,,,,,中国粹生这一点做得很好,,,,,都很勤恳;;;;;第二是 “思” ,,,,,也有不少同学在思虑方面做得不错。。。。。。第三是 “践” ,,,,,也就是亲自去做、去实际,,,,,这一环节在今天的教育里根基是缺失的。。。。。。第四是 “悟” ,,,,,就更少见了——没有实际,,,,,光靠想书不成能产生真正的领悟。。。。。。所以,,,,, “学–思–践–悟” 是一个齐全的过程。。。。。。在我们学堂里,,,,,我一向强调:要有经验,,,,,要有感触,,,,,要有理智,,,,,要有感情,,,,,这些器材要放在一路,,,,,才组成一种高维的智能。。。。。。
那我们此刻常说的“数据”是什么???????性质上,,,,,数据是降维之跋文录下来的了局。。。。。。维度被压缩了,,,,,所以肯定是不齐全的。。。。。。用这些数据去做一些相对单一的事件,,,,,在肯定水平上是有效的,,,,,但问题也会随之而来:算力需要越来越高,,,,,能源需要越来越高。。。。。。此刻好多处所当局在会商、争抢的焦点,,,,,就是“算力”。。。。。。算力从哪里来、有什么用???????
以围棋为例:如果你明天要和一位高手对弈,,,,,今晚要复盘一下,,,,,人复盘两三盘棋就已经很了不得了,,,,,AI一上来能够助你复盘十盘。。。。。。你会感触:十盘当然比三盘好。。。。。。若是是一百盘呢???????那似乎更好;;;;;一千盘呢???????如同更好了。。。。。。照这个思路推下去,,,,,一万盘、十万盘是不是就更好???????但若是你真正下过棋,,,,,你会在某个点上打断这个逻辑——由于人知路什么时辰该停,,,,,什么功夫已经是够了,,,,,机械却不知路在哪里停,,,,,这就是当下人为智能的一个底子问题,,,,,就是数据到底是否反映了真正的智能。。。。。。
而对“降维后的数字”,,,,,我们必须维持警惕:哪怕有最多的数据、最强的算力,,,,,它们这些数字所代表的“智能”,,,,,是否是全域性的、是靠得住的,,,,,这是一个大问号。。。。。。换句话说,,,,,若是你向一群极度“笨”的人进建——不论你学得多快、多好,,,,,这有意思吗???????我说得再不客套一点,,,,,如果这群人自身就不成信,,,,,甚至满是在说谎,,,,,那你越当真向他们进建,,,,,了局会怎么???????同样的路理:在这样的前提下,,,,,你数据越多、算力越强、进建越快,,,,,越可能是毫无意思的。。。。。。

回首汗青,,,,,世界上产生过的最沉要的事务,,,,,起决定性作用的是什么???????我幼我比力喜欢看一些传记、汗青书籍,,,,,从一个又一个案例里,,,,,你会发现:好多关键时刻,,,,,尤其是在战争这类沉大事务中,,,,,真正决定走向的,,,,,是辅导的判断力。。。。。。那这种判断力从哪里来???????更多时辰是来自直觉,,,,,而不是纯正的理性。。。。。。唬唬;;氐较执逃蜕缁,,,,,对“理性”的强调已经到了有点“非理性”的水平了。。。。。。所以有时辰,,,,,孩子若是考试没考好,,,,,不要骂他,,,,,他无非是在某些“理性”指标上阐发通常而已,,,,,但在此外方面,,,,,可能极度杰出。。。。。。理性当然沉要,,,,,但远约有我们今天设想得那么沉要。。。。。。
所以,,,,,回到人为智能自身:直觉是具身智能的下一个突破口。。。。。。只有通过具身智能能力够达到直觉,,,,,只靠说话很难真正做到。。。。。。想想我们人与人之间是怎么互换的。。。。。。你们在座好多是辅导,,,,,能够今天就做一个幼尝试:好比,,,,,你要跟一位员工发言,,,,,通知他今年经济不太好,,,,,年终奖可能要低一点,,,,,或许会是几多。。。。。。你当真跟他聊个十五分钟,,,,,而后观察一下对方的反映。。。。。。我的问题是:对方的反映有几多是基于你说的“内容”。。。。。。统计的了局约莫为30%,,,,,而剩下70%,,,,,跟“内容”无关。。。。。。你甚至能够再进一步验证:用同样的措辞、同样的数字,,,,,让另一幼我去跟统一个员工讲一遍,,,,,你会发现成效齐全不一样。。。。。。那么,,,,,这70%是什么???????就是我今天反复强调的那部门:直觉。。。。。。你的态度、手势、语气、眼神、笑容,,,,,以及你们之间寂仔的关系基础,,,,,都影响了沟通的了局——它们都在我们今天所说的直觉里。。。。。。
前面讲了好多关于“直觉”和“具身智能”的会商,,,,,我今天想要真正分享的一个主题理想是:真正颠覆性的创新,,,,,始终无法用从前的数据推算出来,,,,,创新是来自于高维的直觉,,,,,这也是具身智能的挑战地点。。。。。。

总结一下,,,,,人为智能的突破口在具身智能,,,,,具身智能的突破口在基于直觉的智能框架,,,,,若是这两件事件做好了,,,,,人为智能就能所向无敌。。。。。。讲到这里,,,,,我想引用日本作者村上春树的一段话,,,,,我特意把它放在了这一页的 PPT 上:每幼我都有属于自己的一片丛林,,,,,也许我们从来未曾去过,,,,,但它一向在那里,,,,,总会在那里。。。。。。我们都在人生的密林里独行,,,,,在交错的幼径上寻找属于自己的方向,,,,,那里有阳光——斑驳的温暖,,,,,也有月光——清冷的肃静。。。。。。
我为什么要写这段话???????其实没有什么主张,,,,,我只是想通知各人:这个PPT不是人为智能做的,,,,,人为智能做PPT的话是绝对不会有这一页出现的。。。。。。把这段话写在PPT里其实也是我的一种直觉。。。。。。

要强调直觉,,,,,强调人,,,,,强调心,,,,,要把人还给时期,,,,,把心还给人。。。。。。我们这个时期,,,,,把把稳力都放在机械上了:机械视觉、机械智能、机械人、机械翻译……所以机械越来越像人,,,,,人越来越像机械。。。。。。同时,,,,,要把心还给人,,,,,z6首页心已经被手机拿走了,,,,,z6首页魂灵已经在手机那里了。。。。。。而人为智能的将来,,,,,应该在强调人道的基础上来进行钻研,,,,,这样,,,,,才不至于迷途。。。。。。
感激各位!

