人工智能家当(包括自动驾驶)有一个不可忽略的人性毛病:
除了天然受制于技能措辞,也有不少人故意把东西说得模棱两可、艰涩难懂、天下第一……以达到让人不明觉厉、让成本掏钱的目的。

有些自动驾驶公司就长于此道。

或者说,如今市情上,把汽车工业与“超大模型”“GPT”以及“AIGC”强绑定的说辞,基本可以归于“非蠢即坏”的商业炒作行为。
特殊是,在“大模型”到底有多大都没法定义的情形下,有人拿出几亿参数值说大,有人搬出几十亿也说大,而GPT2的“大”就有150亿,GPT3则是1750亿。
当然,大不大无所谓,很多人最关心的问题是,开始有公司向汽车家当推出所谓的自动驾驶GPT,到底有什么用?
答案是,或许真的没太多用途。
首先,就像写Paper占坑一样,它的确有一小部分研究代价,属于学术界的任务;
其次,忽悠成本,由于不少成本会对汽车家当与大模型的双倍规模与估值买账。
但事实上,包括自动驾驶家当与深度学习圈,许多开拓者们对“自动驾驶GPT”的说法很不认同,乃至是极为恼火的。
我们请教了多位曾在大厂、中美科技独角兽做自动驾驶研发的资深工程师,以及包括OEM在内的汽车家当人士意见,再结合部分博客文章,总结了一些不雅观点,或许会对汽车工业、成本以及更广阔的大众群体有一些启示。
把GPT吹上车
以某家公司给出的“自动驾驶GPT产品”为例,其神经网络观点图让行家都一头雾水,不知所云。
此外,1200亿的参数量的确够大,相称于对标了GPT3。这意味着支撑这弘大数据量演习的硬件资源支持,同样不菲。
但是,他们虽背靠主机厂,却并没有自建昂贵的数据中央,而是跟其他企业一样租用云上资源。很明显,这是将某大厂云做事整合包装为自己的数据根本举动步伐做事体系。
其次,最主要的,大模型到底怎么落地?
把跟ChatGPT一样的“黑匣子”塞进汽车里,做从“感知、方案到决策”(这是自动驾驶技能三个组成部分)的端到端输出?
从这一方向,各方非常严谨地表示,目前离落地非常迢遥。
ChatGPT有着自己天然的生存环境,那便是昂贵的数据中央里。而所有关于AIGC的运用都要跟数据中央联网,这没有任何问题——在光缆的连接体系里,做到极快反应。
但作为大型移动设备,车唯一靠的便是无线,但目前连5G也非常不稳定。以是,包括特斯拉在内,大家都只能选择走一条路——
将高性能且轻量化的算法模型,塞进一枚性价比足够高的芯片里。
实质上,英伟达从Tegra 2、Xavier,过渡到Orin,再到2000Tops的Thor,算力的确是沿着自动驾驶AI算法模型在车内的猖獗扩充与变革而一起往上爬的。
而估算一下,GPT3须要的算力至少是Thor的10的N次方倍。
当然,就像GPT3.5开源之后,有开拓者已采取量化技能用苹果M2芯片运行起ChatGPT,以是,不用除未来有人会把它塞进英伟达的芯片里。
但是,撤除车辆感知、方案与决策过程本身的繁芜性,汽车工业猖獗追求的性价比、以及延迟两秒就会出人命的严苛交通环境,对统统“不可阐明性”有着天然的回避姿态。因此,业内认为,可行的韶光点极为迢遥。(当然,这家公司说自己的模型对付驾驶策略是可阐明的,请拿出更详细的证据。)
目前来看,自动驾驶前装市场普遍情形是:“唯有‘感知’模块用上了模型”。
业内清楚,感知最好做,且各家已成功落地——从CNN(卷积神经网络)开始,它便是一套相对成熟的流水线。而芯片里的GPU部分也基本被“感知”占用。
当然,“决策”与“方案”两个部分,并非没有人做AI化考试测验,只是汽车工业大多在当下,依然采取最为稳健的方法——
一系列来自机器人等领域的经典规则理论。譬如以“蒙特卡罗搜索树”为代表的启示式搜索算法。
以“方案”为例,其上车最常见的办法是把“纵向方案”和“横向方案”分开,做“时空分离”。而在这一点的创新上,就分出了几个“流派”——
以B大厂与苏Q厂为代表,做时空联合方案。相称于把纵向掌握与横向掌握的问题结合在一起,更随意马虎搜索出全局最优值。
这个流派的优点是,在面对极为困难或繁芜场景,局部最优算法很难搜索出一个更智能路径,但全局可能性更大。但缺陷是占用更多算力。
以苏M厂等很多从深度学习领域“出道”的公司为代表,在经典决策方案里融入AI算法,把个中一部分模块用AI算法替代掉,而非上来就做大一统。
的确,五六年前“打算机视觉”的大火,早就证明了深度学习具备巨大的运用潜力。但它的缺陷也是显而易见的——“不可阐明性”,以及通过大量资源投入来持续燃烧数据。
因此,要想上车,大部分企业在努力采取折中的办法——经典理论辅以AI算法,既保留经典方法的稳定性,又能提升性能表现。
“譬如,方案里的‘路径天生’,就可能用AI做替代;而路径的选择、剖断以及决策,以及后面的纵向方案,仍基于规则去做,形成一种复合方法。”
因此,大模型当然是一个终极空想状态,但上车的最好方法却是“分步骤推进”,与本钱之间做更多权衡。
当然,如今也有高端玩家们已经在研究“单模型多任务”的所谓“大一统”形式,不过统统没有定论。
大小可能不主要
我们从来都没想到,就像当年“自动驾驶分级”观点的模糊不清,让海内不少公司钻过空子一样;大模型这个“大”竟开始也被钻空子——
你有10亿,我有100亿,他有1000亿参数。
然而,在国外,对大模型的“大小”虽然有谈论,却从来不是重点。况且,国外工业界已经有了“客岁夜用小”的势头。由于“大模型”绝不是越大越好,越大就意味着越不透明,越具有排它性。
包括苏黎世联邦理工大学的科学家在内,一群年轻学者已发起一个叫做“BabyLM”的迷你模型寻衅赛,用规模为大型措辞模型千分之一(一亿参数旁边)做更适用工业界的模型。
此外,2022年,诸多海内自动驾驶公司蹭的所谓“Transformer”大模型,更多指代的,是包括GPT在内诸多大模型背后的深度学习根本架构,而非仅指代大模型本身。
它最早涌如今2017年谷歌的论文里。但这个被常用在自然措辞处理(NLP)的Transformer模型,之以是溘然在自动驾驶视觉界火了,是由于特斯拉将这一深度学习模型的“事理”,极具创造性地用在了“图像空间转化为矢量空间”的感知预测中。
大略来说,特斯拉工程师思考的是,既然这是一个精良的措辞翻译模型,那么为何不能将“摄像头获取的图像空间‘翻译’为3D矢量空间”?
以是,Transformer发源于NLP但转入了CV(打算机视觉);而2023年最火的BEV大模型,则是基于Transformer在自动驾驶领域的衍生物。
如果感兴趣,可以直接看Medium上关于特斯拉FSD的技能博客。工程师全程从没提过所谓的BEV模型到底有多大(虽然BEV被印证的确是烧数据的),而是设法办理目前车载摄像头数据领悟产生的问题——
纯摄像头系统对闭塞区域与大型物体的预测结果比较糟糕,那么便从神经网络源头改变算法模型的设计理念——从图像过渡至BEV。
效果也确实有了质的提升。
事实上,特斯拉更多值得称道的,是对各种各样已存的如RNN、LSTM、RegNet(上图)等普通模型进行创新,且把它们的潜力发挥到极致;
同时,强大的工程能力,又让特斯拉把这些模型都塞进了车里。
“特斯拉是在从大模型事理入手,去试图做一些有益于自动驾驶全体模型的设计,同时又考虑到汽车必要的轻量化和小型化,再结合自己的AI芯片(TRIP)工艺往车上搬。
我认为这是一件更趋向于实干的事情,而不是像海内一些公司吹牛蹭热点。”
从1到1.X?
不能上车,那么大模型做离线支持的“数据闭环”事情总可以吧?
“数据闭环”这个观点,可以参考被说烂了的特斯拉Autopilot数据引擎框架——
确认模型偏差、数据标注和洗濯、模型演习,再到重新支配。
与此同时,环球各地的特斯拉车辆源源不断的回传数据进入这套流程,使之迅速流转起来,形成一套闭环系统。
但有趣的是,没有“大模型”,这些事情也可以做,不是非大模型参与不可。
譬如,数据闭环里的“预标注”,海内无论是早期的B大厂,还是H大厂的某生物工具链,做的这套东西已经非常成熟,那么大模型的“增益”就有待评估,没有PPT们渲染的那么厉害。
实际上,数据闭环的观点既大略又繁芜。
大略在于,它可以被直接看做是“熬炼算法的大型根本举动步伐”,从它里面出来的模型上车后足够智能,足够见多识广。
而繁芜之处在于,它的每个环节,险些可以作为一个小型创业项目——
如何做到样本的自动化挖掘,如何洗濯掉冗余数据留下最有营养的部分,如何做好数据的冷存储与热存储?如何分门别类组织好数据?如何做到更有效的预标注……
以是,这套闭环的工程量极为弘大,每个环节都须要专门的人才掩护。
而对付自动驾驶创业公司来说,由于极度烧钱,一样平常会选择“把A部分做好,把B部分外包出去”的轻量化模式,有强项也有短板。
目前,虽然各家东西细节无从比较,但L4独角兽P厂的数据闭环工具链“CQ”,竟然得到了业内不错的评价。
对付这只早期L4巨兽,不谈商业模式,被认为“在构建根本举动步伐上的积累比较厚实”,是一家在技能层面有真东西的企业。
此外,坚持这套东西的运转,一定须要投喂更多的新鲜血液——数据与人才。因此,不是谁都能玩得起。
而特斯拉与比亚迪,是被认为最有可能把这个东西做好的商业组织。
只不过,基于人工智能的特性,数据闭环短期内是看不到成效的。它更像是春播秋收,把该浇的水、该施的肥、该播的种都做到位,不会吹糠见米且巨烧资源,但效果涌现后,便是马太效应形成的开始。
因此,要频年夜模型在数据闭环上的运用,不如比谁更有钱。
写在末了
当然,以上内容无意在偷袭谁,也无意表扬谁(否则不会用字母指代),而是希望家当能回到一个正常的比拟参照系内,以及重点放在实际效果上。
以及,建议企业把办公室内的“牌匾”换成特斯拉的成功三要素:
坚持第一原则思考办法,工程能力,以及实行力。
本文来自微信"大众年夜众号:宇多田(ID:hellomusk),作者:宇多田
本内容为作者独立不雅观点,不代表虎嗅态度。未经许可不得转载,授权事宜请联系 hezuo@huxiu.com
正在改变与想要改变天下的人,都在 虎嗅APP










