别吹了自动驾驶大年夜模型PPT们_模子_特斯拉

文章目录 [+]

人工智能家当（包括自动驾驶）有一个不可忽略的人性毛病：

除了天然受制于技能措辞，也有不少人故意把东西说得模棱两可、艰涩难懂、天下第一……以达到让人不明觉厉、让成本掏钱的目的。

别吹了自动驾驶大年夜模型PPT们_模子_特斯拉别吹了自动驾驶大年夜模型PPT们_模子_特斯拉科学

有些自动驾驶公司就长于此道。

（图片来自网络侵删）

或者说，如今市情上，把汽车工业与“超大模型”“GPT”以及“AIGC”强绑定的说辞，基本可以归于“非蠢即坏”的商业炒作行为。

特殊是，在“大模型”到底有多大都没法定义的情形下，有人拿出几亿参数值说大，有人搬出几十亿也说大，而GPT2的“大”就有150亿，GPT3则是1750亿。

当然，大不大无所谓，很多人最关心的问题是，开始有公司向汽车家当推出所谓的自动驾驶GPT，到底有什么用？

答案是，或许真的没太多用途。

首先，就像写Paper占坑一样，它的确有一小部分研究代价，属于学术界的任务；

其次，忽悠成本，由于不少成本会对汽车家当与大模型的双倍规模与估值买账。

但事实上，包括自动驾驶家当与深度学习圈，许多开拓者们对“自动驾驶GPT”的说法很不认同，乃至是极为恼火的。

我们请教了多位曾在大厂、中美科技独角兽做自动驾驶研发的资深工程师，以及包括OEM在内的汽车家当人士意见，再结合部分博客文章，总结了一些不雅观点，或许会对汽车工业、成本以及更广阔的大众群体有一些启示。

把GPT吹上车

以某家公司给出的“自动驾驶GPT产品”为例，其神经网络观点图让行家都一头雾水，不知所云。

此外，1200亿的参数量的确够大，相称于对标了GPT3。
这意味着支撑这弘大数据量演习的硬件资源支持，同样不菲。

但是，他们虽背靠主机厂，却并没有自建昂贵的数据中央，而是跟其他企业一样租用云上资源。
很明显，这是将某大厂云做事整合包装为自己的数据根本举动步伐做事体系。

其次，最主要的，大模型到底怎么落地？

把跟ChatGPT一样的“黑匣子”塞进汽车里，做从“感知、方案到决策”（这是自动驾驶技能三个组成部分）的端到端输出？

从这一方向，各方非常严谨地表示，目前离落地非常迢遥。

ChatGPT有着自己天然的生存环境，那便是昂贵的数据中央里。
而所有关于AIGC的运用都要跟数据中央联网，这没有任何问题——在光缆的连接体系里，做到极快反应。

但作为大型移动设备，车唯一靠的便是无线，但目前连5G也非常不稳定。
以是，包括特斯拉在内，大家都只能选择走一条路——

将高性能且轻量化的算法模型，塞进一枚性价比足够高的芯片里。

实质上，英伟达从Tegra 2、Xavier，过渡到Orin，再到2000Tops的Thor，算力的确是沿着自动驾驶AI算法模型在车内的猖獗扩充与变革而一起往上爬的。

而估算一下，GPT3须要的算力至少是Thor的10的N次方倍。

当然，就像GPT3.5开源之后，有开拓者已采取量化技能用苹果M2芯片运行起ChatGPT，以是，不用除未来有人会把它塞进英伟达的芯片里。

但是，撤除车辆感知、方案与决策过程本身的繁芜性，汽车工业猖獗追求的性价比、以及延迟两秒就会出人命的严苛交通环境，对统统“不可阐明性”有着天然的回避姿态。
因此，业内认为，可行的韶光点极为迢遥。
（当然，这家公司说自己的模型对付驾驶策略是可阐明的，请拿出更详细的证据。
）

目前来看，自动驾驶前装市场普遍情形是：“唯有‘感知’模块用上了模型”。

业内清楚，感知最好做，且各家已成功落地——从CNN（卷积神经网络）开始，它便是一套相对成熟的流水线。
而芯片里的GPU部分也基本被“感知”占用。

当然，“决策”与“方案”两个部分，并非没有人做AI化考试测验，只是汽车工业大多在当下，依然采取最为稳健的方法——

一系列来自机器人等领域的经典规则理论。
譬如以“蒙特卡罗搜索树”为代表的启示式搜索算法。

以“方案”为例，其上车最常见的办法是把“纵向方案”和“横向方案”分开，做“时空分离”。
而在这一点的创新上，就分出了几个“流派”——

以B大厂与苏Q厂为代表，做时空联合方案。
相称于把纵向掌握与横向掌握的问题结合在一起，更随意马虎搜索出全局最优值。

这个流派的优点是，在面对极为困难或繁芜场景，局部最优算法很难搜索出一个更智能路径，但全局可能性更大。
但缺陷是占用更多算力。

以苏M厂等很多从深度学习领域“出道”的公司为代表，在经典决策方案里融入AI算法，把个中一部分模块用AI算法替代掉，而非上来就做大一统。

的确，五六年前“打算机视觉”的大火，早就证明了深度学习具备巨大的运用潜力。
但它的缺陷也是显而易见的——“不可阐明性”，以及通过大量资源投入来持续燃烧数据。

因此，要想上车，大部分企业在努力采取折中的办法——经典理论辅以AI算法，既保留经典方法的稳定性，又能提升性能表现。

“譬如，方案里的‘路径天生’，就可能用AI做替代；而路径的选择、剖断以及决策，以及后面的纵向方案，仍基于规则去做，形成一种复合方法。
”

因此，大模型当然是一个终极空想状态，但上车的最好方法却是“分步骤推进”，与本钱之间做更多权衡。

当然，如今也有高端玩家们已经在研究“单模型多任务”的所谓“大一统”形式，不过统统没有定论。

大小可能不主要

我们从来都没想到，就像当年“自动驾驶分级”观点的模糊不清，让海内不少公司钻过空子一样；大模型这个“大”竟开始也被钻空子——

你有10亿，我有100亿，他有1000亿参数。

然而，在国外，对大模型的“大小”虽然有谈论，却从来不是重点。
况且，国外工业界已经有了“客岁夜用小”的势头。
由于“大模型”绝不是越大越好，越大就意味着越不透明，越具有排它性。

包括苏黎世联邦理工大学的科学家在内，一群年轻学者已发起一个叫做“BabyLM”的迷你模型寻衅赛，用规模为大型措辞模型千分之一（一亿参数旁边）做更适用工业界的模型。

此外，2022年，诸多海内自动驾驶公司蹭的所谓“Transformer”大模型，更多指代的，是包括GPT在内诸多大模型背后的深度学习根本架构，而非仅指代大模型本身。

它最早涌如今2017年谷歌的论文里。
但这个被常用在自然措辞处理（NLP）的Transformer模型，之以是溘然在自动驾驶视觉界火了，是由于特斯拉将这一深度学习模型的“事理”，极具创造性地用在了“图像空间转化为矢量空间”的感知预测中。

大略来说，特斯拉工程师思考的是，既然这是一个精良的措辞翻译模型，那么为何不能将“摄像头获取的图像空间‘翻译’为3D矢量空间”？

以是，Transformer发源于NLP但转入了CV（打算机视觉）；而2023年最火的BEV大模型，则是基于Transformer在自动驾驶领域的衍生物。

如果感兴趣，可以直接看Medium上关于特斯拉FSD的技能博客。
工程师全程从没提过所谓的BEV模型到底有多大（虽然BEV被印证的确是烧数据的），而是设法办理目前车载摄像头数据领悟产生的问题——

纯摄像头系统对闭塞区域与大型物体的预测结果比较糟糕，那么便从神经网络源头改变算法模型的设计理念——从图像过渡至BEV。

效果也确实有了质的提升。

事实上，特斯拉更多值得称道的，是对各种各样已存的如RNN、LSTM、RegNet（上图）等普通模型进行创新，且把它们的潜力发挥到极致；

同时，强大的工程能力，又让特斯拉把这些模型都塞进了车里。

“特斯拉是在从大模型事理入手，去试图做一些有益于自动驾驶全体模型的设计，同时又考虑到汽车必要的轻量化和小型化，再结合自己的AI芯片（TRIP）工艺往车上搬。

我认为这是一件更趋向于实干的事情，而不是像海内一些公司吹牛蹭热点。
”

从1到1.X？

不能上车，那么大模型做离线支持的“数据闭环”事情总可以吧？

“数据闭环”这个观点，可以参考被说烂了的特斯拉Autopilot数据引擎框架——

确认模型偏差、数据标注和洗濯、模型演习，再到重新支配。

与此同时，环球各地的特斯拉车辆源源不断的回传数据进入这套流程，使之迅速流转起来，形成一套闭环系统。

但有趣的是，没有“大模型”，这些事情也可以做，不是非大模型参与不可。

譬如，数据闭环里的“预标注”，海内无论是早期的B大厂，还是H大厂的某生物工具链，做的这套东西已经非常成熟，那么大模型的“增益”就有待评估，没有PPT们渲染的那么厉害。

实际上，数据闭环的观点既大略又繁芜。

大略在于，它可以被直接看做是“熬炼算法的大型根本举动步伐”，从它里面出来的模型上车后足够智能，足够见多识广。

而繁芜之处在于，它的每个环节，险些可以作为一个小型创业项目——

如何做到样本的自动化挖掘，如何洗濯掉冗余数据留下最有营养的部分，如何做好数据的冷存储与热存储？如何分门别类组织好数据？如何做到更有效的预标注……

以是，这套闭环的工程量极为弘大，每个环节都须要专门的人才掩护。

而对付自动驾驶创业公司来说，由于极度烧钱，一样平常会选择“把A部分做好，把B部分外包出去”的轻量化模式，有强项也有短板。

目前，虽然各家东西细节无从比较，但L4独角兽P厂的数据闭环工具链“CQ”，竟然得到了业内不错的评价。

对付这只早期L4巨兽，不谈商业模式，被认为“在构建根本举动步伐上的积累比较厚实”，是一家在技能层面有真东西的企业。

此外，坚持这套东西的运转，一定须要投喂更多的新鲜血液——数据与人才。
因此，不是谁都能玩得起。

而特斯拉与比亚迪，是被认为最有可能把这个东西做好的商业组织。

只不过，基于人工智能的特性，数据闭环短期内是看不到成效的。
它更像是春播秋收，把该浇的水、该施的肥、该播的种都做到位，不会吹糠见米且巨烧资源，但效果涌现后，便是马太效应形成的开始。

因此，要频年夜模型在数据闭环上的运用，不如比谁更有钱。

写在末了

当然，以上内容无意在偷袭谁，也无意表扬谁（否则不会用字母指代），而是希望家当能回到一个正常的比拟参照系内，以及重点放在实际效果上。

以及，建议企业把办公室内的“牌匾”换成特斯拉的成功三要素：

坚持第一原则思考办法，工程能力，以及实行力。

本文来自微信"大众年夜众号：宇多田（ID：hellomusk），作者：宇多田

本内容为作者独立不雅观点，不代表虎嗅态度。
未经许可不得转载，授权事宜请联系 hezuo@huxiu.com

正在改变与想要改变天下的人，都在虎嗅APP

标签：模型特斯拉

别吹了自动驾驶大年夜模型PPT们_模子_特斯拉

相关文章

单片机实例分享饮水机自动关电源专用插座_体系_饮水机

中兴“芯片乌龙”事宜的背后是国产芯片的“痛”_芯片_家当

拆一款全能型100W快充充电宝功能完好不过这价格也足以劝退你_芯片_电源

i5 9600KF配什么主板？i5-9600KF配RTX2060Super电脑装机设备推荐_超频_主板

入门HTPC最佳拍档华擎Q1900B-ITX评测_主板_功耗

国产手机芯片的后起之秀：一出手就是4G SoC_芯片_科技

热门文章

最近发表

强暴暗黑风微星GTX 1080 Ti魔龙TRIO评测_微星_显卡

九齐ny3p语音芯片国产替代筹划——广州九芯电子NVC语音芯片系列_语音_芯片

百元千兆路由新选择：光彩路由X3 Pro 2021拆机\u0026旗子暗记测试申报_路由器_光荣

揭秘！银行卡的工作事理是什么为什么会被盗刷呢_磁条_芯片

单片机实例分享饮水机自动关电源专用插座_体系_饮水机

三星取得半导体器件制造技能专利有助于提高半导体芯片的制造精度和质量_图案_缺点

怎么选择boost升压电路的电感？_电感_电流

冰与火中的“MLCC”_库存_扩产

西部数据公司宣布推出“全球容量最高”的闪存芯片_芯片_他们的

中兴“芯片乌龙”事宜的背后是国产芯片的“痛”_芯片_家当

标签列表