半岛全站app科普大佬说AI 与自动驾驶─人工智能可能实现人类智能的任务吗

 半岛全站app下载入口     |      2023-11-04 14:34:44    |      小编

  9月15日,由智谱AI支持,北京市科委、中关村管委会科普专项经费资助的系列栏目“科普大佬说”第九期于AI TIME 开讲,本次讲座邀请了清华大学计算机系长聘教授/博士生导师、清华大学人工智能研究院视觉智能研究中心主任邓志东老师给大家带来精彩的分享。

  1992年-1994年在清华大学计算机系从事人工神经网络与强化学习的博士后研究。1994年12月晋升为清华大学副教授,2000年晋升为教授。1996年-1997年在香港理工大学合作研究一年(对方聘用)。2001年-2003年在美国华盛顿大学合作研究两年(对方聘用)。主持或参与国家级重点科研项目30余项,发表学术论文近300篇,其中ESI高被引论文1篇,WOS收录102篇,EI收录123篇。参编教材或参考书5部。现为中国自动化半岛全站app学会会士,中国计算机学会杰出会员,中国人工智能产业创新联盟专家委主任,中国自动化学会智能自动化专业委员会主任等。目前的研究方向为:人工智能、无人驾驶、先进机器人等。

  驾驶汽车是人类智能面临的挑战性任务之一。共享电动无人驾驶汽车的发展,将从根本上颠覆人类的出行与交通方式,带来海陆空天自主无人系统与人形机器人的降维应用与巨大技术进步。在智能路网新基建及其他生态的支撑下,无车载安全员的自动驾驶出租车、港口无人重卡、矿山无人运输车与低速无人物流配送车等,通过规模化试点收费服务构建模式创新与商业闭环,同时倒逼单车智能、5G应用、边缘计算、数字孪生与基于AI的边云预测接管等关键核心技术的突破,利用场景创新与合力支撑弥补目前人工智能缺乏认知能力的不足,加速中国L4自动驾驶的大规模商业化落地进程。

  安全行驶:即使对人类智能而言也是一件挑战性任务。而对于18岁以下的小孩,法规为什么不允许驾车?一是缺乏成熟的知觉能力;二是不熟悉交通规则;三是缺乏驾驶经验和技巧。动物同样也开不了车,关键在于动物没有知觉能力,有“感”无“知”。

  根据世界卫生组织的最新统计,2021年全球每天因道路交通事故的死亡人数达3,500多人,全年死亡超过125万人,几千万人受伤或致残,其中90%以上的事故源于人类驾驶员的违规违法操作,主要的事故原因或“非正常”的驾驶包括:分心开车,酒后驾驶,疲劳驾驶,斗气开车,无证驾驶等。

  共享电动无人驾驶汽车是一项颠覆与变革性技术。其发展将从根本上颠覆人类的出行与交通方式,带来海陆空天自主无人系统与人形机器人的降维应用与巨大技术进步,推动智能经济与智能社会的发展,产业空间巨大。

  苹果公司现任CEO蒂姆·库克曾经说过,自动驾驶汽车是所有人工智能项目之母。其复杂动态环境下的高价值视觉感知与认知能力,是所有无人自主系统的共性关键核心技术,可实现对各个领域的降维应用。

  无人物流小车、无人配送小车、移动商铺、移动餐厅、移动卡拉OK店、移动咖啡厅、移动医院、移动办公室、移动酒店等,主要目的都是为了提供服务,不是去解决从A点到B点的移动或出行,这会形成新的商业模式和产业形态,会构建新的经济增长点。

  无人驾驶中高价值视觉感知与认知技术的发展,还将带来海陆空天自主无人系统的巨大技术进步。

  与此同时,无人驾驶中先进移动通信支撑的云-边-端架构、边云预测接管等,也可望推动“有人-无人”半自主系统的发展,例如通过有人作战飞机与无人作战飞机构建任务集群,有可能改变未来的空战模式与形态。

  最后,这些高价值的视觉感知、自主决策与规控共性关键技术,更可降维应用到慢速、活动范围较小的人形机器人,催生新产业新业态新模式,助力人类生产生活方式的巨大变革。

  总之,共享电动无人驾驶汽车不仅是一项颠覆与变革性技术,本身的产业空间巨大,而且具有极大的产业带动性与辐射能力,必将为人类社会带来全方位的改变与文明进步。

  自2012年以来,以深度学习为代表的人工智能经过十年大发展,特别是随着高价值深度视觉感知技术的不断演化迭代,自动驾驶开始进入商业化运营的下半场。下半场关键是要解决自动驾驶的落地问题。

  AI算法为自动驾驶落地,带来了较传统计算机视觉方法更强的环境感知、轨迹与行为意图预测、自主导航与信息融合能力,也为发展具有自主学习能力的行为决策、路径规划与车体纵横向控制,带来新的研发思路与手段,可以说变得基本可用,但与人类智能比较,在认知能力上则有很大的差距。

  自动驾驶落地,就意味着机器要替代人类智能来驾驶汽车,自主行驶在复杂动态的道路交通环境中,前面已说明,这其实是一件非常具有挑战性的事情。视觉人工智能,特别是高价值的视觉感知技术已经成为自动驾驶的基础性技术。主要包括AI算法、软件、硬件的一体化技术,涉及:1)算法(深度卷积神经网络,深度生成式网络,深度强化学习,Transformer等);2)大数据(场景大数据,目标大数据,行为意图大数据,驾驶行为决策大数据,驾驶轨迹大数据等);3)算力(移动端、边缘端与云端推断;离线训练深度学习加速器);4)细分场景(场景与目标感知,高精栅格地图、语义地图与自主导航,行为意图预测,信息融合,自主决策,路径规划,智能控制等);5)一体化垂直整合等5个维度。

  (2)道路感知技术:可行驶路面检测、车道线检测、路缘检测、护栏检测 等。

  (1)机动车目标检测技术:利用包络框或基于像素级的目标分割与分类技术,特别是运动学参数的估计技术;

  2016年之前,自动驾驶领域还在进行初期的技术验证,属于科研主导型。之后则是企业在主导,但都是属于技术验证期,就是看看相关的技术路径是否能够走得通。但现在自动驾驶进入了下半场,核心就是要完成商业化落地与产业发展。

  如何实现商业化落地?场景创新是关键。场景创新就是一开始要简化问题,从简单到复杂,一步一步做半岛全站app起,每一步都要以完成商业化落地作为主要的评价标准。自动驾驶是否安全?技术是否先进,关键看商业化落地的效果。为此我们就需要对自动驾驶的行驶区域、相关功能与使用条件进行限制,而不是去考虑一个一般的、通用的应用场景。

  以美国谷歌Waymo的RoboTaxi(无人驾驶出租车)为例:2018年12月5日,全球首个无人驾驶商业运营品牌Waymo One问世,面向美国亚利桑那州的凤凰城地区,开启了共享无人驾驶出租车针对限定区域与限定人群的小规模免费叫车服半岛全站app务。

  国内自动驾驶的场景创新与商用落地速度不断加快。例如百度萝卜快跑全车无安全员RoboTaxi,于2022年8月8日在重庆市永川新城区面积30平方公里的范围,进行小规模商业化载客试运营;同期进行全车无人付费载客共享出行服务的还有武汉市。此外,主驾无人副驾有人的付费载客服务,也于2022年7月在北京亦庄政策先行区试运营。

  除上述无车载安全员的城市无人驾驶出租车以外,无人重卡与智慧港口、无人运输车与智慧矿山,以及低速无人物流、配送车等,也都是可望较快实现L4自动驾驶规模化商业落地的创新场景。

  2020年10月8日,谷歌Waymo宣布其RoboTaxi服务品牌Waymo One,开始在凤凰城地区对社会公众完全开放,且车上无安全驾驶员。

  换句线年后才能到来,至少在限定区域,商业化的无人驾驶已经出现在我们这个世界上,而且对大城市与城际间的客、货运交通,无人驾驶网约车、支线货运车、低速物流车、配送车和移动服务机器人,这些新业态也将不断迭代进入我们的生活。

  特斯拉FSD Beta V10. 69.2已向部分用户推送,目前已拥有超过10 万名成员参与测试,行驶体验不断改善,价格已从年初的1万美元提高到了1.5万美元,即通过收费FSD软件升级服务,构建商业闭环。

  随着不断的软件升级迭代,特斯拉的城区、城际自动辅助驾驶,其性能更加接近于人类司机。马斯克在2022年第一财季分析师会议中透露,特斯拉预计将在明年发布 RoboTaxi,目标是在2024 年实现量产,该无人驾驶出租车将不会配置方向盘和踏板,其安全性可超过人类,价格会比公交还便宜。

  特别指出的是,百度萝卜快跑的RoboTaxi全无人自动驾驶出租车目前已在北上广深等10多个城市提供自动驾驶出行服务,订单量超百万,已开始获得现金流,正逐步构建商业闭环。

  而华为作为智能网联汽车领域的全栈增量部件供应商,其HI 智能汽车解决方案与搭载鸿蒙操作系统的智能座舱,正以ICT切入的自动驾驶解决方案Tier-1“身份”,赋能新老车企,构建商业闭环。

  此外,2021年比亚迪与新造车势力蔚小理等,以及小米、大疆等都开始入局智能汽车赛道。图森未来正式登陆纳半岛全站app斯达克,成为“全球自动驾驶卡车第一股”,智加科技也即将上市。

  场景创新与商业闭环可以倒逼单车智能、5G应用、边缘计算、数字孪生与基于AI的边云预测接管等关键核心技术的突破。

  尽管总体上我们的单车智能与国外最先进的水平还存在一定的技术差距,但单车智能的发展却是根本。其中人工智能的算法突破及广泛应用最为关键,也就是希望能够通过学习来解决自动驾驶的一切问题!

  利用视觉深度神经网络这一核心架构,基于自主学习来解决自动驾驶感知、预测与规控挑战,可以充分发挥机器在持续学习、计算、存储等方面超越人类的优势。简言之,就是要极限利用现有端到端数据驱动方法的优势,充分利用机器相对于人类智能的长处,避其短板。

  另外需要重点发展先进的传感器和高算力自动驾驶芯片。对于自动驾驶而言,算法很重要,但先进传感器和自动驾驶芯片同样也十分重要。1000T甚至2000T以上的自动驾驶芯片,才能支撑L4自动驾驶的落地。

  大家知道,激光雷达是主动视觉,可以得到目标点云的几何信息,但却丧失了颜色与纹理的信息,而摄像头虽是被动视觉,单目也不能获得目标的测距深度,但却保留了颜色与纹理。因此将两者结合互补,研发彩色激光点云传感模组,无疑极具技术与产业价值,代表了未来的技术发展趋势。

  自动驾驶芯片本身除了追求高算力、低功耗,也需要考虑车规量产、冗余备份与安全性等。总之,我们需要:

  需要特别指出的是,发展端-边-云框架,先进的移动通信技术一直是一个瓶颈。我们希望的先进移动通信技术是那种全直连的V端(车端)到X端(其他端)的安全、可靠、低时延(毫秒级)、高带宽、大连接的先进移动通信技术。显然,目前的5G技术在满足安全性、可靠性上,还有差距。

  体制先进及基于人工智能技术的新一代移动通信技术,已成为自动驾驶利用V2X(车联网)与I2X(路联网)实现安全可靠互联互通的瓶颈。进一步地,为了解决目前人工智能认知能力不足的问题,需要有人参与的远程预测接管,但这完全不同于早期的遥操作。为此必须在边-云上建立一套数字孪生系统,通过数字孪生系统基于深度强化学习的自主决策与最优策略的虚实迁移,完成虚实交叉验证与基于AI的接管预测。

  对于城市自动驾驶而言,人工智能、先进移动通信技术支撑的端-边-云框架,以及虚实平行世界,就构成了城市智能路网的内涵与核心内容。

  瘦端、强边和泛云的设计,意味着在边缘服务部分有人来参与预测接管,而云的部分可以配置知识图谱与高精地图下载。边缘上则需要部署强大的AI算力,直接为移动端进行敏捷服务。移动端“瘦”下来之后,单机成本也降下来了,功耗降低后,续航里程也可随之提高。

  无车载安全员的AI边云预测接管,成为从L2+进化为L4的可行技术实现路径,其中每一步的跨越,均可倒逼关键核心技术的突破。

  总之,我们要通过核心技术的突破,获得高级别的单车智能、安全可靠的车端互联互通与强大的智能路网边缘服务能力。

  总之,就是让我们“聪明的车”自主行驶在“智慧的路网”上面。“聪明的车”就是单车智能,而“智慧的路网”建设则是我们中国的强项,我们有世界上规模最大的5G基站,我们更具有基建优势。通过5G、6G等先进移动通信技术,将城市车端、城市路端和城市边-云端连接起来,构建好城市智慧路网,构建好中国自动驾驶的产业生态。

  自动驾驶生态建设最为重要。通过自动驾驶场景创新与政策引领,利用智能路网新基建及其他产业生态的支撑,基于合力支撑来弥补目前人工智能缺乏认知能力的不足,加速中国L4自动驾驶的大规模商业化落地进程。

  (2) 共享电动无人驾驶汽车是一项颠覆性技术,其发展将从根本上变革人类的出行与交通方式,带来海陆空天自主无人系统与人形机器人的降维应用与巨大技术进步,推动智能经济与智能社会的发展,意义重大,且具有巨大的产业发展空间。

  (3)场景创新、商业闭环与技术突破是自动驾驶迈入商业化运营下半场的关键。可以优先选择城市、城际高速的无车载安全员的自动驾驶出租车与商用车,以及港口无人重卡,矿山无人运输车与最后一公里的低速无人物流配送车等,进行场景创新;同时通过适度超前的政策引领与法规建设,以点带面试水规模化收费服务,构建商业闭环,以此倒逼单车智能、5G应用、边缘计算、数字孪生与基于AI的边云预测接管等关键核心技术的突破。

  (4)最后,通过智能路网新基建及其他自动驾驶产业生态的支撑,弥补目前人工智能缺乏人类水平认知能力的不足,加速中国L4自动驾驶的大规模商业化落地进程,走出一条中国自动驾驶产业的创新发展之路。