2月17日,毫末該公司宣布自動(dòng)駕駛的全球認(rèn)知模型正式升級(jí)為DriveGPT,并將在2023年4月的自動(dòng)重進(jìn)展HAOMO AI DAY上宣布其最新重要進(jìn)展。
隨著ChatGPT在整個(gè)網(wǎng)絡(luò)中的認(rèn)知普及,ChatGPT采用的大模Transformer模型和“人反饋強(qiáng)化學(xué)習(xí)(RLHF)”技術(shù)再次吸引了業(yè)界的關(guān)注。在自動(dòng)駕駛領(lǐng)域,型月Transformer大模型在中國(guó)首次引入數(shù)據(jù)智能系統(tǒng)MANA。公布在2023年1月的毫末HAOMO AI日上,Smart Bank首席執(zhí)行官顧偉豪介紹,全球Smart Bank于2023年3月推出的自動(dòng)重進(jìn)展加拿大28黑馬預(yù)測(cè)人類駕駛自我監(jiān)控認(rèn)知模型已經(jīng)借鑒了ChatGPT的實(shí)施思路,并采用RLHF(人類反饋強(qiáng)化學(xué)習(xí))技術(shù),駕駛通過引入真實(shí)的認(rèn)知人類駕駛接管數(shù)據(jù)來不斷優(yōu)化自動(dòng)駕駛認(rèn)知決策模型。
認(rèn)知決策算法經(jīng)歷了三個(gè)發(fā)展階段。大模第一階段是型月引入單個(gè)場(chǎng)景的端到端模擬學(xué)習(xí),以直接適應(yīng)人類駕駛行為。加拿大黑馬預(yù)測(cè)第二階段是通過認(rèn)知大模型引入海量的正常人類駕駛數(shù)據(jù),通過Prompt的方式實(shí)現(xiàn)可控的、可解釋的認(rèn)知決策。第三階段,即當(dāng)前階段,是引入真實(shí)的接管數(shù)據(jù),并嘗試在大模型中使用RLHF算法來學(xué)習(xí)人車接管數(shù)據(jù)。為此,構(gòu)建了包括“舊策略、收購策略和手動(dòng)標(biāo)簽策略”的成對(duì)排序模型。基于該排序模型,最后構(gòu)建了自動(dòng)駕駛決策的獎(jiǎng)勵(lì)模型,從而在各種規(guī)劃場(chǎng)景下做出最佳決策。通過這一大型模型,在掉頭和環(huán)島等公認(rèn)的困難場(chǎng)景中,場(chǎng)景通過率提高了30%以上。
2月17日,Smart Mobile正式將人類駕駛的自我監(jiān)控認(rèn)知模型升級(jí)為“DriveGPT”,這也是全球首個(gè)自動(dòng)駕駛認(rèn)知模型。目前,Millimeter DriveGPT已經(jīng)完成了模型構(gòu)建和第一階段的數(shù)據(jù)運(yùn)行,參數(shù)規(guī)??梢詫?duì)GPT-2的水平進(jìn)行基準(zhǔn)測(cè)試。接下來,DriveGPT將繼續(xù)引入大規(guī)模的實(shí)際接管數(shù)據(jù),通過對(duì)人類駕駛數(shù)據(jù)反饋的深入學(xué)習(xí),不斷提高評(píng)估效果。同時(shí),DriveGPT還將被用作云評(píng)估模型,以評(píng)估小型車型在車輛端的駕駛效果。Millimeter DriveGPT的最新重要進(jìn)展將在2023年4月的第8屆HAOMO AI日上公布。
上一篇:家族矩陣 全面出擊 思域傳承經(jīng)典運(yùn)動(dòng)DNA