9 月 22 日脱处,歐特克公司將于深圳召開「Autodesk Converge 2023 高峰會議」歇拦。惠普 Z 系列作為歐特克軟件長久以來的合作伙伴贊助講繼續(xù)支持本次大會,強(qiáng)強(qiáng)聯(lián)手幫助高維創(chuàng)新者創(chuàng)造無限可能菠贡。更多信息請關(guān)注「惠普 Z Club」實時更新唇墅。
目前,真正應(yīng)用的大部分自動駕駛汽車大多數(shù)停留在 L2——部分自動駕駛階段睛至,要想達(dá)到有條件自動駕駛的 L3 級別甚至更高等級特奇,需要通過不斷地進(jìn)行深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)及多模態(tài)大模型訓(xùn)練來獲得感知能力治部、決策能力及主車智能等技能進(jìn)行提升剧么。
在自動駕駛技術(shù)研究與開發(fā)的過程中最關(guān)鍵的要素之一就是算力支持,而傳統(tǒng)的數(shù)據(jù)算力早已跟不上目前龐大的算力需求沧蛉,自動駕駛技術(shù)的 PK 也演變?yōu)樗懔Φ?PK苫治。尤其是在模型訓(xùn)練的時候,一臺強(qiáng)力的 GPU 工作站將會為研發(fā)工作帶來諸多便利蟀思。
上海人工智能實驗室 OpenDriveLab 自動駕駛團(tuán)隊使用惠普 Z 系列 HP Z8 Fury G5 數(shù)據(jù)科學(xué)工作站零院,基于自動駕駛算法訓(xùn)練的場景進(jìn)行了完整的開發(fā)訓(xùn)練實驗,下文將詳細(xì)對模型訓(xùn)練村刨、實驗環(huán)境以及測試過程中的使用體驗進(jìn)行全面總結(jié)告抄。
PART.1關(guān)鍵參數(shù)及散熱表現(xiàn)
CPU:Intel? Xeon? W7-3465X 2.5GHz 28cores 300w
GPU:4*NVIDIA? RTX? A6000 48GB
CPU 為 23 年一季度最新發(fā)布的 Intel? Xeon? W7 處理器,最高可睿頻至 4.8GHz嵌牺;GPU 配置4張 NVIDIA? RTX? A6000 顯卡打洼,共計 192GB 顯存,可以滿足大多數(shù)中小模型任務(wù)髓梅。由于整機(jī)計算性能強(qiáng)大拟蜻,散熱成為一大挑戰(zhàn)。惠普 Z 系列 HP Z8 Fury G5 數(shù)據(jù)科學(xué)工作站為處理器和每張顯卡都配備了高壓散熱風(fēng)扇,在機(jī)器前部和底部設(shè)置進(jìn)風(fēng)口酝锅,并將熱風(fēng)從尾部排出诡必。
在實際測試中,出風(fēng)口溫度始終保持在一個較低的區(qū)間搔扁,同時風(fēng)扇運(yùn)行的噪聲較小爸舒,幾乎可以忽略不計(即使是在滿載運(yùn)行時)。
PART.2在自動駕駛算法中的表現(xiàn)
01 模型介紹
UniAD(英文:Planning-oriented Autonomous Driving遇冶;簡稱 UniAD)是由 OpenDriveLab 主導(dǎo)的研究工作材又,在 2023 年 CVPR 會議上獲得了最佳論文獎項。這是近十年來計算機(jī)視覺三大頂級會議(CVPR涧智、ICCV药屠、ECCV)第一篇來自中國研究機(jī)構(gòu)(包括港澳臺地區(qū))的最佳論文獎。同時誊桅,這是 CVPR 歷史上第一篇以自動駕駛為主題的最佳論文崇旺。
該文章提出一個端到端的感知決策一體框架,融合了多任務(wù)聯(lián)合學(xué)習(xí)的新范式难踱,使得進(jìn)行更有效的信息交換设哀,協(xié)調(diào)感知預(yù)測決策,以進(jìn)一步提升路徑規(guī)劃能力刷络,是業(yè)界首個具備全棧關(guān)鍵任務(wù)的端到端自動駕駛模型甥迷。
UniAD 首次將感知、預(yù)測丽优、規(guī)劃等三大類主任務(wù)歹恬、六小類子任務(wù)(目標(biāo)檢測、目標(biāo)跟蹤啸盏、場景建圖重贺、軌跡預(yù)測、柵格預(yù)測和路徑規(guī)劃)整合到統(tǒng)一的端到端網(wǎng)絡(luò)框架下回懦,實現(xiàn)了全棧關(guān)鍵任務(wù)駕駛通用模型。在 nuScenes 真實場景數(shù)據(jù)集下次企,所有任務(wù)均達(dá)到領(lǐng)域最佳性能(State-of-the-art)怯晕,尤其是預(yù)測和規(guī)劃效果遠(yuǎn)超之前最好方案。項目地址:(暫不可見)/OpenDriveLab/UniAD
02測評介紹
(1)使用場景:端到端自動駕駛算法模型訓(xùn)練
(2)測評任務(wù):UniAD 模型的訓(xùn)練表現(xiàn)
(3)實驗環(huán)境:torch 1.9.1+cu111
訓(xùn)練UniAD模型(官方配置為8張NVIDIA?A100)缸棵,分為兩個階段:第一個階段舟茶,占用 50G 顯存,花費(fèi)兩天時間訓(xùn)練 6 個 epochs堵第,相當(dāng)于 1 個 epoch 花費(fèi) 8 小時吧凉;第二個階段,占用 17G 顯存,花費(fèi) 4 天時間訓(xùn)練 20 個 epochs阀捅,相當(dāng)于 1 個 epoch 花費(fèi) 4.8 小時胀瞪。
考慮到顯存大小,我們將 quene_length 由 5 改為2芳倒,使得 UniAD 模型能在4 張NVIDIA?RTX?A6000顯卡上運(yùn)行领明。實驗結(jié)果表明,在 4 張 NVIDIA? RTX? A6000 顯卡上進(jìn)行第一階段訓(xùn)練需要占用 48GB 顯存姓赂,一個 epoch 用時 15 小時袋凶。考慮到工作站的顯卡數(shù)量相較官方更少痢腋,單 epoch 時間延長也在可接受范圍之內(nèi)弦捶。
同時,可以觀察到訓(xùn)練過程極其穩(wěn)定二场,機(jī)器運(yùn)行噪音小党砸,在使用其他操作時也十分流暢,從各方面證明了這臺惠普 Z 系列 HP Z8 Fury G5 數(shù)據(jù)科學(xué)工作站的性能十分強(qiáng)大页函。
在保持訓(xùn)練的同時對一個 checkpoint 的結(jié)果進(jìn)行可視化涧馋,能夠流暢生成結(jié)果。
(圖:可視化展示結(jié)果)
PART.3個人體驗與對比
OpenDriveLab 同時擁有公有云集群的使用權(quán)庭四,配置 2000 多張 NVIDIA?A100 顯卡蚜懦,那么使用惠普Z系列數(shù)據(jù)科學(xué)工作站相比于使用集群有什么優(yōu)勢呢?我認(rèn)為主要體現(xiàn)在以下幾個方面:
一橡疼,集群服務(wù)器沒有可視化界面援所,需要可視化結(jié)果(比如使用 open3d 可視化點云)時,需要將結(jié)果下載至個人主機(jī)欣除,比較麻煩住拭,而惠普 Z 系列數(shù)據(jù)科學(xué)工作站可以直接連接顯示器;二历帚,使用集群常常需要重新配置環(huán)境滔岳、配置網(wǎng)絡(luò),而本地環(huán)境配置完畢一勞永逸挽牢。同時谱煤,雖然集群服務(wù)器性能更強(qiáng)大,但是中小型的模型訓(xùn)練使用惠普 Z 系列數(shù)據(jù)科學(xué)工作站完全能夠勝任禽拔;三刘离,使用集群有時會出現(xiàn)啟動慢、網(wǎng)絡(luò)卡頓睹栖、結(jié)點掉線等問題硫惕,影響工作進(jìn)度茧痕,而惠普 Z 系列數(shù)據(jù)科學(xué)工作站則非常穩(wěn)定。
PART.4總結(jié)
總結(jié)整個實驗過程察贵,惠普 Z 系列 HP Z8 Fury G5 數(shù)據(jù)科學(xué)工作站配備 4 塊 NVIDIA? RTX? A6000 48GB 顯卡慢况,在訓(xùn)練任務(wù)中基本不用擔(dān)心顯存不足的問題。通常 batch 的設(shè)置不會太大捻奉,常用的設(shè)置為 32青先、64 和 128,共計 192GB 的顯存在為模型訓(xùn)練提供了穩(wěn)定性和增大 batch 的可能性(隨著 batch 的增大九站,模型的性能可能會下降委鸯,雖然 batch 的增大能在一定程度上提高模型的泛化能力和穩(wěn)定性)。
同時屋骇,惠普 Z 系列 HP Z8 Fury G5 數(shù)據(jù)科學(xué)工作站具備極高性能的 CPU ——Intel? Xeon? W7菲国,非常適合多線程任務(wù)并行。實際使用中可以發(fā)現(xiàn)殷彰,工作站在解壓等對 CPU 要求較高的任務(wù)上表現(xiàn)出色射屿,對 nuScenes 數(shù)據(jù)集的解壓速度能夠達(dá)到 300MB/s。
最后哺肘,惠普 Z 系列 HP Z8 Fury G5 數(shù)據(jù)科學(xué)工作站還配備 2T 的存儲空間殴胧,能夠輕松放下自動駕駛領(lǐng)域的大型數(shù)據(jù)集,如有需要還可供多個用戶使用佩迟。得益于惠普Z系列高效的散熱解決方案和冷卻設(shè)計团滥,工作站即使在滿載運(yùn)行情況下也沒有產(chǎn)生很大的熱量,風(fēng)扇噪音也在可接受的范圍之內(nèi)报强。
惠普 Z 系列 HP Z8 Fury G5 數(shù)據(jù)科學(xué)工作站為自動駕駛研發(fā)測試過程中灸姊,為專業(yè)軟件和系統(tǒng)平臺提供更好的兼容性和穩(wěn)定性。在處理器秉溉、顯卡以及軟件系統(tǒng)長時間高負(fù)載工作環(huán)境下也能保持流暢的運(yùn)行處理狀態(tài)力惯,確保自動駕駛算法訓(xùn)練任務(wù)高效、穩(wěn)定的完成召嘶,是一臺綜合性能十分優(yōu)異的工作站父晶。
點擊“閱讀原文”,立即注冊參會弄跌,共襄年度盛舉诱建。
(歐特克Autodesk)
聲明:本網(wǎng)站所收集的部分公開資料來源于互聯(lián)網(wǎng),轉(zhuǎn)載的目的在于傳遞更多信息及用于網(wǎng)絡(luò)分享碟绑,并不代表本站贊同其觀點和對其真實性負(fù)責(zé),也不構(gòu)成任何其他建議榛舍。本站部分作品是由網(wǎng)友自主投稿和發(fā)布溃杖、編輯整理上傳,對此類作品本站僅提供交流平臺,不為其版權(quán)負(fù)責(zé)卢圈。如果您發(fā)現(xiàn)網(wǎng)站上所用視頻储佣、圖片、文字如涉及作品版權(quán)問題借衅,請第一時間告知位蓉,我們將根據(jù)您提供的證明材料確認(rèn)版權(quán)并按國家標(biāo)準(zhǔn)支付稿酬或立即刪除內(nèi)容,以保證您的權(quán)益鹊属!聯(lián)系電話:010-58612588 或 Email:editor@mmsonline.com.cn妓唬。
- 暫無反饋
編輯推薦
- 2025新年特刊:打造新質(zhì)生產(chǎn)力,智啟未來新篇章
- 定義制造業(yè)未來的數(shù)控加工中心技術(shù)專題
- 航空航天及交通領(lǐng)域先進(jìn)制造技術(shù)應(yīng)用專題
- 解碼消費(fèi)電子產(chǎn)品生產(chǎn)的數(shù)字化之路技術(shù)專題
- 精密智能機(jī)床拂是,助力制造升級技術(shù)專題
- 汽車輕量化驅(qū)動下的零部件加工應(yīng)用專題
- 高性能銑刀實現(xiàn)高精加工生產(chǎn)技術(shù)專題
- 航空航天發(fā)動機(jī)解決方案專題
- 高效齒輪加工生產(chǎn)技術(shù)方案專題
- 金屬加工液的性能不止?jié)櫥夹g(shù)應(yīng)用專題