2026-視覺感知模型工程師
2-4萬元/月崗位職責: 1.核心算法研發(fā)與迭代 1.1 負責機器人視覺感知核心算法的研究、開發(fā)與迭代,涵蓋基于圖像/點云的目標檢測、識別、跟蹤、分割等任務。 1.2 深入探索基于多模態(tài)視覺-語言模型(VLM)的場景理解與事態(tài)感知技術(如復雜行為識別、異常事件檢測等),提升機器人對動態(tài)環(huán)境的認知能力。 1.3 研究與開發(fā)多傳感器(如多目相機、激光雷達)的時空對齊與融合感知算法,構建魯棒、精確的環(huán)境理解系統(tǒng)。 2.算法工程化與系統(tǒng)部署 2.1 主導視覺算法從模型到產品級的工程化落地,負責模型的輕量化、推理加速及在嵌入式、機器人平臺等邊緣計算設備上的適配與優(yōu)化。 2.2 設計與實現(xiàn)高實時性、高可用的視覺處理Pipeline,滿足機器人低延遲、高并發(fā)的實時交互與決策需求。 2.3 推動模型蒸餾、量化等技術的應用,平衡算法性能與計算資源占用。 3.數(shù)據體系建設與模型持續(xù)優(yōu)化 3.1 構建和完善視覺數(shù)據閉環(huán)體系,主導或參與關鍵業(yè)務場景的數(shù)據采集、標注、清洗、增強及管理工作,以數(shù)據驅動算法迭代。 3.2 系統(tǒng)性分析與解決算法長尾問題,針對遮擋、快速運動、弱光照、密集目標交互等復雜業(yè)務場景,從模型結構、損失函數(shù)、訓練策略等多維度進行持續(xù)優(yōu)化,提升模型泛化能力與場景適應性。 4. 技術調研與創(chuàng)新落地 4.1 緊密跟蹤計算機視覺(如YOLO系列、DETR系列模型)與多模態(tài)感知領域的前沿技術演進,評估其在機器人業(yè)務中的應用潛力。 4.2 負責新技術、新方案的預研、原型驗證與工程化導入,為產品進行前瞻性的技術布局。 5. 跨團隊協(xié)作與系統(tǒng)集成 5.1與機器人軟件、硬件、控制系統(tǒng)及AI團隊緊密協(xié)作,完成感知算法在真實機器人平臺上的集成、調試、性能優(yōu)化與長期維護。 任職要求: 基本要求: 1.本科及以上學歷,計算機科學、電子工程、自動化、機器人、應用數(shù)學等相關專業(yè)。3年以上計算機視覺或機器人感知算法研發(fā)經驗,有帶領技術模塊或獨立負責完整項目經驗者優(yōu)先。 2.算法基礎:扎實的機器學習、深度學習理論基礎,熟悉計算機視覺核心領域(檢測、跟蹤、分割、Re-ID等)的經典與前沿算法。 3.模型開發(fā):精通PyTorch或TensorFlow等至少一種主流深度學習框架,具備豐富的模型訓練、調參、優(yōu)化及實驗設計經驗。 4.工程能力:具備較強的算法工程化與落地能力,熟悉模型輕量化(如剪枝、量化、蒸餾)、推理加速(如TensorRT、OpenVINO、ONNX)技術,有C++/Python高性能代碼開發(fā)與優(yōu)化經驗。 5.技術廣度:熟悉目標檢測、多目標跟蹤(MOT)領域的主流架構(如YOLO系列、DETR系列、ByteTrack等),并對其演進有深入理解。對視覺-語言模型(VLM)、多模態(tài)感知、傳感器融合有研究或項目經驗者優(yōu)先。 6.數(shù)據處理:具備良好的數(shù)據處理和分析能力,熟悉數(shù)據采集、標注、清洗、增強全流程,能利用數(shù)據驅動解決模型的長尾問題。 加分項: 1.有完整的機器人、自動駕駛或相關領域的視覺感知算法落地項目經驗,熟悉從算法研發(fā)到嵌入式/邊緣端部署的全流程。 2.具備優(yōu)秀的復雜問題分析、拆解與解決能力,能夠針對實際場景中的難點(如遮擋、運動模糊、光照變化等)進行系統(tǒng)性優(yōu)化。 3.具備優(yōu)秀的技術調研、文獻閱讀、原型快速驗證及技術選型能力。 4.有較強的責任心和自驅力,對技術有熱情,樂于接受挑戰(zhàn),能適應快速迭代的開發(fā)節(jié)奏。 5.在會議(CVPR、ICCV、ECCV、IROS、ICRA等)或期刊上發(fā)表過相關論文。 6.具備良好的跨團隊溝通與協(xié)作能力,能夠清晰闡述技術方案并與軟件、硬件團隊高效合作。