數(shù)字人開發(fā)工程師
7000-12000元/月崗位職責:
1、主導數(shù)字人核心技術研發(fā):負責AI虛擬人從形象復刻、聲音模擬到智能交互的全流程系統(tǒng)設計與開發(fā),構建高度擬真且具備自主交互能力的數(shù)字化形象。
2、打造智能體(Agent)核心引擎:深度整合大語言模型(LLM)、語音識別(ASR)、語音合成(TTS)及其他AI技術,設計并實現(xiàn)支持自然對話與任務執(zhí)行的智能交互系統(tǒng)。
3、推進全棧式技術實施:承擔數(shù)字人項目從架構設計到落地部署的全流程技術工作,包括:
精準算力評估與架構規(guī)劃:分析模型推理與渲染負載,合理規(guī)劃計算資源,完成硬件配置(GPU/云/邊緣端)及本地或云端部署方案的設計。
4、實現(xiàn)高保真形象與語音復制:運用先進算法完成高質量的人物三維建模、骨骼綁定、表情驅動以及個性化語音生成技術的工程化落地。
5、完成多場景系統(tǒng)融合:將數(shù)字人核心模塊高效集成至Web端、移動應用、展示大屏及XR終端等多種前端平臺。
6、持續(xù)性能調優(yōu)與技術突破:優(yōu)化系統(tǒng)的并發(fā)處理效率、響應延遲、資源占用和運行穩(wěn)定性,攻克高難度技術瓶頸。
7、跟蹤前沿技術動態(tài):關注生成式AI、智能體架構、計算機圖形學等領域的最新進展,推動創(chuàng)新技術在產(chǎn)品中的實踐應用。
任職要求:
1、計算機科學、軟件工程、人工智能或相關專業(yè)本科及以上學歷,具備2年以上相關工作經(jīng)驗。
2、掌握人工智能基礎理論:熟悉深度學習、自然語言處理(NLP)、計算機視覺(CV)和語音信號處理的核心模型與基本原理。
3、了解數(shù)字人關鍵技術體系:對3D圖形渲染、語音克?。═TS)、形象驅動(如 blendshape、骨骼動畫)、動作捕捉等有清晰理解。
4、熟悉大模型應用生態(tài):了解主流大語言模型及其在智能體(Agent)開發(fā)框架中的使用方式。
5、編程技能扎實:精通 Python,熟練掌握至少一門其他語言(如 C++、Java、JavaScript),具備良好的數(shù)據(jù)結構與算法功底。
6、具備模型工程化能力:熟悉常用深度學習框架,擁有模型推理、優(yōu)化(如量化、剪枝)及實際部署經(jīng)驗。
7、具備后端開發(fā)與系統(tǒng)集成能力:掌握后端服務開發(fā)與API設計,了解微服務架構;有前端集成經(jīng)驗者優(yōu)先(Web/移動端)。
8、具備算力評估能力:能根據(jù)模型規(guī)模與業(yè)務需求,準確評估計算資源,提出合理的硬件選型建議,并制定本地或云端高效部署方案。
9、熟悉主流開發(fā)工具鏈及Linux開發(fā)環(huán)境。
10、了解主流AI開發(fā)平臺;熟悉語音克隆/形象克隆相關工具或開源項目;具備高并發(fā)系統(tǒng)開發(fā)與調優(yōu)經(jīng)驗者優(yōu)先。
11、具備良好溝通協(xié)調能力,能夠有效推進跨團隊協(xié)作。
12、具備團隊協(xié)作意識,能快速融入團隊工作氛圍。
13、具備持續(xù)學習能力,能主動吸收新技術與新知識。