語音感知交互研發(fā)工程師
2-2.5萬元/月崗位職責(zé):
1. 核心算法研發(fā)與迭代
負(fù)責(zé)機器人語音交互核心技術(shù)的攻關(guān)與升級,涵蓋語音識別(ASR)、語音分離與增強、語音合成(TTS)、關(guān)鍵詞喚醒(KWS)、聲紋識別、聲源定位、異常聲音檢測等方向。
持續(xù)提升算法在復(fù)雜環(huán)境下的識別準(zhǔn)確率、響應(yīng)速度、穩(wěn)定性及資源效率,優(yōu)化整體交互體驗。
跟蹤語音技術(shù)發(fā)展趨勢,推進(jìn)前沿研究成果向?qū)嶋H產(chǎn)品轉(zhuǎn)化。
2. 算法工程化與系統(tǒng)部署
主導(dǎo)語音算法從實驗?zāi)P偷焦I(yè)級落地的全流程實現(xiàn),完成模型壓縮、推理加速以及多平臺適配(如嵌入式設(shè)備、移動終端、CPU/GPU)。
構(gòu)建高可靠性的語音處理流水線,支持低延遲、高并發(fā)的實時交互需求。
協(xié)同軟硬件團隊完成算法集成、聯(lián)合調(diào)試與性能調(diào)優(yōu),保障系統(tǒng)穩(wěn)定運行與交付。
3. 數(shù)據(jù)體系建設(shè)與效能提升
搭建高效的數(shù)據(jù)閉環(huán)架構(gòu),覆蓋數(shù)據(jù)采集、標(biāo)注、清洗、增強及管理環(huán)節(jié),提升數(shù)據(jù)驅(qū)動的迭代效率。
結(jié)合具體業(yè)務(wù)場景開展數(shù)據(jù)分析,精準(zhǔn)優(yōu)化模型泛化能力與環(huán)境適應(yīng)性。
4. 技術(shù)沉淀與創(chuàng)新
撰寫算法設(shè)計文檔、實驗記錄與技術(shù)總結(jié),促進(jìn)團隊內(nèi)部知識共享。
基于研發(fā)成果,規(guī)劃并推進(jìn)核心技術(shù)創(chuàng)新與專利布局。
任職要求:
基本要求:
1. 本科及以上學(xué)歷,計算機、人工智能、電子信息、數(shù)字信號處理、應(yīng)用數(shù)學(xué)等相關(guān)專業(yè),具備3年以上語音算法研發(fā)及落地經(jīng)驗。
2. 具備扎實的語音信號處理與機器學(xué)習(xí)理論基礎(chǔ),熟練掌握至少一種主流深度學(xué)習(xí)框架(如PyTorch、TensorFlow)。
3. 在語音識別(ASR)、語音合成(TTS)、語音分離/增強、關(guān)鍵詞喚醒(KWS)等方向之一有實際項目經(jīng)歷。
4. 具備較強的算法工程化能力,熟悉模型優(yōu)化、壓縮、加速及端側(cè)部署技術(shù)(如TensorRT、ONNX、輕量級推理框架等)。
5. 精通Python/C++,具備良好的編程規(guī)范和系統(tǒng)級調(diào)試能力。
6. 具備良好的溝通協(xié)作意識與文檔編寫習(xí)慣,能夠推動算法在復(fù)雜系統(tǒng)中的集成與落地。
加分項:
1. 擁有嵌入式或移動端語音算法部署經(jīng)驗,熟悉ARM/NEON指令集優(yōu)化。
2. 具備大規(guī)模語音數(shù)據(jù)處理能力,了解數(shù)據(jù)閉環(huán)構(gòu)建與數(shù)據(jù)策略設(shè)計方法。
3. 在語音領(lǐng)域頂會(如INTERSPEECH、ICASSP等)發(fā)表過論文,或參與過開源項目貢獻(xiàn)。
4. 熟悉多模態(tài)交互、自然語言處理(NLP)等相關(guān)技術(shù),具備跨領(lǐng)域技術(shù)融合經(jīng)驗。
5. 有機器人、智能硬件、車載語音等產(chǎn)品中語音系統(tǒng)開發(fā)經(jīng)驗者優(yōu)先。