多模態(tài)算法工程師
5-7.5萬(wàn)元/月職位描述
1.負(fù)責(zé)智能眼鏡端多模態(tài)交互核心算法研發(fā)與落地,重點(diǎn)攻克實(shí)時(shí)音視頻問(wèn)答、視覺(jué)記憶相關(guān)技術(shù)難題,保障設(shè)備端算法高效穩(wěn)。
2.主導(dǎo)音視頻、文本、圖像等多模態(tài)數(shù)據(jù)融合處理,設(shè)計(jì)優(yōu)化多模態(tài)語(yǔ)義理解、跨模態(tài)檢索等核心模塊,提升交互精準(zhǔn)度與流暢。
3.針對(duì)視覺(jué)記憶場(chǎng)景,研發(fā)圖像/視頻內(nèi)容特征提取、匹配及高效存儲(chǔ)算法,實(shí)現(xiàn)場(chǎng)景快速記憶、精準(zhǔn)召回與智能問(wèn)答交互。
4.負(fù)責(zé)多模態(tài)算法的云端部署方案設(shè)計(jì)與實(shí)現(xiàn),完成算法性能調(diào)優(yōu),保障實(shí)時(shí)性要求(如控制音視頻問(wèn)答響應(yīng)延遲)。
5.跨團(tuán)隊(duì)協(xié)作產(chǎn)品、軟件研發(fā)團(tuán)隊(duì),明確技術(shù)需求,推動(dòng)算法方案落地驗(yàn)證與迭代,解決項(xiàng)目技術(shù)瓶頸。
職位要求
1.計(jì)算機(jī)科學(xué)與技術(shù)、電子信息、人工智能等相關(guān)專業(yè),碩士及以上學(xué)歷;博士學(xué)歷或有相關(guān)領(lǐng)域突出成果者優(yōu)先。
2.精通多模態(tài)數(shù)據(jù)融合、語(yǔ)義理解、跨模態(tài)檢索技術(shù),熟練堂握?qǐng)D像,視頻特征提取、匹配及存儲(chǔ)算法,深耕視覺(jué)記憶、實(shí)時(shí)音視運(yùn)用PyTorch/TensorFlow,具備扎實(shí)調(diào)優(yōu)能力。
3.具備算法工程化經(jīng)驗(yàn),熟悉多模態(tài)算法云端部署;了解記憶系統(tǒng)者優(yōu)先;能解決音視頻問(wèn)答延遲等實(shí)時(shí)性問(wèn)題,精通性能調(diào)優(yōu)3穩(wěn)定運(yùn)行;有大規(guī)模數(shù)據(jù)處理及迭代經(jīng)驗(yàn)者優(yōu)先。
4.具備較強(qiáng)的問(wèn)題解決能力、團(tuán)隊(duì)協(xié)作意識(shí),對(duì)新技術(shù)敏感,能快速跟進(jìn)行業(yè)前沿并落地實(shí)踐。