大模型算法研發(fā)工程師
4-6萬元/月工作職責(zé):
1. 主導(dǎo)大規(guī)模語言模型(LLM)與多模態(tài)大模型的核心算法研發(fā)及優(yōu)化工作,涵蓋模型結(jié)構(gòu)創(chuàng)新、預(yù)訓(xùn)練/指令微調(diào)/對(duì)齊方法(如RLHF)、高效訓(xùn)練策略(如PEFT)、模型輕量化與加速、長(zhǎng)序列建模、知識(shí)融合技術(shù)(如RAG)等關(guān)鍵技術(shù)方向。
2. 深入理解業(yè)務(wù)場(chǎng)景,推動(dòng)大模型的實(shí)際應(yīng)用落地:基于具體業(yè)務(wù)需求,開展模型的定制化調(diào)整、精細(xì)化訓(xùn)練與性能提升,設(shè)計(jì)并實(shí)施面向特定應(yīng)用場(chǎng)景的模型解決方案,持續(xù)優(yōu)化效果、穩(wěn)定性與運(yùn)行效率。
3. 構(gòu)建并迭代AI Agent系統(tǒng):利用大模型能力,設(shè)計(jì)和開發(fā)智能代理的關(guān)鍵功能模塊(如任務(wù)規(guī)劃、記憶機(jī)制、工具調(diào)用、多智能體協(xié)同等),推進(jìn)Agent技術(shù)在實(shí)際業(yè)務(wù)中的創(chuàng)新實(shí)踐。
4. 負(fù)責(zé)算法從需求到上線的全流程管理:包括需求拆解、方案設(shè)計(jì)、數(shù)據(jù)處理、模型訓(xùn)練與評(píng)估、性能調(diào)優(yōu)、工程部署及后續(xù)監(jiān)控與迭代,保障算法穩(wěn)定高效地支持產(chǎn)品運(yùn)行。
5. 關(guān)注人工智能前沿動(dòng)態(tài):持續(xù)跟蹤大模型、智能體等相關(guān)領(lǐng)域的最新研究成果,評(píng)估新技術(shù)的可行性與應(yīng)用價(jià)值,推動(dòng)先進(jìn)技術(shù)在產(chǎn)品中的轉(zhuǎn)化與落地,維持團(tuán)隊(duì)的技術(shù)領(lǐng)先性。
6. 技術(shù)積累與內(nèi)部共享:輸出高質(zhì)量的技術(shù)文檔、架構(gòu)設(shè)計(jì)與實(shí)驗(yàn)分析報(bào)告,積極參與團(tuán)隊(duì)內(nèi)的知識(shí)傳遞與技術(shù)能力建設(shè)。
崗位要求:
1. 具備3至5年相關(guān)工作經(jīng)驗(yàn),碩士及以上學(xué)歷,專業(yè)方向?yàn)橛?jì)算機(jī)科學(xué)、人工智能、軟件工程、電子工程、數(shù)學(xué)、統(tǒng)計(jì)學(xué)或相近領(lǐng)域。
2. 核心技術(shù)能力:
- 熟悉自然語言處理(NLP)與多模態(tài)學(xué)習(xí)的基本理論與前沿進(jìn)展。
- 擁有扎實(shí)的大模型實(shí)戰(zhàn)經(jīng)驗(yàn):掌握主流大模型(如Transformer系列)的原理、結(jié)構(gòu)、訓(xùn)練與推理流程。
- 精通至少一種主流分布式訓(xùn)練框架的使用方式與底層機(jī)制。
- 理解AI Agent核心模塊(如規(guī)劃、記憶、工具集成等)及其典型架構(gòu),具備實(shí)際構(gòu)建Agent系統(tǒng)經(jīng)驗(yàn)者優(yōu)先。
3. 工程實(shí)現(xiàn)能力:熟練掌握Python編程,熟悉Linux開發(fā)環(huán)境,具備較強(qiáng)的算法實(shí)現(xiàn)與調(diào)試能力;有模型部署、推理性能優(yōu)化經(jīng)驗(yàn)者更佳。
數(shù)據(jù)處理能力:熟悉大規(guī)模數(shù)據(jù)處理流程,掌握數(shù)據(jù)清洗與增強(qiáng)技術(shù),對(duì)數(shù)據(jù)質(zhì)量具備良好判斷力。
4. 具備出色的跨團(tuán)隊(duì)協(xié)作與溝通能力,展現(xiàn)出技術(shù)引領(lǐng)潛力;熱愛技術(shù),自我驅(qū)動(dòng),具備優(yōu)秀的問題分析與解決能力,富有團(tuán)隊(duì)合作意識(shí),表達(dá)清晰,責(zé)任心強(qiáng),能夠適應(yīng)較高強(qiáng)度的工作節(jié)奏。
優(yōu)先考慮:
1. 在大模型預(yù)訓(xùn)練、指令微調(diào)、參數(shù)高效微調(diào)(PEFT)、對(duì)齊算法(RLHF/DPO)等方面有深入研究或項(xiàng)目實(shí)踐。
2. 具備檢索增強(qiáng)生成(RAG)、智能體(Agent)應(yīng)用、多模態(tài)大模型、模型壓縮與量化等方向的實(shí)際落地經(jīng)驗(yàn)。
3. 在NeurIPS、ICML、ICLR、ACL、EMNLP、CVPR等頂級(jí)AI會(huì)議或期刊上發(fā)表過相關(guān)論文。