大模型算法研發(fā)工程師
2-3.5萬(wàn)元/月崗位職責(zé):
1. 負(fù)責(zé)大規(guī)模語(yǔ)言模型在預(yù)訓(xùn)練、微調(diào)、指令優(yōu)化及評(píng)估環(huán)節(jié)的技術(shù)研發(fā),提升模型在對(duì)話交互、指令執(zhí)行、文本生成等場(chǎng)景下的實(shí)用性和穩(wěn)定性。
2. 設(shè)計(jì)并落地 RAG 框架中檢索模塊與大模型的協(xié)同機(jī)制,優(yōu)化召回精度、排序策略以及上下文整合方法。
3. 推進(jìn)大模型在推理階段的工程實(shí)現(xiàn)(包括模型切分、量化處理、內(nèi)存管理與延遲控制),確保模型以高可用服務(wù)形式穩(wěn)定運(yùn)行。
4. 構(gòu)建或持續(xù)完善模型評(píng)估與監(jiān)控系統(tǒng)(涵蓋自動(dòng)化評(píng)測(cè)腳本、對(duì)話質(zhì)量度量、線上行為追蹤與日志回放)。
5. 與產(chǎn)品、后端、前端及數(shù)據(jù)團(tuán)隊(duì)緊密協(xié)作,完成需求分析、技術(shù)方案設(shè)計(jì)及系統(tǒng)上線部署。
6. 關(guān)注自然語(yǔ)言處理與大模型領(lǐng)域的最新進(jìn)展(如指令優(yōu)化、RAG 技術(shù)、對(duì)齊方法),開(kāi)展新技術(shù)評(píng)估并推動(dòng)原型驗(yàn)證。
任職要求:
1. 計(jì)算機(jī)科學(xué)、人工智能、計(jì)算語(yǔ)言學(xué)、數(shù)學(xué)等相關(guān)專業(yè)碩士及以上學(xué)歷,具備扎實(shí)的機(jī)器學(xué)習(xí)理論基礎(chǔ)(涵蓋概率論、優(yōu)化方法、深度學(xué)習(xí)原理),具有2年以上人工智能相關(guān)開(kāi)發(fā)經(jīng)驗(yàn)。
2. 熟悉 Transformer 結(jié)構(gòu),掌握語(yǔ)言模型的預(yù)訓(xùn)練、微調(diào)、指令調(diào)優(yōu)(instruction tuning)和 RLHF 技術(shù)(具備實(shí)踐經(jīng)驗(yàn)者優(yōu)先);了解 embeddings、信息檢索、對(duì)話管理及相關(guān)評(píng)估指標(biāo)。
3. 熟練使用 PyTorch 框架,熟悉 Hugging Face Transformers、Accelerate、DeepSpeed、bitsandbytes 等分布式訓(xùn)練與性能優(yōu)化工具。
4. 編程能力扎實(shí),精通 Python,具備高性能推理開(kāi)發(fā)經(jīng)驗(yàn)(包括模型量化、剪枝、tensor_parallel、pipeline parallel 等技術(shù))。
優(yōu)先/加分項(xiàng):
1. 具備 RAG(檢索增強(qiáng)生成)、語(yǔ)義搜索、稠密/稀疏檢索(如 FAISS、Milvus、Elasticsearch)實(shí)際項(xiàng)目經(jīng)驗(yàn)。
2. 了解模型安全性、偏見(jiàn)識(shí)別、對(duì)齊機(jī)制與內(nèi)容審核策略。
3. 在 LLM 微調(diào)技術(shù)(如 LoRA/PEFT)、混合精度訓(xùn)練、模型量化(INT8/4-bit)及推理加速方面有實(shí)際落地經(jīng)驗(yàn)。
4. 具備多模態(tài)(NLP 與視覺(jué)、語(yǔ)音結(jié)合)建模經(jīng)驗(yàn)者優(yōu)先考慮。
5. 熟悉產(chǎn)品級(jí)工作流程(如數(shù)據(jù)標(biāo)注、評(píng)測(cè)平臺(tái)建設(shè)、RLHF 實(shí)施)及 MLOps 工程實(shí)踐。