Python大模型訓(xùn)練師+外包+穩(wěn)定
面議崗位要求:
1.計(jì)算機(jī)科學(xué)或相關(guān)技術(shù)領(lǐng)域的本科及以上學(xué)歷。
2.3年以上的生產(chǎn)環(huán)境軟件工程經(jīng)驗(yàn)。
3.精通Python編程語(yǔ)言。
4.具備在至少一個(gè)主流Maas平臺(tái)上管理大模型的經(jīng)驗(yàn)。
5.具備容器化和編排技術(shù)(Docker,Kubernetes)的使用經(jīng)驗(yàn)。
6.具備訓(xùn)練、微調(diào)或服務(wù)化大語(yǔ)言模型(LLM)的實(shí)踐經(jīng)驗(yàn)。
7.在MLOps/LLMOps領(lǐng)域有深厚的專(zhuān)業(yè)知識(shí),包括模型的CI/CD、數(shù)據(jù)/模型版本控制和生產(chǎn)監(jiān)控。
8.具備大規(guī)模分布式訓(xùn)練框架的使用經(jīng)驗(yàn)。
9.熟悉LLM評(píng)估的學(xué)術(shù)和實(shí)踐前沿。
10.在設(shè)計(jì)、構(gòu)建和運(yùn)營(yíng)大規(guī)模分布式系統(tǒng)方面有可靠的過(guò)往經(jīng)驗(yàn)。
工作內(nèi)容:
1.設(shè)計(jì)、構(gòu)建并維護(hù)基礎(chǔ)LLM集群所需的可擴(kuò)展、高彈性的Kubernetes基礎(chǔ)設(shè)施。
2.開(kāi)發(fā)并主導(dǎo)用于核心模型持續(xù)集成、驗(yàn)證、部署和監(jiān)控的MLOps/LLMOps流水線。
3.主導(dǎo)使用行業(yè)基準(zhǔn)對(duì)模型進(jìn)行系統(tǒng)性評(píng)估,并開(kāi)發(fā)新穎的框架來(lái)測(cè)試其性能、安全性、公平性和偏見(jiàn)。
4.將評(píng)估洞察轉(zhuǎn)化為清晰、數(shù)據(jù)驅(qū)動(dòng)的報(bào)告,為內(nèi)部的研發(fā)和實(shí)施團(tuán)隊(duì)定義模型的能力邊界。
5.規(guī)劃并執(zhí)行分布式訓(xùn)練和微調(diào)任務(wù)。
6.與算法科學(xué)家和應(yīng)用工程師緊密合作,將下一代基礎(chǔ)模型投入生產(chǎn)環(huán)境。