AI平臺研發(fā)工程師(云原生方向)
1.2-1.8萬元/月【崗位要求】
1. 計算機、軟件工程或相關(guān)專業(yè),本科及以上學歷;
2. 熟悉 Linux 操作環(huán)境,掌握 Shell、Python 或 Go 中至少一種編程語言;
3. 掌握容器化技術(shù)及資源調(diào)度系統(tǒng)(如 Docker、Kubernetes)的工作原理與實際應(yīng)用;
4. 了解主流 AI 框架(如 PyTorch、TensorFlow)的基本使用方法和運行流程;
5. 對 GPU 架構(gòu)、分布式訓練機制以及存儲、網(wǎng)絡(luò)等基礎(chǔ)組件有一定認知;
6. 具備系統(tǒng)級問題定位能力,關(guān)注性能調(diào)優(yōu)與系統(tǒng)穩(wěn)定性提升;
7. 具備良好的溝通協(xié)調(diào)能力,能夠協(xié)同算法、平臺、運維等多個團隊開展工作。
【加分項】
1. 具備 AI 訓練平臺或調(diào)度框架(如 Volcano、KubeFlow、Ray)的使用或開發(fā)經(jīng)驗;
2. 熟悉模型服務(wù)發(fā)布技術(shù)(如 Triton、TorchServe、BentoML);
3. 有分布式系統(tǒng)設(shè)計或 DevOps 實踐經(jīng)歷;
4. 對 AI 工程化領(lǐng)域(如數(shù)據(jù)流水線、模型監(jiān)控、評估系統(tǒng))有探索意愿。
崗位職責
1. 參與公司級 AI 平臺、數(shù)據(jù)處理及訓練底層架構(gòu)的搭建與持續(xù)優(yōu)化;
2. 承擔模型訓練、推理執(zhí)行、效果評估等環(huán)節(jié)的資源分配與自動化流程支持;
3. 參與 GPU 資源池、容器集群(Kubernetes/Volcano 等)的管理與性能調(diào)優(yōu);
4. 協(xié)助算法團隊構(gòu)建實驗管理體系、任務(wù)調(diào)度機制及日志監(jiān)控平臺;
5. 推進模型部署方案優(yōu)化(如 ONNX、TensorRT、TorchServe、FastAPI 等);
6. 持續(xù)完善 CI/CD 流水線,提升研發(fā)迭代與實驗驗證效率。