售前技術(shù)支持(GPU 大模型)
1.7-2.5萬元/月1、主導或深度參與客戶GPU項目的實施落地,通過技術(shù)選型、資源管理與性能優(yōu)化,持續(xù)提升模型效能,確??蛻魳I(yè)務穩(wěn)定運行,保障GPU項目順利交付;
2、打造AI大模型全棧技術(shù)服務體系,聚焦AI算力、AI平臺、大模型后訓練及應用Agent方案等核心服務內(nèi)容,構(gòu)建標準化服務能力與典型場景模板;
1、計算機科學、機器學習、人工智能、自然語言處理或相關專業(yè)背景;
2、具備扎實的算法功底,掌握Transformer/BERT/GPT等主流模型架構(gòu),熟悉大模型訓練、微調(diào)與評估流程;
3、熟悉VLLM、SGLang等主流推理框架,了解TTFT/TPOT/并發(fā)等測試方法,掌握TP/DP/PD分離/EP等常見優(yōu)化策略;
4、具備大模型及AI項目端到端落地經(jīng)驗,擁有性能調(diào)優(yōu)與高可用保障能力,熟悉AIOps在云原生環(huán)境中的實踐路徑,能基于可觀測性數(shù)據(jù)實現(xiàn)智能告警、根因定位與自愈機制,提升AI系統(tǒng)在生產(chǎn)環(huán)境下的穩(wěn)定性、可靠性與運維效率;
5、熟練使用至少一種主流深度學習框架,如PyTorch、TensorFlow等;
6、精通Python開發(fā),具備良好的編程習慣與工程實現(xiàn)能力;
7、具備較強的自我驅(qū)動力,擁有優(yōu)秀的溝通協(xié)作能力與團隊合作意識,熱衷于運用AI技術(shù)解決實際問題;
加分項:
1、獲得阿里云ACA/ACP/ACE認證者優(yōu)先考慮;
2、具有基于阿里云產(chǎn)品的大規(guī)模生產(chǎn)環(huán)境開發(fā)或運維實踐經(jīng)驗