AI算法研發(fā)工程師(大模型領(lǐng)域)
2.5-3.5萬元/月公司注冊資金2.4億元,已獲得成都市倍特基金數(shù)億元投資。
公司總部位于成都市高新區(qū)AI創(chuàng)新中心,并在深圳設(shè)有研發(fā)分中心、技術(shù)支持中心及銷售中心。
我們積極響應“十五五”規(guī)劃中關(guān)于突破工業(yè)軟件卡脖子環(huán)節(jié)、以自主研發(fā)與生態(tài)聚合之力,投身科技自立自強與工業(yè)軟件攻堅的偉大進程,服務中國電子制造業(yè)的轉(zhuǎn)型升級。
我們誠摯邀請懷揣技術(shù)理想、志在產(chǎn)業(yè)報國的您,共同推動國產(chǎn)化替代與產(chǎn)業(yè)升級。
一、崗位職責
1、開展先進強化學習算法的研究與開發(fā),構(gòu)建高效訓練流程與模型結(jié)構(gòu)。
2、定位并解決算法落地過程中的實際問題,協(xié)同數(shù)據(jù)科學家、工程師及產(chǎn)品經(jīng)理,保障產(chǎn)品技術(shù)領(lǐng)先性。
3、設(shè)計并實現(xiàn)適配業(yè)務場景的多智能體系統(tǒng)與RAG工作流,通過模型調(diào)優(yōu)、prompt優(yōu)化等手段持續(xù)提升算法服務能力。
4、跟進前沿科研動態(tài),評估新技術(shù)可行性并融入項目實踐。
二、任職要求
1、計算機科學、人工智能、數(shù)學或相關(guān)專業(yè)本科及以上學歷。
2、具備3年以上深度學習與強化學習領(lǐng)域?qū)嶋H工作經(jīng)驗。
3、掌握主流開源大模型訓練微調(diào)框架,如llamafactory、huggingface、swift等。
4、熟悉deepseek、qwen、llama等開源大模型架構(gòu)特點及其創(chuàng)新機制,具備實際部署與應用經(jīng)驗。
5、精通常見微調(diào)算法,深入理解其原理與工程實現(xiàn)方式。
6、掌握強化學習算法體系,具有Q-learning、Policy Gradients、DQN、PPO、GRPO等算法的實戰(zhàn)經(jīng)驗。
7、能熟練運用開源工具搭建agent與RAG工作流,熟悉相關(guān)性能優(yōu)化策略。
8、編程能力扎實,精通Python或C++,可獨立完成完整訓練與驗證流程開發(fā)。
9、對數(shù)據(jù)處理方法有深刻理解并具備豐富實踐經(jīng)驗。
三、工作時間及福利待遇
1、六險一金:入職當月即繳納社保,全額繳納公積金。
2、工作時間:9:00-18:30,午休1.5小時,周末雙休,法定節(jié)假日正常休息。
3、福利待遇:全勤獎(200元)、節(jié)日福利、下午茶點、部門團建、帶薪年假。
4、公司提供明確的職級晉升路徑與個人成長支持機制。