數(shù)據(jù)標注
7000-12000元/月北京、成都模型標注
【崗位職責】
● 參與大語言模型(LLM)通用能力的日常評測工作,涵蓋文本生成、邏輯推理、知識問答、多輪對話、代碼生成等核心任務的效果評估。
● 依據(jù)既定評測規(guī)范與流程,對模型輸出內(nèi)容進行準確評分與標注,及時記錄評測中發(fā)現(xiàn)的問題及模型缺陷,并形成完整的評測記錄。
● 協(xié)助搭建自動化評估數(shù)據(jù)集,參與題目設計、考點提煉及評分規(guī)則制定等相關(guān)工作。
● 參與評測數(shù)據(jù)的整理、清洗與標注,協(xié)助提升測試樣本的覆蓋范圍與代表性,保障評測數(shù)據(jù)質(zhì)量。
● 配合項目組推進評測任務執(zhí)行,反饋實際操作中的問題(如標準不明確、樣本異常等),協(xié)同優(yōu)化評測策略與流程。
【崗位要求】
● 本科及以上學歷,專業(yè)不限。
● 具備較強的文字理解與表達能力,思維條理清晰,有良好的共情能力與用戶意識。
● 工作態(tài)度嚴謹,責任心強,具備良好的執(zhí)行力和團隊合作意識,能嚴格執(zhí)行評測規(guī)范與流程。
● 掌握基礎計算機操作技能,熟練使用常用辦公軟件(如Excel、Word),有數(shù)據(jù)標注或模型評估經(jīng)驗者優(yōu)先考慮。
● 對人工智能、大語言模型技術(shù)方向有興趣,長期使用主流AI產(chǎn)品并有獨立見解,熟悉智能客服系統(tǒng)知識庫維護及模型測試迭代流程。
工作地址:北京騰訊大廈 (北京當?shù)睾蜻x人優(yōu)先)
工作地址:成都騰訊(成都當?shù)睾蜻x人優(yōu)先)
工作時間:朝十晚七,雙休、五險一金
薪酬范圍:北京8-13k,成都7-12k,12薪
面試流程:線下集體筆試 → 線上初試 → 線上復試 → 錄用通知