崗位職責:
負責 AI 系統(大模型服務、知識庫系統、數據處理流程等)的測試,包括功能測試、接口測試、性能測試等。
構建大模型相關評測數據集,執行模型效果驗證,包括問答準確率、生成質量、召回率等指標。
對數據質量進行審核,包括數據清洗、標簽檢查、一致性驗證與誤差分析。
參與構建自動化測試體系,實現接口自動化、回歸測試與數據 pipeline 的自動化驗證。
協助排查線上模型或數據問題,提供復現步驟與問題分析報告。
跟進版本發布流程,確保系統穩定性與質量可控。
任職要求:
熟練掌握基本測試方法、測試流程與測試用例設計。
有 API 測試、數據驗證測試或自動化測試經驗。
具備基礎編程能力(Python/Java),可編寫腳本實現自動化驗證邏輯。
熟悉大模型相關評測指標者優先,如 BLEU、ROUGE、Recall、Precision、Hallucination 檢查等。
具備數據敏感度,能識別數據異常、數據漂移、標注不一致等問題。
有 AI 產品測試、數據 QA、模型評測經驗者優先。