崗位職責
1. 研究結構化數據大模型、大語言模型、AI Agent、知識計算領域的訓練與評估方法,負責模型設計、模型訓練、模型測試;
2. 負責結構化數據大模型核心算法的前沿技術探索與落地,包括超大規模預訓練、指令微調、強化學習等,從多語言角度出發,解決幻覺、長文本等問題;
3. 負責模型加速與優化,輕量化設計與處理,包括模型剪枝/量化等算法研發。
任職要求
1. 有大模型實操研究經歷、預訓練或指令微調經驗,熟悉QWen、LLaMA、Deepseek等大模型的訓練和部署;
2. 扎實的計算機和深度學習基礎,能夠靈活應用解決實際問題;
3. 較強的算法實現能力,掌握Python/C++/C等語言;
4. 熟悉大模型、深度學習原理和基本模型,熟練使用常用深度學習工具。
5. 具有較強的學習能力,良好的團隊合作精神,具備較強的責任心。