崗位職責:
1.模型開發與訓練: 負責從0到1構建、訓練和優化機器學習/深度學習模型,解決具體的業務問題,包括但不限于:高質量文本分類模型的開發,如報告質量評估;大型語言模型的專項微調與優化,以在特定任務和環境中達到極致性能。
2.端到端項目交付: 獨立或協同完成整個項目生命周期,包括需求理解、數據預處理、模型開發、模型訓練與迭代、性能評估、模型部署上線以及技術文檔編寫。
3.算法研究與創新: 跟蹤NLP和LLM領域的最新進展,并將先進技術應用于實際項目,以提升模型效果與效率。
4.代碼與工程: 編寫高質量、可維護、可復現的代碼,并遵循軟件工程最佳實踐。
任職要求:
1.畢業于 211/985 院校,碩士及以上學歷,計算機科學、人工智能、電子工程、數學或相關專業。
2.具備 3年及以上開發經驗,有完整的機器學習項目從設計到部署的實踐經驗,尤其是LLM或其他NLP模型的實踐經驗。
3.熟練掌握python等編程語言,熟悉模型微調、推理部署、輕量化開發等流程。熟練掌握Pytorch、Tensorflow等深度學習訓練框架,具有一定強化學習應用經驗。
4.具備優秀的英文技術文檔閱讀與學術論文理解能力,能無障礙地使用英文進行技術方案撰寫與郵件溝通。