職位描述:
(1)參與大模型應用場景的技術方案設計,結合具體業務提供算法層面的支持,協助產品團隊定義功能邊界與技術指標,推動技術方案落地。
(2)開展大模型預訓練、微調策略研究,針對不同任務場景設計適配的訓練流程,優化數據篩選、清洗與預處理方案,提升模型訓練效率與效果。
(3)負責大模型的性能優化,在保證模型精度的前提下,降低模型顯存占用與推理延遲,滿足業務端低延遲、高并發的需求。
(4)協同多方團隊,明確大模型服務的接口規范、數據交互格式與性能指標,推動模型服務與業務系統的無縫集成,確保上線前功能與性能達標。
(5)跟蹤大模型領域的技術動態與研究成果,推動模型技術的持續迭代與創新,實現關鍵技術突破。
(6)開展技術分享與知識沉淀工作,整理大模型研發過程中的技術文檔,定期在團隊內部進行技術培訓。
任職資格:
1.學歷要求:碩士研究生及以上學歷,計算機、人工智能相關專業優先。
2.工作經歷:具備8年以上AI算法工作經驗,熟練掌握Python或C/C++,并具有深度學習算法相關經驗,了解國內外大模型演進及應用趨勢,3年以上大模型相關經驗者優先。
3.熟悉至少一種深度學習框架,如Pytorch、TensorFlow、JAX、PaddlePaddle或MindSpore,熟悉行業術語、流程和標準,可以提煉出模型真正需要解決的問題。
4. 精通多模態預訓練模型架構設計開發、訓練優化、行業大模型微調與知識庫構建、領域知識融合、業務場景驅動的模型性能調優及高并發推理部署。
5.可快速理解業務痛點、數據特性和價值場景,具備跨行業知識遷移能力;具有政務、金融、交通、旅游、能源、電力等垂直行業工程落地經驗者優先。
6.具有較強的溝通協調能力,面對問題能夠靈活處理;具備較強的學習能力,有團隊合作精神與較高的工作熱情。