深入理解 Transformer 架構、預訓練技術及主流 AI 框架(如 PyTorch);
熟悉自然語言處理、多模態融合、圖像識別、強化學習等典型AI任務;
掌握參數高效微調方法(LoRA、Prompt Tuning、Adapter 等)與推理加速技術;熟悉大規模模型訓練流程,具備模型安全性、穩定性、可解釋性方面的實踐經驗;
有高性能計算、算法優化或AI 工程落地經驗者優先。
提供AI 模型技術路線與研發策略制定,評估不同任務的技術選型;指導模型研發團隊進行訓練計劃、算法調優與推理優化設計;
參與模型架構演進、壓縮部署方案設計與性能調測;
審核核心模型研發工作,推動模型工程化與可持續迭代優化;
協助制定模型評估標準與測試框架,提供專家級技術支持。