崗位職責(zé):
1.負(fù)責(zé)大規(guī)模預(yù)訓(xùn)練模型(LLM)的設(shè)計(jì)、開(kāi)發(fā)、訓(xùn)練及調(diào)優(yōu),包括架構(gòu)創(chuàng)新、參數(shù)效率提升等;
2.負(fù)責(zé)數(shù)據(jù)處理與工程化,構(gòu)建高質(zhì)量多模態(tài)訓(xùn)練數(shù)據(jù)集,設(shè)計(jì)數(shù)據(jù)清洗、增強(qiáng)及標(biāo)注策略等;
3.負(fù)責(zé)模型部署與性能優(yōu)化,實(shí)現(xiàn)模型的高效推理部署,優(yōu)化GPU/TPU資源利用率,研究模型服務(wù)化方案(如API服務(wù)、邊緣端部署),解決延遲、吞吐量等性能瓶頸;
4.與產(chǎn)品、業(yè)務(wù)團(tuán)隊(duì)深度合作,將技術(shù)能力轉(zhuǎn)化為實(shí)際應(yīng)用場(chǎng)景,撰寫技術(shù)文檔、專利及論文,推動(dòng)團(tuán)隊(duì)技術(shù)影響力。
任職資格:
1.計(jì)算機(jī)科學(xué)、軟件工程、數(shù)學(xué)或相關(guān)領(lǐng)域統(tǒng)招本科及以上學(xué)歷;
2.3年以上算法研發(fā)經(jīng)驗(yàn),精通PyTorch框架,且滿足下列條件之一:
- 大模型(10B+參數(shù))訓(xùn)練/微調(diào)實(shí)戰(zhàn)經(jīng)驗(yàn),深入理解Transformer、注意力機(jī)制、RLHF等核心技術(shù),具備模型源碼級(jí)調(diào)優(yōu)能力。理解RAG技術(shù)鏈實(shí)現(xiàn)邏輯,有自研RAG算法能力;
- 熟悉Megatron-LM、DeepSpeed等分布式訓(xùn)練工具,熟練使用CUDA、TensorRT等加速庫(kù),具有模型優(yōu)化部署能力;
- 熟悉計(jì)算機(jī)視覺(jué)領(lǐng)域,有分類/檢測(cè)/分割的實(shí)際落地項(xiàng)目經(jīng)驗(yàn)。熟悉傳統(tǒng)圖像算法;
- 熟悉運(yùn)籌優(yōu)化算法理論,有人員排班/車輛路徑規(guī)劃等項(xiàng)目經(jīng)驗(yàn)。
3.熟悉發(fā)明專利的撰寫規(guī)范,有相應(yīng)經(jīng)驗(yàn)者優(yōu)先。