一、崗位職責(zé)?
基于開源大模型基座(如 Llama、ChatGLM、Qwen 等),負(fù)責(zé)垂直領(lǐng)域(重點(diǎn)覆蓋醫(yī)學(xué))數(shù)據(jù)集的收集、清洗、標(biāo)注、質(zhì)量校驗(yàn),搭建高質(zhì)量領(lǐng)域數(shù)據(jù)集體系;?
主導(dǎo)垂直領(lǐng)域大模型的微調(diào)訓(xùn)練,包括數(shù)據(jù)預(yù)處理、模型選型、超參數(shù)調(diào)優(yōu)、訓(xùn)練過程監(jiān)控與效果迭代,提升模型在特定場景的專業(yè)問答、知識(shí)輸出能力;?
負(fù)責(zé)模型訓(xùn)練環(huán)境搭建、依賴管理,解決訓(xùn)練過程中的性能瓶頸、過擬合 / 欠擬合等問題,保障訓(xùn)練效率與模型效果;?
參與大模型微調(diào)后的效果評(píng)估與迭代優(yōu)化,制定領(lǐng)域內(nèi)模型評(píng)估指標(biāo)(如準(zhǔn)確率、召回率、專業(yè)度契合度),持續(xù)提升模型實(shí)用性;?
協(xié)同產(chǎn)品、算法團(tuán)隊(duì),明確業(yè)務(wù)需求與技術(shù)落地路徑,輸出模型開發(fā)文檔、訓(xùn)練報(bào)告及部署指南;?
跟蹤開源大模型技術(shù)前沿,探索新的微調(diào)方法、數(shù)據(jù)增強(qiáng)技術(shù)在垂直領(lǐng)域的應(yīng)用,推動(dòng)技術(shù)方案迭代。?
二、任職要求?
(一)核心技能要求?
熟練掌握 Python 編程語言,精通數(shù)據(jù)處理相關(guān)庫(NumPy、Pandas、Datasets),具備大規(guī)模領(lǐng)域數(shù)據(jù)集整理與優(yōu)化經(jīng)驗(yàn);?
深入理解 Transformer 架構(gòu),熟練使用至少一種深度學(xué)習(xí)框架(PyTorch/TensorFlow),具備基于開源大模型的微調(diào)實(shí)戰(zhàn)經(jīng)驗(yàn)(如 LoRA、QLoRA 等高效微調(diào)方法);?
熟悉 Hugging Face 生態(tài)(Transformers、Trainer API),能夠獨(dú)立完成模型選型、訓(xùn)練流程搭建、效果驗(yàn)證全流程;?
具備數(shù)據(jù)標(biāo)注流程設(shè)計(jì)與質(zhì)量管控能力,能應(yīng)對(duì)垂直領(lǐng)域數(shù)據(jù)稀缺、專業(yè)性強(qiáng)的問題,有數(shù)據(jù)增強(qiáng)、小樣本學(xué)習(xí)實(shí)踐經(jīng)驗(yàn)者優(yōu)先;?
掌握模型訓(xùn)練環(huán)境配置(GPU 集群、Docker),了解模型量化、剪枝等輕量化技術(shù),具備基本的模型部署與推理優(yōu)化思維。?
(二)優(yōu)先條件(核心加分項(xiàng))?
具備醫(yī)學(xué)領(lǐng)域大模型開發(fā)經(jīng)驗(yàn)(如醫(yī)療問答、醫(yī)學(xué)文獻(xiàn)分析、臨床輔助決策等方向),熟悉醫(yī)學(xué)術(shù)語、醫(yī)療數(shù)據(jù)規(guī)范者優(yōu)先;?
有垂直領(lǐng)域(如法律、金融、工業(yè))大模型微調(diào)、數(shù)據(jù)集構(gòu)建實(shí)戰(zhàn)案例者優(yōu)先;?
了解醫(yī)療數(shù)據(jù)合規(guī)要求(如隱私保護(hù)、數(shù)據(jù)脫敏),具備醫(yī)療相關(guān)數(shù)據(jù)集處理經(jīng)驗(yàn)者優(yōu)先;?
?
(三)綜合素養(yǎng)?
具備較強(qiáng)的業(yè)務(wù)理解能力,能快速對(duì)齊垂直領(lǐng)域需求與技術(shù)實(shí)現(xiàn)路徑;?
具備良好的問題排查能力,能獨(dú)立解決訓(xùn)練過程中的技術(shù)難題;?
具備團(tuán)隊(duì)協(xié)作精神
關(guān)注 AI 技術(shù)前沿,學(xué)習(xí)能力強(qiáng),能快速跟進(jìn)開源大模型的新特性與新工具。