崗位職責(zé):
1、協(xié)助項目經(jīng)理進行項目計劃制定和執(zhí)行,負責(zé) AI 平臺規(guī)劃、安裝、部署、測試,保障系統(tǒng)穩(wěn)定高效運行;
2、負責(zé) Kubernetes 私有集群搭建、運維、監(jiān)控、性能調(diào)優(yōu)及高可用保障;
3、處理 Kubernetes 集群的疑難問題,包括網(wǎng)絡(luò)(CNI)、存儲(CSI)、安全(RBAC/OPA)等方向的故障排查;
4、 定期更新和升級 AI 系統(tǒng),解決系統(tǒng)中的問題,提高系統(tǒng)的性能;
5、 編寫項目文檔,包括需求文檔、測試文檔、用戶手冊等;配合售后為客戶提供 AI 平臺技術(shù)支持與使用指導(dǎo)。
任職要求:
1、1年及以上相關(guān)工作經(jīng)驗。計算機、人工智能、數(shù)據(jù)科學(xué)等相關(guān)專業(yè)專科及以上學(xué)歷。
2、熟練掌握容器和K8S技術(shù)。
3、熟悉 Kubernetes 生態(tài)相關(guān)技術(shù)(如 Service Mesh、harbor、Helm、kubekey、PV/PVC、Hami、Prometheus 等)。
4、了解Nvidia / 國產(chǎn)GPU卡,監(jiān)控、調(diào)度等相關(guān)技術(shù)。
5、有大模型訓(xùn)練及推理工作經(jīng)驗的優(yōu)先。
6、 邏輯清晰,溝通協(xié)作能力強,能承受多項目并行交付壓力。
駐場地點:北京六環(huán)外
福利:雙休、五險一金、帶薪年假、商業(yè)意外險