職位描述:
1、為部署在大型數據中心、AI實驗室和云服務商中的高端計算硬件(如NVIDIA H系列、A系列,或國產算力卡)提供技術支持;
2、需解決從硬件故障、驅動兼容性到大規模集群性能調優的全棧技術挑戰,確??蛻鬉I業務和科學計算的穩定與高效運行;
主要職責:
1、現場技術支持,負責GPU算力卡及其服務器(如DGX/HGX系統、自主品牌AI服務器)的現場部署、上架、調試及故障診斷(包括硬件更換、固件升級等);
2、快速響應和解決客戶在GPU驅動、容器環境、深度學習框架和作業調度平臺中遇到的技術問題。
任職要求:
1、 計算機科學、電子信息、通信工程或相關專業本科及以上學歷;
2、深刻理解GPU算力卡(如NVIDIA/AMD/國產芯片)的硬件架構,熟悉其供電、散熱和高速互連(NVLink/NVSwitch)特性,具備服務器硬件級故障診斷能力;
3、領會NVIDIA GPU軟件棧、驅動程序、CUDA Toolkit、cuDNN、TensorRT、NCCL;
4、熟悉Linux操作系統(特別是Ubuntu/CentOS);
5、可適應出差;
6、良好的溝通表達能力;
工作地點:西寧市及其周邊地區(西寧市湟中區錦川大道200號中國聯通三江源綠電智算融合示范園)
職位福利:五險一金、帶薪年假、員工旅游、節日福利、年終獎 。