崗位職責(zé):
1、服務(wù)器部署與維護(hù):負(fù)責(zé)服務(wù)器硬件安裝、調(diào)試與擴(kuò)容,部署操作系統(tǒng)及必要軟件,定期巡檢硬件狀態(tài)與系統(tǒng)運(yùn)行情況,及時(shí)更換故障部件。合理分配 CPU、內(nèi)存、存儲(chǔ)等資源,監(jiān)控資源使用率,優(yōu)化資源配置,提升服務(wù)器利用率。
2、容器平臺(tái)搭建與運(yùn)維:負(fù)責(zé) Docker、K8s 集群的部署、升級(jí)與日常維護(hù),優(yōu)化集群資源配置,保障平臺(tái)穩(wěn)定、高效運(yùn)行。推動(dòng)業(yè)務(wù)應(yīng)用從物理機(jī) / 虛擬機(jī)向容器化遷移,設(shè)計(jì)容器化方案,編寫 Dockerfile、K8s 資源清單,實(shí)現(xiàn)應(yīng)用標(biāo)準(zhǔn)化部署。
3、自動(dòng)化與 CI/CD 建設(shè):搭建容器化相關(guān) CI/CD 流水線,整合代碼編譯、鏡像構(gòu)建、測(cè)試、部署等環(huán)節(jié),提升研發(fā)交付效率。
4、監(jiān)控與故障處理:配置容器集群及應(yīng)用的監(jiān)控、告警與日志收集體系,快速定位并解決服務(wù)器硬件故障、系統(tǒng)崩潰、網(wǎng)絡(luò)中斷等問題,制定應(yīng)急處理預(yù)案,保障業(yè)務(wù)系統(tǒng)不間斷運(yùn)行。
5、性能優(yōu)化與安全管控:優(yōu)化容器資源利用率、應(yīng)用運(yùn)行性能,制定容器鏡像安全規(guī)范,管控鏡像倉庫與容器權(quán)限,保障容器化環(huán)境安全合規(guī);
6、技術(shù)支持與沉淀:為研發(fā)、運(yùn)維團(tuán)隊(duì)提供容器化技術(shù)支持,輸出技術(shù)文檔、操作手冊(cè)與最佳實(shí)踐,推動(dòng)團(tuán)隊(duì)容器化技術(shù)能力提升。
任職要求:
1、學(xué)歷與專業(yè):本科及以上學(xué)歷,計(jì)算機(jī)、軟件工程、云計(jì)算等相關(guān)專業(yè)優(yōu)先。
2、核心技術(shù)技能:精通服務(wù)器硬件(CPU、內(nèi)存、存儲(chǔ)等)選型與維護(hù),熟練掌握 Windows Server、Linux 等主流服務(wù)器操作系統(tǒng)部署與配置,熟悉服務(wù)器虛擬化技術(shù)(VMware、Hyper-V)。精通 Docker 容器技術(shù),熟練掌握 Kubernetes(K8s)集群部署、配置與運(yùn)維,熟悉容器網(wǎng)絡(luò)(Calico、Flannel)、存儲(chǔ)(PV/PVC、NFS)方案。了解網(wǎng)絡(luò)基礎(chǔ)(TCP/IP、路由交換)與存儲(chǔ)技術(shù)(SAN、NAS),掌握服務(wù)器監(jiān)控工具使用,具備故障排查與應(yīng)急處理能力。
3、拓展技能與工具:了解 CI/CD 流水線工具(Jenkins、GitLab CI),掌握 Shell/Python 腳本編寫,熟悉云平臺(tái)(AWS、阿里云、華為云)容器服務(wù),具備監(jiān)控告警(Prometheus、Grafana)配置能力。
4、經(jīng)驗(yàn)與資質(zhì):2-5 年容器化 / 云原生相關(guān)經(jīng)驗(yàn),有大規(guī)模 K8s 集群運(yùn)維或復(fù)雜應(yīng)用容器化遷移經(jīng)驗(yàn)者優(yōu)先,持有 CKA、CKAD 等認(rèn)證加分,。
5、職業(yè)素養(yǎng):具備較強(qiáng)的故障排查與應(yīng)急處理能力,邏輯思維清晰,注重自動(dòng)化與效率提升,有跨團(tuán)隊(duì)協(xié)作與文檔沉淀意識(shí),責(zé)任心強(qiáng),嚴(yán)謹(jǐn)細(xì)致,能接受 7x24 小時(shí)應(yīng)急值守,具備良好的溝通協(xié)調(diào)能力,嚴(yán)格遵守機(jī)房安全與數(shù)據(jù)規(guī)范。