1.參與業務平臺架構評審,提出可靠性需求;
2.執行自動化、安全的發布流程與回滾預案;
3.監控系統狀態,響應告警,處理事故,容量管理;
4.事故復盤,優化架構/代碼/流程,逐步提升系統健壯性;
5.支撐解決各團隊資源使用問題,提高使用效率;
要求:
1.本科及以上學歷,碩士優先;計算機、通信類相關專業;
2.5年以上系統運維和Devops經驗;
3.至少精通一門開發語言,如GO/Python,能夠獨立編寫工具、自動化腳本等;
4.深入理解Linux內核原理(進程、內存、文件系統、網絡棧)、性能調優和故障排查;
5.扎實的TCP/IP、HTTP/HTTPS、DNS、負載均衡等網絡協議和架構知識;
6.必須熟練掌握 Docker 和 Kubernetes并有多個業務平部署經驗;
7.熟練掌握監控告警,日志鏈路分析工具并有多個業務平臺實踐經驗;
8.熟悉 Jenkins、GitLab CI、GitHub Actions 等流水線工具,掌握自動化部署流程;
9.有強烈的責任心和團隊協作精神。