職位描述
職位描述: 作為運維工程師,你將負責智算中心的日常維護與監控工作,確保系統的穩定、高效運行。你需要及時發現并解決系統故障,持續優化系統性能,并為其他技術團隊提供支持。崗位職責:?負責智算中心的日常運維工作,包括系統監控、故障排查和性能優化?使用集群管理工具和監控工具(如Kubernetes、Prometheus)確保系統高效運行?與開發和硬件團隊合作,持續改進系統運維流程,提升系統穩定性和響應速度?負責系統的安全管理,定期更新和維護系統軟件?根據需要撰寫運維文檔,確保團隊成員了解系統運維情況職位要求:?具備計算機科學、信息技術或相關領域的學位?熟悉常用的運維工具和系統管理方法,有集群管理經驗者優先?具備Linux系統、網絡管理和存儲系統的運維經驗?優秀的故障排查能力和問題解決能力?具備較強的責任心和團隊合作精神公司簡介: 上海麗蟾科技作為NVIDIA中國首批NCP,致力于成為行業的領導者。我們管理團隊由來自全球500強IT企業的資深專家組成,具備深厚的行業經驗和全球視野。 我們正在打造一個先進的智算平臺,為客戶提供業界優質的NCP服務,涵蓋智算中心的規劃、部署、運營及AI人才培養等全方位解決方案。 我們高度重視創新與學習,專注于引領未來科技發展。 我們誠邀有志于GPU、IB、AI等前沿技術的年輕人才加入,尤其歡迎有志于在AI領域發展的學生,不限專業,只要你具備強烈的學習熱情和堅定的承諾,上海麗蟾科技將為你提供廣闊的發展平臺,與我們共同推動技術變革,走向全球。
企業介紹
上海信弘(ZENTEK)是 NVIDIA 公司在中國的精英級合作伙伴。信弘是一家致力于構建“產業賦能”創新資源體系的高科技企業。我們專注于數據中心級計算加速解決方案,提供人工智能、數字孿生領域數字化轉型服務的公司。我們為教科研、高科技、設計、互聯網、金融等客戶提供基于 GPU 架構的軟硬件產品專業服務。從咨詢規劃、測試選型、到部署實施并提供后續的運營維護。總部位于上海徐匯區,在北京、深圳、成都、重慶和美國設有分支機構。