数据中心日常维护工作有哪些?
2021-05-04
中国电源产业网
导语:数据中心要保持稳定的运行,需要大量的专业技术人员。一般承担重要业务的数据中心都是有人24小时值守,无人值守的数据中心一般只能承担不重要业务,完全无人管理维护的数据中心几乎没有。所以数据中心日常维护工作烦琐,但又很重要。
数据中心要保持稳定的运行,需要大量的专业技术人员。一般承担重要业务的数据中心都是有人24小时值守,无人值守的数据中心一般只能承担不重要业务,完全无人管理维护的数据中心几乎没有。所以数据中心日常维护工作烦琐,但又很重要。随着人们的工作生活对数据的完全依赖,承载数据计算、运行的数据中心正发挥着越来越重要的作用,这更突显出维护工作的重要。
当一个数据中心建成投产后,维护工作就开始了,一直到数据中心的生命周期结束。一般我们可以将数据中心的维护工作分为四大类:一是日常检查类;二是应用变更、部署类;三是软、硬件升级类;四是突发故障处理类,下面就来详细说一说这些维护工作,让大家对维护工作有个了解。
日常检查
“千里之堤,溃于蚁穴”。任何的故障在出现之前都可能会有所表现,小的隐患不消除,可能导致重大的故障出现,所以数据中心日常的例行检查工作枯燥,但也很重要,可以及时发现一些运行中的隐患。根据数据中心承载业务重要性的不同,要对数据中心里的所有运行的设备进行例行检查。一些数据中心设备厂商提供了检查软件,比如网管软件,安全防护软件等。可以利用这些软件对数据中心网络进行检查,看日志是否有异常告警,网络是否出现过短时中断,端口是否出现UP/DOWN等。通过网络探测软件看网络质量如何。检查服务器应用服务是否正常,CPU内存等利用率是否正常。对应用业务进行检查,比如如果有搜索业务,就可以通过服务器进行单词搜索,看搜索的结果和延迟是否在正常的范围之内。这些检查每日都要重复检查,一旦有异常及时处理与消除,必要时将重要业务切换到备用环境中,然后排除后再切回。
对数据中心的机房环境也要进行检查,环境的温度、湿度、灰尘是否合乎要求。空调、供电系统进行运行良好,设备运行是否过热,地板、天窗、消防、监控都是检查的部分。不合理的地方要及时进行整改,而不应该偷懒。经常到一些数据中心,就会发现值班维护人员很多都抱着电脑在浏览网页,打游戏。对于日常检查应付一下,甚至根本不去检查,只要没有出现故障,就打游戏消耗时间,这样数据中心出现故障是迟早的事。一旦出现故障就毛手毛脚,甚至哪个业务走的哪个设备,哪个端口哪个网线都不清楚,本来一个小故障可能因为不熟悉导致大故障,因此日常检查绝不能应付,虽然需要不断重复,但却很重要,在持续的检查过程中,将会对数据中心的理解越来越深,这样每次检查都会有新的发现,在检查中进行学习。
应用变更
数据中心承载的业务不会是一成不变的,随着业务的多样化,经常要对业务进行调整,包括服务器和网络的设置。因此要对服务器和网络设备操作很熟悉,主要需要掌握Linux服务器命令和网络协议。要根据应用的需要,做出变更。这时就对维护人员提出了更高的要求,不仅是对数据中心原有业务要非常熟悉,还要对新上的应用业务有正确的理解,这样才能在不影响原有业务的基础上做调整。这样的应用变更每个月可能都要做几次,是数据中心维护人员的必修课,突显了一个技术人员的基本技能水平。这时要对设备操作命令比较熟悉,懂得如何实现业务,要经常和设备厂商的技术人员打交道,通过交流尽快掌握设备操作方法。同时,由于设备厂商对应用业务缺乏了解,这就需要维护人员在应用业务和设备具体实现之间做好协调,处理。以最快的时间和最小的代价完成应用业务部署。
软硬件升级
突发故障
编辑:中国电源产业网
来源:数据中心运维管理
标签:
相关信息
MORE >>-
康普观点:数据中心如何更快、更经济地利用AI
AI/ML 已经到来,并将成为人、企业和设备之间交互方式中更重要、更集成的一部分。但不可否认的是,虽然与AI服务的交互可以在手机上实现,但它仍然依赖于大型数据中心基础设施和算力的驱动,而能够快速高效地训练AI的企业将在当前瞬息万变、超级互联的世界中占据重要的一席之地。
-
特斯拉进军数据中心市场,称将新建同类首个数据中心
8月初特斯拉在上周发布了一个“高级工程项目经理,数据中心”的职位,在职位描述中,特斯拉表示将建造“同类第一个数据中心”,“这个角色将负责特斯拉首创的数据中心的端到端设计和工程,并将成为工厂工程团队的关键成员。”
-
中国首个数据中心余热利用的磁悬浮供冷供热项目正式落成
武清清数园数据中心由国网天津综合能源服务有限公司投资建设,位于京津产业新城的核心区,是承接非首都核心功能疏解的先行示范区,未来将为区域经济和科技孵化做出重要贡献。
-
商宇UPS助力梦想花开,继四川大运会后再启程,杭州加油!
商宇科技作为数据中心综合解决方案提供商,为保障大运会顺利进行,商宇科技闻令而动抽调核心力量参与赛事线路保障,为盛会电源不间断保驾护航。
-
筑牢可信可控的数字安全中心保护屏障——汶川地震十五年
2008年5月12日14时28分,实时监测机的屏幕上地震波出现剧烈振荡,地震报警器发出刺耳的警报。“汶川!汶川!汶川……”15年前的5月12日,是我们一辈子都不会忘记的日子。
-
2022年度国家绿色数据中心名单公布
2022年度国家绿色数据中心名单公布。