中文版 | English
教育科研

Education research

您的位置:首页 > 成功案例 > 教育科研

中国地质大学 IT运维管理项目

项目背景
    中国地质大学(武汉)是教育部直属的全国重点大学,是国家“211工程”建设项目、教育部优势学科创新平台建设项目资助的大学;是国家批准设立研究生院的大学;是拥有地质学和地质资源与地质工程两个国家一级重点学科、以地球科学为主要特色,理、工、文、管、经、法、教、哲协调发展的多科性大学。
    2009年网络改造项目是我校重造校园信息化基础设施的重大项目。自1994年建立中国地质大学(武汉)百兆快速交换以太校园网以来,历经1998年的主干千兆以太交换技术和2001年的千兆到楼BASE认证的管理方案两次改造工程,至今已经风雨15个春秋。其间的网络技术的发展、应用内容的丰富、校园用户的需求及互联网中的各种问题都成为校园网不断改造、创新的动力。立足校园,服务教学、科研、管理和师生文化生活,关注用户上网体验、便捷服务,提供流畅、稳定和安全的网络环境,构建可靠、可塑的动态多业务虚拟化校园网,全面支持IPv4/6应用,是本次项目改造建设的目标。
     IT网络要保障如此大规模学校的各项信息化业务的正常运行,必然相当复杂,为了满足业务不断扩容,逐年还将增加各种IT资源,例如:
    ·网络设备:交换机、路由器、集线器…
    ·主机设备:PC、服务器、小型机、服务器集群…
    ·安全设备:防火墙、防病毒、入侵检测、漏洞扫描…
    ·…… 

    随着网络技术和学校的发展,学校对网络的依赖性越来越高,一旦网络出现故障,将直接威胁到正常的教学教务和管理工作。同时由于各种设备和系统的操作监测方式都是不同的,各有各的特点,自成体系。现在问题出现了,IT管理和维护人员面对数十种或上百种网络资源和越来越复杂的业务系统,如何高效、快速的管理和使用好这样一个集多种网络设备、多种主机、多种操作系统、多种数据库及其他各类应用服务组成的业务系统;如何在这样一个大数据量、高实时、并发事务频繁、增长迅速、关联关系复杂的信息系统发生故障和性能瓶颈时快速定位故障;如何通过对系统运行历史的分析和统计找出困扰系统运行的潜在的深层次“慢性病”等,都是摆在网络管理员面前严峻的挑战。
    中国地质大学(武汉)的网络管理员在系统与网络维护过程中也遇到了很多棘手问题,例如:
     ·缺乏对网络设备、服务器和各种应用服务的有效监控,无法及时了解全网、整个业务系统的运行状态;
     ·缺乏对业务系统集中监控的手段,对校园网的维护主要靠维护人员手工登录设备进行监控;
     ·监控方式不直观,排查实时费力,且有较高的专业要求,由于网络维护人力资源紧张,经常难以在规定的时间内找问题症结所在,造成业务终端时间过长;
     ·设备数量众多,且是复杂变化的动态系统,不同的子系统之间关系错综复杂,造成IT数据更新困难,需要耗费大量人力,且速度慢。
     ·现有的工作方式被动。有不少漏洞,只有到问题暴露之后,才能收到投诉,经常对工作效率造成影响;
     ·……

    不仅如此,校园IT管理的维护人力资源往往比较紧张,运维部门疲于应付各种突发事件,加班加点处理各种重复事件和故障,工作任务繁重,身心疲惫。由于没有科学有效的管理和监测手段,无法提前发现事故征兆,无法快速定位故障根源,无法准确的分析事件相关性,也就无法快速的解决问题,也无法避免同类问题的重复发生。由此引发了被服务对象(员工)不断抱怨和投诉“技术人员服务水平太低,总在解决问题,也总解决不了问题!”

网络环境
·网络规模大 校园网有近500台网络设备、100台服务器,以及1200个无线AP点;
·设备种类多 设备涉及Cisco、Juniper、华为、中兴、锐捷等厂商,相关应用包括Oracle、MS-SQL、MySQL、Apache、IIS、Tomcat、POP3、SMTP、Microsoft Media Server等;
·系统应用繁杂 包含数字化校园、学籍管理、电子教务平台、远程教育系统、OA系统等。

解决方案
    泰信科技的工程师在总结教育行业网络设计与实施经验的基础上,提出了以泰信科技Apex IT运维和服务管理系统中NetManager与OSSWorks两款产品为核心的整体网络管理解决方案。IT运维和服务管理系统可以很好的满足以上的需求。
    Apex IT网络运维管理系统真正的帮助地大建立起一个校园网络管理智能、网络状态公开、用户上网便捷、运维业务明细、上网行为健康的网络综合管理系统,把校园网管理作为一个网络运行维护和网络用户交互的网络知识学习型、网络行为影响型、网络管理智能型的平台。达到:
    ·降低网络及整个信息系统的故障率;
    ·提高网络及整个信息系统的运行性能;
    ·增强对网络及整个信息系统控制力;
    ·实现用户和管理人员对网络认识的统一。
统一全面的监控
    Apex 系统通过各种方式对路由器、交换机、防火墙、链路等统一全面的监控,并通过丰富监测手段收集网络内各种资源的性能指标,经过智能分析,直观的在拓扑图和QuickVIew里展示目前哪些资源性能压力过大、哪些空闲、可能的风险点在哪里等。运维人员根据这些性能信息合理的优化网络或规划网络扩容。通过对高风险点及时处理,将不断降低网络故障率,业务系统将更加稳定和高效,变被动为主动运维,缩短断网时间,有效提升各类用户体验,提高满意度。
    ·支持大屏幕展示,支持用户自定义Portal视图展现,滚屏呈现所有IT资源的实时性能状况;
    ·真实卫星地图展示,实时监测各业务应用系统的健康状况。

a.jpg

业务应用服务监控
    可对多种业务应用系统进行监控,包括数据库、邮件服务、Web服务器、应用服务器、网站监控、URL地址、自定义服务等。协助运维人员在诸如服务中断、应答缓慢、数据库缓冲区命中率低下、邮件阻塞等问题影响到用户之前,迅速侦测并解决这些问题,有效减少故障修复时间。
故障预警
    通过实时的网络运行监测,Apex NetManager可智能分析和预测潜在故障,并根据告警程度的不同发送警报。
无人值班机房
    Apex系统能够按照运维人员预先设定的轮询时间定期进行设备、链路的巡检,并产生设备性能状态巡检报表定期发给运维人员。遇到设备状态或者链路流量异常从而逾越设定告警阈值时,Apex系统将自动通过邮件或者短信的方式即使通知运维人员,真正实现无人值班,全部通过Apex系统进行预警。
故障快速定位
    Apex系统提供丰富的故障信息关联,通过绿、蓝、黄、橙、红五种颜色表示设备或链路目前处于何种告警状态。通过拓扑图可以快速发现哪里问题最严重,哪里链路故障最多,您可以对整个网络的故障分布有一个直观的概念。
    通过Apex系统主界面下方TOP-N查看最新最重要的告警、流量最大的端口、响应时间最长的设备、内存和cpu占用率最高的设备等,支持各种属性排序。例如流量非常大的端口,Apex可以将其快速定位到拓扑图,在拓扑图上查看流量出自哪台网络设备的哪个端口。
设备统一配置
    中国地质大学(武汉)由于网络设备种类及数量众多,如果要修改、删除、备份各交换机的配置相当烦琐,不仅需要通过手动命令行的方式修改,而且各厂商命令还不一样,极大的消耗了人力资源和时间。
    而Apex系统能够通过统一的可视化方法对不同类型的网络设备进行配置管理,支持设备配置的自动与手工备份,全局Tag维护,备份修改,记录维护等;而在网络拓扑图上还可以直接对每一台网络设备进行远程配置、调试,提供Ping、TraceRouter、Telnet、MibBrowser等IP工具,实现了在同一个界面上统一对每台网络设备进行配置及可用性的探测。
规范运维管理流程
    目前中国地质大学(武汉)还没有一个规范的流程管理系统,这样就使得在运维过程中责权不分明,不能及时和真实的反映运维工作的状态,运维人员会觉得多干少干无所谓,出现故障互相推脱责任,缺乏人员考核指标。这样针对中国地质大学就非常需要一套适合自己的ITIL运维流程。
    Apex OSSWorks提供统一网络运维流程管理,包括多用户多角色、统一故障管理、运维流程和工单管理、自助运维服务台、运维管理报表统计、资产管理、知识库管理等。
运维知识库
    Apex系统提供知识库管理,将这些个人经验转化为运维团队经验。并有效的整合到日常运维流程中,有利于运维人员查找问题根源和历史解决方案,快速排除故障。
自助运维服务台
    针对中国地质大学(武汉),IT运维中心所要服务的师生数量是非常多的,一旦发生IT故障他们就会寻求信息中心老师的帮助,这也导致了IT运维人员就像救火队员一样哪里发生问题就到哪里去,而实际上对于一些常见咨询或故障,如果地大师生自己能够通过查阅一些FAQ之类的帮助文档就能够解决的话,无疑可以从一定程度上减少地大信息中心运维人员的工作量,同时又能够提高用户的效率。
    Apex OssWorks提供用户自助运维服务台,在用户发生IT故障以后,可以到自助式服务台上查询FAQ中以往是否有类似的情况发生,发生后是如何解决的,并且还可以通过FAQ进行初步排错等等。
 

用户评价
    中国地质大学(武汉)的网络中心主任张峰老师表示,学校IT运维人员在使用过Apex系列产品之后,感到泰信Apex产品给日常运维工作带来了极大的便利,变被动式管理为主动管理,实现了量化管理,规范了运维流程,保证了网络运行质量。
 

上海泰信科技有限公司 版权所有 | 沪ICP备05079988号