1.业务背景
随着IT技术发展的时代,用户越来越倚重IT作为生产平台,各个新技术运用使业务运行更便捷的同时,给业务IT系统的运维部门带来的巨大挑战。IT系统涉及的设备种类繁多、IT服务水平远远跟不上设备规模的扩大,运维管理人员的日常维护和管理工作日渐繁重,工作压力也急剧增加,直接关系到网络或业务是否能够正常运行。
2.方案介绍
IT运维管理系统是我国自主研发的跨平台、跨厂商的IT基础组件监控平台,可以实现对路由器、交换机、防火墙、服务器、中间件、数据库、存储、虚拟化平台等上千种产品的数十万关键指标进行深入监控,并进行集中统一的可视化管理,能够有效预防问题的产生及快速帮助用户定位故障,降低运维成本。同时采用丰富的多维度报表为用户决策提供数据支撑。
系统支持对IT基础设施做性能监控,通过部署系统后,会对整个IT基础环境进行深度扫描,将各类型应用组件自动发现,并通过配置一些属性如路径、端口、URL等实现整体监控,并将可监测资源在管理面板中统一展示。
系统支持多种设备发现方式,通过SNMP或其他支持的协议发现并管理设备,能够做到精细化管理和灵活化管理,可监控每个CPU、内存、接口等的使用率,可自定义指标项是否采集、是否记录、是否监控,采集与记录分开控制,协助运维人员排查故障问题,协助审计人员完成审计工作。
3.系统设计
3.1系统架构
3.2系统管理对象
系统管理对象:几乎支持所有市面上常规的网络设备和资源
3.3网络设备管理
系统能够对符合SNMP标准协议的交换机、路由器、安全设备、负载均衡等网络设备进行监控。网管系统内置了丰富的模板,支持CPU利用率、MEM利用率、端口状态能够自动发现网络设备间的链路和网络设备与计算机间的链路,能监测链路的上行、下行带宽利用率和速率、上行和下行的丢包率、错包率;链路连通状况;并能在首页模块实时进行TopN排序。
可以分类查看被管理设备的名称、系统名称、管理IP、MAC地址、管理的状态、关键性、地域、管理人、特性、添加、删除等,一目了然的掌握当前设备的管理信息,同时支持设备指标的批量配置和导出设备信息的功能。
过实时一览网络运维人员可以及时的了解各个管理资源的实时信息。通过列表的形式把对应的设备名称对应的IP地址、健康状态、响应时间、CPU、内存、健康度、可用率、及查看接口等功能。并可直接导出EXCEL格式和资源配置。
支持的部分设备厂家如下:
监控指标
系统能对某用户的核心业务系统,包括运行在各种设备进行有效的监控和管理,而且系统具有良好的可扩展性,能方便的支持其他设备的管理,可以监控到设备的详细信息(名称、管理IP、Mac地址、子网掩码、管理状态、管理方式、关键性、厂商、型号、操作系统、流量等),指标(健康率、可用率、CPU状态、MEM状态、ICMP响应时间等),及所承载的业务。
体验化背板
通过真实的设备背板图可以对设备的各个端口进行实时查看、打开和关闭等操作,当单击某个端口时则可以查看到该端口的基本信息、监控指标当前值等信息。同时,通过多指标分析图还可以直观了解到某几个指标于不同时间段的对比分析情况。
接口管理
通过snmp协议,获取接口状态,按照接口状态将接口分为闲置和轮询两类模版,通过模版设置接口的指标。接口指标监控主要为接口名称、所属VLAN、接口别名、MAC地址、连接设备、接口类型、容量、异常等级、接口状态、接口输入/输出速率、输入/输出利用率、地域、模板、特性等。
3.4服务器管理
系统能够支持监控多种主流操作系统,划分Windows、Linux、Unix、等主流操作系统,包括Windows2000/2003/2008的32位/64位(中英文各版本)、RedHatLinuxAS、AIX、Solaris、HP-UX等。服务器操作系统各种详细信息,如文件系统信息、系统日志信息、系统版本信息;服务器运行指标包括多个CPU中每个CPU的实时负载情况;物理内存、虚拟内存及页面文件的实时使用率;磁盘每个逻辑分区的分区容量;进程运行状态等;网卡实时连接及流量、网络端口的丢包率、利用率、发送速率等指标;安装软件的情况等自定义指标项:系统能够支持通过自定义SNMPOID脚本,采集特殊的服务器特殊指标项。
所支持的部分服务器品牌如下:
系统采用图表方式实时显示主机服务器的cpu利用率、cpu使用情况、内存利用率、磁盘信息、进程信息的情况。提供对当前主机服务器性能的监控,能够根据当前系统平台的运行情况,提供深入的性能分析。服务器操作系统运行的监控、分析。同时可以监控服务器的已安装的软件、ICMP响应时间、磁盘队列、指定进程、连接数等具体指标。
硬件监控
支持标准硬件管理接口IPMI,监视服务器的物理健康特征,如温度、电压、风扇工作状态、电源状态等;同时也支持惠普iLO等非通用硬件管理接口。
3.5应用资源管理
应用监控包括:数据库和中间件,如Mysql、Sqlserver、Oracle、Sybase、Weblogic、Websphere、Lotus、Tomcat、DB2、Apache、JBoss、Websphere MQ、Tuxedo、Informix、Exchange、IIS、TongWeb、Apusic、Nginx、Squid、Lvs、Resin、Redis、MongoDB、DM、KingbaseES、gbase、RabbitMQ等
支持常用企业级应用,全面监控管理可用性和性能等关键指标
数据库管理
对数据库的管理是通过模拟监视和性能指标两种方式进行的。以监视器的形式加载在平台上的。在系统不断地发展中,可以根据用户的具体需求定制、动态加载,保证数据库的安全,优化数据库的性能。
所支持的部分数据库品牌如下:
全面智能的监测各种主流数据库及各种与数据库应用相关的服务。能对数据库从应用可用性、系统资源占用和数据库性能指标等多个方面提供全面的监测管理策略,确保数据库的运行正常。
中间件管理
对中间件的管理是通过模拟监视和性能指标两种方式进行的。以监视器的形式加载在平台上
的。在系统不断地发展中,可以根据用户的具体需求定制、动态加所支持的部分中间件品牌如下:
对中间件的管理是通过模拟监视和性能指标两种方式进行:实时监控当前中间件的连接响应时间、监听器的管理模式,能够在连接中间件出现问题时告警检测。监控中间件的响应时间、请求数、传输速度、内存总数、连接数等等诸多指标,并可直观了解所在服务器的性能和使用情况。
3.6服务资源管理
通过展现当前服务过程的响应时间等性能数据情况,能够整体直观的了解当前应用状况进行实时监控、分析、报警确保服务正常使用,并为用户提供较高的用户体验。
网页服务
服务器管理系统可以很好的监控http服务。可以监控到网页服务的招标参数进行分析设置还好阈值后当违反规则后可以产生告警通知到运维人员。
3.7链路资源管理
链路页面添加接口异常信息图片,直观查看到是哪个设备的接口影响到链路异常。同时在接口告警时,异常描述信息也将明确影响哪个链路进行了说明和提示。
综合管理系统可以监控链路资源,并根据链路资源的属性设置阈值,判断当前链路状态等,并通过告警的方式及时通知运维管理人员。
3.8业务资源管理
网络管理系统可以针对以用户体验与满意度、数据安全、服务水平等为出发点,将若干个资源构建在一起的业务系统进行全面监控。系统可以根据企业用户真实的IT环境将业务系统以及承载这些业务的IT基础设施合理构建成一个真实的业务模型,并通过对业务系统的下属资源、系统API、用户模拟进行三维视角的立体化监控与分析。
支持的部分业务:
系统所展现的各种信息和数据组合构建成各个符合个人所关注的业务管理信息,通过MTBF和MTTR能够更清晰更直接的了解该业务系统的系统性能。任何一个业务系统中的细小变化和端倪,都能通过系统及时组合成各种直观的性能数据,真正帮助您实现从整体到局部,从宏观到微观的全面运维!掌握整体网络运行状况,将最复杂的网络状况以最简明、直观的方式呈现。