今天我给大家介绍一下聚焦ITIL,聚焦构件服务管理体系,主要介绍的是IBM的Tivoli解决方案在电力行业的应用,在IBM在实现ITIL的时候就是采用Tivoli的软件来实现的,也是我们今天要讨论的话题。我们今天要介绍的主要包括这五点,是说电力行业的系统管理的需求,IBM针对我们国内电力行业的这个系统管理的需求,架构了这样一套系统管理的架构,还有一些相关的产品,以及我们Tivoli的解决方案,以及这个方案的目标意义和它的特点,首先了解一下电力行业需求管理的需求,电力行业在国内来说,就是说是外我们过去的话说是现代化水平比较高的行业,因为我们是能源的支柱行业,对电力行业的需求实际上跟我们许多其他的IT的管理水平比较高,设施比较多的行业是类似的,这个是在以下几个方面。性能数据采集及应用,我们的应用服务器,我们的主机服务器的一些基本性能的采集,还有我们应用的监控和管理,这里包括我们的数据库,中间件等等。除此之外还有网络管理,现在大家都知道现在所有的企业都构建了自己的网络,网络管理也是一个其中很重要的内容,对网络管理,我们的主机和分布式系统的监控,以及我们一些基本的应用系统的监控,就构成了我们一个基本IT系统的所有的监控数据的采集的来源,有了这些采集到的数据,很容易想到的是说我们的IT系统能够获得大量的告警信息等等,在我们出现一个故障,或者有可能发生一些问题的时候,这是IT系统的管理第一步,也就是我们长说的监控系统,在监控过程中间我们有很多告警,我是说我收到一个告警,或者宕机了,或者换一台机器,是不是就能解决我们系统的问题呢,这个答案往往是否定的,为什么呢,如果我们一台应用系统出现问题的时候,我们往往面临的管理人所收到的不是一条,两条的告警信息,而是几十条,甚至成百上千条的告警信息,因为任何相关的软件的产品,从我们基础架构的数据库,中间,邮件这些系统,甚至到我们企业自己的业务系统,它都会从它自己的管理的角度来给我们上报一些告警,这个时候我们需要一个系统,就是我们所说的故障和告警的管理,这个系统我们一般说产品的时候,我们把它理解为一个事件处理平台,一般是把我们所收到的所有的告警信息,所有企业的IT环境中的各类事件进行基础和关联性的分析,把我们刚才所能想象到的那些成败上万的告警进行解决,就是给我们管理者看到是的很简单的信息,这个是一般IT企业都可以达到的,这是这样一个根源信息,这个是不是我们得到这个根源信息,把它进行修复,比如我们把这个修复了,是不是这个问题能解决呢,答案也是NO的,因为IT系统是作为我们的支撑平台,跟我们的业务系统是相关的,如果看到IT本身的问题,往往不能解决一个最终的问题。
本文根据2005年中国电力企业信息化发展高层论坛现场录音整理 INTS.CN
举一个例子,我们在一台服务器上运行了我们的系统,像我们财务系统,当财务系统会不断的发展,随着企业的扩大,但是它的业务流量超过这台服务器的符合的时候,这台服务器可能出现频繁宕机的出现,如果你重新起这台机器,可能没有办法修复,因为它又会宕的,这个时候需要我们的业务和IT系统关联起来,这是我们的业务视图呈现,这是IT系统和业务系统关联在一起,形成一个影射,当出现一个宕机系统,或者各种各样的告警出现的时候,我们就可以通过业务系统的关联,知道一个业务系统的业务量导致这台服务器宕机,导致各种各样的相关的告警的系统的产生,或者其他的系统也出现了问题瘫痪了,这样我们就可以知道怎么修复它,我们可以把财务系统迁移到其他的机器上去,或者扩展机器的存储或者各个方面的能力,也解决这个问题。所以这个就是我们的第三个层面就是业务视图的展示和呈现,这几条是在我们的头脑中可以影射出三层的画面,底层我们告警信息的提取,数据监控,中间有事件的集成,最上层是业务视图呈现。特别是我们电力有自己的网络,这样大的网络是必须面临的是桌面机的管理,我有很多终端,我可能从总部做很多软件的下发,做很多配置的工作,我可能不需要每一个人到现场去做,这样桌面机管理也是非常重要的作用,也是很多企业要求这个方面的功能。从以上五个方面,我认为电力行业,也是国内众多的IT水平比较好的,比较健全的IT企业所面临的几个需求。 ints.cn
IBM是怎么样去构建我们这个解决方案,构建我们Tivoli解决方案,构建解决电力行业需求的总的架构,我们先回顾一下IT管理的发展,大概在15到20年前,我觉得我那个时候还很小在学校,大家说到IT,可能不说IT,说的是计算机,是说哪个人搞计算机,觉得这个人的脑子上闪着光环一样,是高科技的,是非常经营,当时我们采访那个机房,穿着大白褂,进门要脱鞋,还有空调什么的,这个非常好,那个时候IT就是一个技术的代名词,对IT的管理也是限于从技术本身来看,限于我们对资源的管理,大家整天IT机房管理人员担心的是什么呢,他可能甚至对业务都不那么关心,IT管理员他看的是机房里的机器,他就是保证我的这台服务器是好好的工作,保证这些资源本身的一些维护和管理,那就是IT管理的第一步,最初的一个状态,就是我们所说的资源管理,大概发展到离现在应该是五年,或者八年左右的时间,当然这是国内比较先进的企业,IT管理进入到它的第二个阶段,就是我们所说的系统和信息管理。这个怎么去理解呢,就是说当时IT的投入不断扩大,大家的机房不断的扩大,可能一层楼改成两层楼,堆在里面的机器非常多,甚至很多厂商的机器,范围越来越广,涉及的人也越来越多,有越来越多的人进来,这个时候对企业来说IT代表着什么呢,当然也是支撑它的系统,但是让管理人员更头疼的是说IT的投入,IT成为一个大的包袱,但是它的投入太大了,它是一个成本的管理,所能想象的是说我投了这么多钱在里面,怎么去利用它去减少投入,提高它的可用性,这是第二个阶段,IT系统的基本优化,提高它的可用性,这是信息管理的阶段。
本文根据2005年中国电力企业信息化发展高层论坛现场录音整理
技术发展到今天,有很多的企业对IT认识也在发生转变,IT从我们的一个成本,从技术,从成本到今天变成了一项业务,越来越多的企业意识到了这一点,他对IT的管理,不再像过去单独的一块,而是变成跟它的财务系统,跟它的企业的各个方面的业务,像我们电力各个方面的业务一样,是它的一项业务来管理,我们对一项业务要考虑什么呢,我要投入多少人进去,要在多长时间内看到效率,怎么使这个业务系统正常的运行,避免它造成其他的影响,IT现在我们把它提为叫做IT服务管理,这样一个新的概念,整个过程就是IT的这样一个演变过程,从一个以技术为中心的带着光环的行业,到现在是一个以业务为中心的行业,跟我们其他的所有的业务站在同个起跑线上,这也是从我们IBM的说法来说从传统IT管理,到我们现在说随需应变的IT管理,这样一个发展。
这样一个IT管理,对我们IBM来说怎么来看它呢,比如这四个,有人员,技术,流程,信息,怎么来理解它呢,IT管理是以技术为中心,以人员为灵活,因为人对他的管理为核心,要建立在人怎么样利用技术做IT管理呢,这个需要流程化的方式,因为需要很多自动化,现代化的水平,这个基于IT架构,这个架构搭起来以后,还使用什么呢,怎么让它有活力,这是我们的信息,我们说把信息给了IT,就像给人体注入了血液一样,让整个架构灵活的运转起来,使企业的IT和业务更紧密的结合,推动它的生产力的发展,这是IT管理的一个基本理解。
说到IT管理有一个概念,也是我们今天这个讨论的一个核心,就是我们的IT,大家可能对ITIL这个概念有一定的理解,就是IT架构库,用中文来说应该是这样的,ITIL是在80年代在英国形成的理念,大家一般来看可能是觉得很虚的概念,它是七本书,里面描述的最佳实践管理经验,这个确实是听起来比较虚,我当时接触到的时候也是觉得比较虚,实际上ITIL里面包括六大模块,十个流程,它就是告诉你说要以怎么样的方法,怎么样的流程去定义一套IT服务的管理体系,你达到这样的一套服务体系,是它过去依据很多的实践经验构件起来的,这样一套方式就可以达到管理架构的方式,这七本书,这样实际业界的实际标准,它提供的是概念,你要做到什么什么样,这样才是最佳的,但是它并没有告诉我们说你要怎么去做,它没有相应实际的东西,这个就是说从IBM就会提供一套实现ITIL的一些产品和方案,但是我们看一下从ITIL的萌芽到它的版本一,版本二,整个这样一个发展的过程,IBM一直是ITIL的一个大力推动者,或者说我们说是一个领头羊的位置,ITIL很多概念和流程都是IBM提出的,基于这样一个发展的历史,IBM在我们这个体五里的产品家族里面花费了大量的精力进行整合,进行变更,让我们的Tivoli产品提供满足ITIL的实际的产品,这个图就是IBM的Tivoli的解决方案,跟ITIL的影射的关系,我们从产品的角度,认为从底部是运营管理,是基于IBM的技术,就像前面提到的,我们有开发平台,有中间件,数据库,信息集成,还有办公自动化等等,所有的技术来提供这样IT的基础,在此之上,我们有流程化的处理,是最上面这一层有流程的工具,在此之间,有我们的变更和配置的管理信息库,这是我们前面提到的信息,整个这些是有外面这个绿色的框,也就是我们所说的最佳实践经验,这一部分把它和在一起,这是IBM对ITIL的实现和定位的架构。
本文根据2005年中国电力企业信息化发展高层论坛现场录音整理
下面我们通过一个例子来了解一下ITIL的变更管理,它的一个定位吧,这是一个企业的ERP应用,我们可以看到传统的,当它的ERP应用出问题的时候首先是用户发现问题,给它的帮助台投诉,当发现说A中心不能满足要求,提出到B处的方案,我们的支持团队具体把这个方案细化进行批准之后做了这个歉意最后这个服务是非常成功的,这个系统迁移了,ERP被修复了,但是从我们企业角度来看是不是一个成功的案例呢,大家可以看到因为它的应用系统的迁移导致了B中心的财务系统宕机了,从它应用比较中心的事,导致它的系统的瘫痪,从系统来看是非常失败的迁移和操作,是什么样的原因导致的呢,其实非常容易理解,其实对整个IT系统它上面跑的应用,这些资产之间的关系,应用之间的关系缺乏一个全局性的了解,这个是现在很多企业一个致命的问题,就是每一个系统的管理人员只管我这一块,大家都不关心整个架构,导致系统出现问题的时候,往往牵涉到其他的问题,这是现在非常常见的一个问题。
怎么去解决这种不能从全局掌控的问题,Tivoli也就是IBM提出了这样的架构设计,我们可以看一下这个图从底层,我刚才说到的我们服务器,我们的网络,我们应用系统的监控,它是基于成熟的流程,很多各种各样的流程的策略来实现的,会提出大量的告警信息,这个也是一个事件集成,在我们上层有事件管理平台,对我们的事件集成进行关联和分析,把核心的信息存储在企业级的配置数据库里,这样是一个数据的统一跟集成,在这个数据集之上是我们的业务展示和我们的业务系统向关联,跟整个用户提供的是系统管理的门户,我们最终的管理人员面临的是一个统一的门户,它不会单独的应对每一个分散的小系统,每一个分一块,它会从全局的访问这些东西,这个图里面真正核心的就是集成,就是在每一个层面上都会做大量的集成工作,从每个角度出发,从对一个系统的软件,硬件,到最后的应用系统,到展示层面,都是面临的一个全体的规划视图。
本文根据2005年中国电力企业信息化发展高层论坛现场录音整理
这一部分其实我们刚才提到了这个架构在Tivoli已经有很多相对非常成熟的产品在支持,也就是我们对ITIL的定位原作管理,这个里面除了我们的中间件,数据库邓之诚性的产品里面,在Tivoli有监控道上也管理,到服务管理等等,这是我们非常成熟的一系列管理来支撑这个运维管理,对上面的流程管理等等,我们后面还会介绍Tivoli有其他的产品支持它,这是Tivoli的系统架构,最终我们IBM是用Tivoli软件产品来实现产品管理的,IT系统在企业来说它的跨度非常广,往往涉及的范围很多,软硬件涉及的东西非常多,Tivoli基于三层架构,通过中间的管理网关都很多事情进行地域性的处理,进行大量的数据的存储转发,使得我们Tivoli有可扩展性和灵活性,是基于这样的三层架构来实现的,不管向上的监控数据的上传,还有向下的数据的下发打补丁等等。
这个是我们基于这样一个架构,对我们最终的一个坐在信息中心的最高级别的管理人员来说他能看到的是什么样的视图,就是这样的,我们可以看到不管我们各种各样的资源的监控,所有的纵向的从资源角度,我们可以收获的所有的信息对我们最终的管理人员来说,他面临的都是这样一个统一的界面,能够看到一个统一的管理的门户,这是企业级的门户,这是Tivoli给大家提供的一个非常友好的管理界面。
我们看到前面这些都是一个我们基本分析的Tivoli及它的架构,它怎么去满足电力系统的管理的需求,首先是数据采集和应用监控,这个在Tivoli有一个叫IBM Tivoli“米里特”的家族,从我们的主机,到中间件,数据库等等这些基本应用的数据采集,它可以做7×24小时的不断的监控,这个产品扩展的范围非常广,基本上从各种各样的应用和数据库可以做非常好的应用,我们看到的网络管理,Tivoli有历史非常悠久的网管产品,可以实现层次化的网管,还有故障告警,这个是我们叫“太可”是现在业界可以说是最为成熟的,功能最为强大的事件集成的管理平台,把我们收集的各种各样的信息集成到事件关联。它不仅仅能够集成Tivoli的产品,还能集成许多第三方的,甚至是企业自己开发的系统的信息,因为它有一个非常良好的客户化的接口。在桌面机的配置方面,我们把它分为资产管理,一个软件分发,这个管理一个是向下,一个向上的。还有我们的业务视图呈现,这个在Tivoli里面是叫做TBS这个产品,我们怎么理解它呢,用Tivoli的话来说是给我们企业的管理人员打开了一扇通过IT系统的心灵之窗,一双慧眼,管理人员他对IT系统是不了解的,但是他可以通过他的业务系统直接点击图表就可以看到这些资源,甚至他可以看到那些服务器出了问题,可以直接它给透视进去,这样一个相互的影射感到。
本文根据2005年中国电力企业信息化发展高层论坛现场录音整理
基于我们全面的信息的采集和面向业务的分析,我们还可以给客户提供这样一个,不管是我们的硬件项目路由器,甚至到我们的邮件系统,操作系统各种应用系统的水平的分析和未来的预测,前面这些是我们Tivoli产品对IT系统管理的这样一套实现。
下面我们了解一下Tivoli解决方案的目标,这个我觉得非常简单,集合了我前面所讲的非常关键的基于业界的规范和标准,提供了一个非常集中和统一的系统管理,我觉得这是最核心的,就是集中和统一,Tivoli它目前就是我刚才说的基本上定位在这个IT运维管理,但是对ITIL整个架构中的其他部分,IBM是一直没有放弃的,我们可以看到在06年6月份我们会推出流程管理器还有管理和配置管理数据库,来完善整个IBM的整个系统。
下面了解的是Tivoli的解决方案的意义,这个在我们电力行业来说,最基本的是说我们通过监控和告警事件分析使我们的业务系统的可用性得到提高,还有提高效率,自动化的管理方式,避免人员操作所带来的这种故障等等的一些不可靠的因素。
最后是Tivoli解决方案的一个特点,最重要的其实也是IBM的软件产品一贯的特点,就是我们是基于开放标准的,作为标准的方式可以很容易的与其他厂商不管是软件,硬件,还有其他的业务系统很好的集成,也是我前面给大家展示的架构图我提供的是端到端的解决方案,这是从整个产品架构图来提供这样一个架构,今天时间非常有限,我就不会讲得特别细,这是一个例子。像我们在一台服务器在哪里发生故障的时候,我们对服务器监控的模块,会对我们事件集成的管理模块,我们的“太可”,提供告警信息,其实“太可”可能说到从不同的业务系统,收到不同角度的告警,它经过事件的关联分析以后,会给我们的事故处理,与故障系统提供一个报表说是什么东西出了问题要做修复,这个故障处理系统会进行分析,分派告诉我们的维修人员你要去做什么样的维修工作,同时也会把这个信息发送给我们的领导或者业务人员,哪些东西出了问题,他可以随时监控,在整个过程中间,我们的管理人员都会随时的去了解故障的维修,或者各种各样的状况。这会在这个阶段进行修复,他修复完了会提交一个报告给故障系统,故障系统会关闭这样一个事件,这样整个修复过程可以完成了,通过Tivoli全套的支持,使自动化的水平非常高,所以它的效率很快,每一个故障定位和事件处理,在系统里跑的时候可能是一分钟,或者一张表,不像过去打电话可能通知各种各样的来源做这个表,这个可能会发生很多的时间,我今天要介绍的基本上是这些,时间很有限,我希望今后还有机会来跟大家分享IBM的服务管理和产品的方案,谢谢大家。
本文根据2005年中国电力企业信息化发展高层论坛现场录音整理(INTS)



