江苏电力

客户介绍
 

江苏省电力公司(以下简称江苏电力)主要从事江苏境内电网建设、管理,经营江苏境内电量销售业务,是目前江苏省规模最大的国有企业,也是国家电网公司系统规模最大的省级电力公司。

 

项目背景
 

根据国网总部对应用入云总体要求,江苏公司提出了年底千台物理机入云的工作目标。为了加快实现云平台规模化应用,江苏电力云平台基于开源、先进、适用的原则,确立了从“上线准备、系统部署、系统扩容、系统检修、应急处理”的全链路自动化的技术目标,制定了减少云平台上线周期,简化扩容流程,实现整体监控,提高工作效率的工作目标。为实现平台高度自动化和应用快捷部署发布,打造了完善的工具链。

 

面临挑战
 

随着基础资源云化,资源规模将越来越庞大,而打造资源的灵活柔性虽然利于应用部署发布,但给平台本身的持续稳定运行带来了新的挑战,平台须实现快速自动化部署以适应不断变化的应用需求,并且能够高度地实现自动化运维,提高平台健壮性。

未来用户对于应用系统的要求将越来越高,需求变化也将越来越快,尤其当应用实现微服务化后,应用的快速升级迭代要求平台提供快速集成部署的完成流程和功能。

在平台自动化运维过程中,自动化程序无法定位解决的问题仍然会存在,需要人为进行快速定位和恢复,形成经验、处理流程和工具,并补充到自动化程序中。在自动化运维逐步完善的过程中,人为的这种干预虽然会逐渐减少,但在前期,对运维团队是一种极大的挑战。

 

解决方案
 

工具链包含本地代码仓库、持续集成部署工具和本地镜像仓库。应用通过工具链能够实现持续集成测试和快速部署发布。

实现平台核心功能的自动化脚本和相关镜像也放置于工具链中,也可实现持续集成和快速发布。最终实现实现平台的全容器化部署。

根据平台总体架构,各部分优先采用开源组件或项目,针对江苏云平台现状进行验证和适应性改造;无法采用开源组件或项目的,进行自主研发,研发成果完全公开透明。

 

客户反馈
 

截止目前,江苏公司“国网云”中共有服务节点321台、运行虚拟机1370台、运行容器306个,支撑99套业务系统安全稳定运行,同时也取得了如下具体成果:

  1. 解决了资源分散,资源之间无法共享,业务系统对设备依赖度高,单个设备故障将直接影响系统使用的问题;
  2. 避免了单一应用占用整个设备资源,资源能得到充分利用;
  3. 提高了系统运维自动化能力,将系统平均检修时长从3.2小时缩短至分钟级;
  4. 提升了平台自动化部署能力,将系统上线周期从至少两周缩短至数天甚至能够一键部署发布;
  5. 实现了资源的灵活分配和调度,能够随时随地为用户提供计算、存储、网络、平台和应用资源。