谈及云服务,按需付费、弹性可扩展、更少的硬件成本、几乎零运维……可能是最先显现在人们脑海的一些特征,也正是这些优势吸引了企业用户的目光。但企业上云之后,其基础设施的底层架构被蒙上了一层神秘的面纱,有点“黑箱”的感觉。
企业初期上云时,通常是先尝试小规模非核心业务,这样的“黑箱”让企业尝到一些甜头——弹性的可用资源,可迅速ready的基础设施,解放了企业的运维人员,给业务的快速上线、弹性扩容创造了良好的环境。但是,随着企业用户将越来越多的关键业务迁移到云端,大规模的资源灵活扩展使得成本压力居高不下,更让人焦虑的是,这摸不到也看不见的云基础设施将企业置于云里雾里,阻碍企业运营效率的进一步提升。
对底层基础架构不了解,云中资源的准确运行状态不清晰,在这种情况下,企业难以优化资源配置,无疑需要一个“黄金瞳”一样的工具,利用它穿过“云”层,透视底部架构,全方位掌控云中资源运行状况,将云网看得更清晰、透彻。
云杉网络(北京云杉世纪网络科技有限公司)多年来一直专注于数据中心虚拟网络监、管、控解决方案以及SDN软件产品的研发。企业选择上云后,新的业务场景给网络运维、网络运营、网络安全等方面带来了全新的挑战。在云杉网络看来,云网络即虚拟网络成为了云平台运营者难以触及的黑盒子,虚拟网络监控、流量采集和分析已经成为企业上云后亟需解决的问题。
面对多样化、复杂化的云数据中心流量采集需求,云杉网络为云用户打造了一款云网分析产品DeepFlow®。这是一个数据驱动的虚拟网络可视化与分析平台,可帮助用户构建大规模、高性能、一体化的监控分析平台,提高云端资源利用率和云服务的安全性。目前,DeepFlow®已经在众多企业云资源流量采集、分析和监控中取得了不俗的效果,获得了众多企业用户的认可。
消除僵局资源:帮国泰君安提高云资源利用率
作为证券领域的龙头企业,国泰君安证券股份有限公司(简称:国泰君安)近年来将越来越多的业务迁移到云端,并运行在虚拟网络中,为满足业务快速发展的需求,基础设施部门对网络、计算等设备不断扩容。但却遇到了不少企业都似曾相识的状况:不断扩充的容量难以满足企业内部的资源需求,与此同时,分配出去的虚拟机资源利用率却不高。在与云杉网络一起合作进行深入剖析后发现,其资源利用低的原因有两点:
一,存在大量僵尸资源。由于业务上云之后,已有的静态拓扑并不能反映业务、资源的动态使用情况;同时,云服务的便利性,业务的频繁变更,致使僵尸资源越来越多。企业运营部门又缺少高效、快速判断资源使用状况的手段,无法快速回收并释放僵尸资源,以提升资源的利用率。
二、预留冗余资源。像国泰君安这样的传统企业,在业务上云之前长期使用裸金属服务器,性能配置都是额定的选项,其使用习惯通常选择资源有冗余以确保系统可以应对当前规划的最大负载;但上云之后,依然沿用这种相对粗放的管理方式,不仅有悖于云计算的按需和弹性,也造成了云资源的浪费和成本的增加。
基于国泰君安多业务形态和多云服务种类的调研,其运营团队选择采用虚拟网络流量分析和虚拟机状态遥测相结合的方法来提高云资源的利用率,最终引入了云杉网络DeepFlow®产品。
通过DeepFlow®平台,国泰君安运营团队在业务关键路径上自定义了报表和告警策略,可根据流量大小触发告警,轻松发现低流量资源组或项目的虚拟机,在日常巡检中,也可以通过查阅报表、条件检索的方式自助发现流量较少或没有流量的IP地址和虚拟机。
精准采集数据流量:助力华宇信息快速定位并排查故障
云中资源管理处于“黑箱”状态,导致云中的故障排查相比以往更加困难。北京华宇信息技术有限公司(简称:华宇信息)在业务上云后也遇到了同样的问题,导致故障难以定位与排查。
对此,华宇信息采用了云杉网络DeepFlow®解决方案,利用了云平台自身监控能力,针对不同的资源池设置了不同的告警体系。
借助云杉网络DeepFlow®平台,华宇信息实现了虚拟机流量数据和性能指标数据的精准采集;通过对监控项的调整和系统的调优,减少监控队列积压,提升系统监控容量;通过开源插件和自定义脚本实现私有云不同资源池集群的监控;监控系统通过告警对接自动化智能运维平台,实现了实时告警。
同时,DeepFlow®控制器通过与CMDB平台的对接,再根据其他诸如实时流量、监控告警信息的汇总展示,实现了资源池的整体可视化。华宇信息利用DeepFlow®构建的一体化监控运维平台可以覆盖绝大多数故障排查场景;对于极少部分的用户报障,从集群环境开始排查,利用网络性能查看等功能可迅速收拢故障点范围,通常可迅速确定问题原因。
DeepFlow®可谓之云网络运维的“黄金瞳”
利用云杉网络DeepFlow®平台,越来越多的企业得以透视其使用了VMWare、OpenStack、超融合等技术所构建的多云数据中心的资源使用情况,并且从统一的视角,实现了业务、虚拟网络、物理网络整体的可视化;借助DeepFlow®,上云企业拥有了故障识别、定位、排查的能力,可以将业务的稳定性和连续性提升到新的水平。
正因为如此,DeepFlow®很好地满足了上云企业对云资源透视、可见的需求。对于云网络运维而言,它就如同“黄金瞳”一样的存在,让企业能够透析云端资源的一切情况。