云杉网络DeepFlow帮助企业构建云原生可观测性能力
2022-03-10 10:22:50爱云资讯阅读量:952
CNCF在云原生的定义中,将可观测性(Observability)明确为一项必备要素。因此,使用云原生应用架构,享受其带来的效率提升时,不得不面对的是如何构建匹配的可观测性能力。
可观测性并不是通过简单使用一个工具所能具备,是需要根据企业组织、业务应用、基础设施以及已有的监控体系的需求现状,明确阶段目标,伴随着业务发展逐步建立,是一个持续发展的过程。云杉网络与客户的共同实践,基于云原生应用发展的现状,通过DeepFlow与客户的应用、网络、基础设施整合,综合分析各类指标、日志以及追踪数据,形成一站式的容器化微服务可观测性方案。
可观测性,必须要解决以下问题:
1.在数百个服务中发现瓶颈:提供非采样,秒级精度,提供HTTP/DNS/GRPC等性能指标数据
2.在数千个访问中追踪应用:提供应用层Trace追踪数据,网络层Flow追踪数据
3.在数万个容器中定位根因:提供全栈(API、主机、基础设施)端到端指标数据、日志数据
注意,解决上述问题,还需要零侵扰、多维度和实时性。
云杉网络DeepFlow v5.0产品,在NPM基础上,利用classic BPF技术,通过host的用户态(零侵扰)监控到主机及虚机的系统和网卡流量。DeepFlow v6.0产品,利用eBPF技术,进一步在零侵扰的前提下获取了应用和sidecar的信息,扩展了多维度的能力。
过去三年时间,云杉网络DeepFlow产品中的关键数据组件,经历了两次重要的升级。2018年使用ES作为主要引擎,读写速度无法满足实时性要求,只能为数百台规模的业务集群实施可观测性。
1.2020年初,DeepFlow v5.5发布,融入了深度优化的InfluxDB作为Metrics引擎,使平台性能提升10倍,可以解决数千台服务器集群的可观测性。
2.2021年12月,DeepFlow v6.0的第一个版本发布,进一步融入了深度优化的ClickHouse作为观测数据的OLAP,读写性能再提升10倍,满足金融及互联网客户的数万规模的集群部署。
DeepFlow容器化微服务可观测性方案
DeepFlow提供适用于容器化微服务的可观测性,解决云原生应用诊断难的核心痛点。通过对全局微服务间的通信访问、系统调用、平台环境等数据进行深度分析,提供监控告警、故障定位及风险排查,保障业务在云原生环境中的稳定、高效运行。
DeepFlow可观测性整体架构图
分钟级定位问题边界:基于容器化微服务的云原生应用出现故障时,快速明确问题边界是解决问题的第一步。基于知识图谱、微服务调用链、全栈追踪等功能组合,快速检索到异常单元所关联涉及到的其他维度信息和影响范围;直观展示系统、容器、虚拟主机全栈性能指标锁定性能洼地等。
大幅提升排障效率:排障过程并不仅是找到故障根因并修复,而是从定位、根因、修复、验证及预防一整套运维保障操作闭环。容器环境叠加微服务架构使得排障更加复杂,需要有效地将应用、容器平台、系统调用等运维数据进行关联,且对比指标、跟踪以及日志特征来提高根因的准确性;并通过历史视图、系统运行表现、修复验证等指标来确认从而提升效率。
微服务可用性指标:应用微服务化后,衡量判断众多微服务的质量以及可用性是一个繁琐的问题。涉及到不同开发团队,设定具体指标,周期性的记录和评估,发现性能洼地及热点等等。这些工作都是要建立在数据积累的基础之上,DeepFlow平台也是基于此来进行对微服务各维度的画像评估。通过对应用中所涉及的几十、上百个微服务运行的历史指标数据进行量化分析,在一个运行周期中,能实时监控业务是否达到99.99%的可用性要求,并分析出潜在影响可用性的各种原因。
DeepFlow容器化微服务可观测性方案,面向公有云K8s、容器环境。利用eBPF等新技术的零侵入特性实现对网络、系统、应用的全栈黄金指标的采集。对服务调用链以及Service mesh、iptables/ipvs、NAT的逐跳链路追踪,对服务访问的零采样全留存,并结合云资源知识图谱和变更事件数据,搭建立体化的微服务可观测平台。保障云及微服务业务有序可控发展。
构建云原生可观测性能力
云杉网络提供容器化微服务可观测免费试用版本,试用期内免费且无限量部署采集器。可享受业务零侵入部署,深度体验DeepFlow全栈链路追踪等能力,为平台开发团队、业务开发团队、技术运营团队带来一键部署即可享受的‘轻便体验’,帮助企业更顺畅地走上云原生之旅。