
出品 | CSDN云原生
2022年4月26日,CSDN云原生系列在线峰会第2期“可观测性与APM峰会”如期而至,本期峰会出品人、腾讯云专家架构师刘超携手腾讯可观测平台技术负责人罗嘉黎、青云科技顾问软件工程师雷万钧、谐云产品总监&可观测产品负责人蒋玉芳、听云研发总监杨金全,全面、深入分享了eBPF、Prometheus、Notification Manager等可观测性与APM相关的应用实践。

本文先简单回顾本期峰会的内容。演讲视频、完整文章将从4月27日起在本公众号陆续发布,敬请关注。
在腾讯云专家架构师刘超看来,云原生、微服务带来的便利性和巨大价值已不言而喻,但同时由于微服务带来的相对复杂性,对习惯了在传统IT架构、业务架构下工作的人来说,他们很难再以传统的方式清楚地了解业务部署情况,因此可观测性和APM的重要性日益凸显。借助可观测性和APM,可以实现用统一的视角,掌握业务、应用的链路过程,让云原生、微服务更可控、可观测。

基于APM的腾讯可观测平台技术与实践
腾讯可观测平台技术负责人罗嘉黎,将腾讯可观测性发展总结为四个阶段:

在详细分享了腾讯在这四个阶段的探索后,罗嘉黎将腾讯的实践经验总结为8条:
单独集群做⾃监控——异地容灾
⽹络调⽤RPC/http调⽤指标+合理告警——⽆侵⼊探针(APM/RUM)
MySQL、Redis、ES等存储相关调⽤告警——⽆侵⼊探针(APM)
重点关注数据⼀致性相关问题的告警——业务指标埋点(Prometheus)
⽇志类数据通过中间件打印清楚上下⽂信息(⽐如AppID、IP、返回码等等)
重视从业务场景的拨测——持续集成测试(CAT)
确保告警的有效性和数量限制
通过压测去观测以上数据的情况

使用Notification Manager构建云原生通知系统
青云科技顾问软件工程师雷万钧认为,云原生通知系统具备四个特点:
为 Kubernetes 而生
支持对接多种的事件源的告警、事件、审计等
多租户设计
高并发,可以同时处理大量的通知
Notification Manager是KubeSphere开源的一款云原生多租户通知管理系统,支持从Kubernetes接收告警、事件、审计,根据用户设置的模板生成通知消息并推送给用户,支持将通知消息推送到DingTalk、Email、Feishu、Pushover、Slack、WeCom、Webhook、短信平台(阿里、腾讯、华为)等。其架构如下所示:


基于eBPF技术的可观测方案实践
eBPF是一种高级虚拟机,可以在内核中运行沙盒程序,而无需改变内核源码或加载内核模块,并具有相对较高的安全性以及性能。
谐云产品总监、可观测产品负责人蒋玉芳在深度解析eBPF实现可观测的优势和特点、应用场景、基本类型以及原理、国内外落地案例等方面的基础上,分享了一种基于eBPF技术的可观测方案实践。


以Tracing为核心的可观测性体系
在听云研发总监杨金全看来,云原生时代下的系统复杂性越来越严重:
用户体验和应用比以往任何时候都重要
应用的数量、数据的体量,变化的频率和增加的速度
多云/混合云,一切都是容器化且动态变化
多种多样的开发语言,各种各样的运行时,支持软件和数据库
资源仍然有限,不断增加的系统复杂性、故障排查难度,正在窃取企业的创新时间
基于此,杨金全认为应以Tracing为核心融合可观测性三大支柱(Metrics、Logging、Tracing)建立可观测性平台。

该可观测性平台应具备以下能力:
全面的数据采集能力
全量的数据采集能力
通过自动化技术实现可伸缩性和完整性能力
高基分析的能力
超大规模实时计算能力
多源集成能力
基于AI和确定性因果关系的根因分析能力
业务实时洞察能力

彩蛋来了
扫码入群,获取本场峰会PPT
DevOps的初衷是让开发人员有更多时间为最终用户创造价值,同时提高工作效率,而无需在开发和平台运维之间进行思维转换。

聚焦云原生新技术、新实践,帮助开发者群体赢在开发范式转移的新时代。欢迎关注CSDN云原生微信公众号~