开源分布式监控 CAT 系统的高可用实践

线上发布了服务,怎么知道它一切正常?为什么一个低级错误,需要花一个通宵、十几个人来排错?某个核心服务挂了,导致大量报错,如何确定到底是哪里出了问题?应用程序有性能瓶颈,如何提供一些有效工具发现?该主题主要分享 CAT 系统的高可用架构设计思路、应用实践以及如何提高业务系统的敏捷性和伸缩性。


PPT下载 :http://res.infoqstatic.com/downloads/pdfdownloads/presentations-ch%2F201804_Xnode_wuqimin.pdf?expire=1524447250&digest=56ead3b80795acbdc946a8b13cf1e81f

原文地址:http://www.infoq.com/cn/presentations/the-practice-of-open-source-distributed-monitoring-cat-system?utm_campaign=infoq_content&utm_source=infoq&utm_medium=feed&utm_term=global

标签: CAT, 监控