特来电监控平台建设,经历了从无到有,从有到强的发展历程,为云平台系统稳定运行提供了全方位的实时监控,并为故障的及时发现、及时分析、及时解决提供了不可或缺的技术支撑。一、回到起点,再谈监控据权威数据发布,特来电充电桩和充电量,已经双双悄然跃居全国首位。随着充电桩数量的增长,以及每天近150万度充电量的增长,这些数据背后的技术支撑也越来越复杂:系统规模越来越大:从最初的几十台服务器,演变为目前近千台服务器,并且服务器分布在多个数据中心;应用系统越来越复杂:由简单的三层架构,演变为微服务的分布式应用架构;应用程序种类越来越多:从最初的10几类应用程序,演变到目前100+;应用服务越来越多:2K+的Service Gateway(服务网关)服务、300+的HSF(高速服务框架)服务;应用中间件越来越繁多:搭建了垂直业务拆分的SQLServer数据库、HBase集群、 Redis集群、Kafka集群、RabbitMQ集群、Spark集群、Druid集群、ES集群等。这么多的机器、应用系统、应用服务、应用程序、应用中间件,如果出现了问题,怎么去排查,怎么去定位。如何及时发现问题并解决问题。