核心痛点:
系统开发迭代快,线上问题比较多,定位问题比较耗时。频繁大促,系统稳定性保障压力很大,第三方接口和一些慢SQL就可能导致严重的线上故障。压测与系统容量评估的工作非常频繁,需要做常态化的机制来支撑。系统大促时资源与日常资源相差较大,需要频繁扩缩容。
解决方案:
阿里云容器服务ACK+Spring Cloud Alibaba配合阿里云中间件PTS+AHAS+链路追踪产品的方案。
(1)系统进行容器化部署,利用阿里云容器服务的快速弹性应对大促时的资源快速扩容。
(2)系统提前接入链路追踪产品,用于对分布式环境下复杂的服务调用进行跟踪,对异常服务进行定位,帮助客户在测试和生产中快速发现问题,快速修复。
(3)使用阿里云性能测试服务PTS进行压测,利用PTS的秒级流量拉起,真实地理位置流量等特性,以最真实的互联网流量进行压测。
(4)收集压测数据,分析系统强弱依赖和关键瓶颈点,对关键业务接口、关键第三方调用、数据库慢调用、系统整体负载等进行限流保护。