流量场景标
基于此数据,也可以更好的复盘全链路压测数据。在压测之前(也可以在常态下)对关键业务打上指定的标签,压测后通过各业务场景的流量得出对应的性能基线,更好的定位核心链路中的问题及性能拼劲,提高压测的效率和价值。
精细化监控
EagleEye的链路数据对于问题的发现和定位有着至关重要的作用,更加丰富的数据形式和展现对提高发现的效率有明显的提升。
在整个双十一备战过程中,遇到并解决了很多疑难杂症。其中,单机问题占了很大的比例。在分布式系统中,单机问题是比较常见的一类问题, 由于此类问题往往与业务代码不直接相关,与容器或者机器有一定的关联性,且出现的概率较小,有一定的随机性,导致该问题往往比较难排查。实际业务的表现可能是RT的抖动,也可能是小概率的错误等等。
EagleEye的调用链虽然可以很快定位此类问题,但是调用链是站在单次请求的视角上,在定位到某个IP之后很可能还需要再分析更多的数据才能做决策,针对此类的问题,EagleEye提供了错误TopN分布以及系统热点图等功能,帮助业务方开发同学快速定位问题。针对单机故障,往往对于整体的指标影响不大,通过应用级别的监控数据比较难定位,EagleEye在流计算中统计了应用各个机器的错误情况,汇总并排序出Top10的机器,一旦出现单机故障,可以很明显的定位到具体的IP,并且根据该IP对应的错误数量可以很快做出决策,缩短了开发同学排查问题的时间。系统热点图在压测和大促期间对系统健康度的表现非常清晰,一是可以清晰看到是否存在离群点的机器,二是可以验证流量的去向是否正确。
网站流量基本概念
通常说网站流量(traffic)是指网站的访问量,是用来描述访问一个网站的用户数量以及用户所浏览的页面数量等指标,常用的统计指标包括网站的独立用户数量(一般指IP)、总用户数量(含重复访问者)、页面浏览数量、每个用户的页面浏览数量、用户在网站的平均停留时间等【详细说明:访问流量包括哪些主要统计指标。流量也是决定一个网站价值的因素】。