大数据--流量埋点基础(一)
什么是流量
流量是用户与网站交互产生的点击流数据的反应
是业务与用户的营销接触点,是业务红利的入口
流量数据通过用户行为反应营销漏斗过程。
流量基本指标介绍
数量指标(页面浏览量、访次、独立访客数、独立页面访问数)
页面浏览量(pv)
定义:页面被浏览次数的总和,统计一个网站时,指的是网站所有页面被点击的总次数。 从技术层面讲,指浏览器加载网页的次数总和。
公式:pv=count(1)
访问次数(visits)
定义:从来到网站到离开,算一次统计。离开后,再次重新访问,访问量按2次算。如果一直没有关掉网站,访问网站的不同页面,算一次访问。一天内不同时间访问网站N次,算N次访问。
公式:visits=count(distinct session_id)
独立访客数(uv)
定义:指不同的、通过互联网访问这个网页的自然人。 从技术层面上讲,用Cookie 来确定独立访客数,在浏览器cookie数据不清除的情况下,即使用多个IP切换来登录一个网站,也会只记为一个访客数。 独立访客很接近但并不完全就是真实独立的人。
公式:uv=count(distinct browser_uniq_id)
独立页面访问数(upv)
定义:UPV是针对页面这个维度而言的访问次数(一般访问次数都是针对访客的),即有多少个访问次数(Visits)经过这个页面,就是这个页面的UPV,Upv主要是避免页面的重复加载和刷新导致Pv虚高的情况,所以在同一个Visit当中重复打开同一个页面,该页面的upv始终只被记为1次。
公式:upv=sum( case when url_request_seq_num = 1 then 1 else 0 end )
质量指标(跳出率、退出率、平均页面停留时间、平均网站停留时间)
跳出率(Bounce Rate)
定义:"我来,我吐,我离开。"只浏览了一个页面便离开网站的访问次数占总访问次数的百分比。
跳出次数:Bounces,指进入网站后,不点击页面上的任何链接,就关闭它,那么对该网站而言就是一个Bounce(跳出) bounces=sum( case when first_request_flag = 1 and last_request_flag = 1 then 1 else 0 end )
公式:跳出率=跳出次数/访问次数.
退出率(Exits Rate)
定义:访客在一个页面离开网站的次数占该页面浏览量的百分比。
公式:退出率=退出次数/PV sum(case when last_request_flag = 1 then 1 else 0 end) as exits
平均页面停留时间(Avg_Page_Rt)
定义:特定网页上的停留时间总和除以该页面的浏览量
公式: Avg_Page_Rt =avg(case when stm_rt > 0 and stm_rt < 1800 then stm_rt end)
平均网站停留时间(Avg_Site_Rt)
定义:全站所有访次的停留时间总和除以全站总访次
公式: Avg_Site_Rt =avg(case when last_request_flag = 1 and session_rt >= 1 then session_rt end)
转化指标(转化率)
不同业务的定义可能不一样,目前较常用的定义有:订单量/访次,订单量/uv