如何对长周期指标的计算进行优化_云原生大数据计算服务 MaxCompute(MaxCompute)-阿里云帮助中心

本文为您介绍如何对长周期指标的计算进行优化。

实验背景

电子商务公司在电商数据仓库和商业分析场景中，经常需要计算最近N天的访客数、购买用户数、老客数等类似的指标。这些指标需要根据一段时间内的累积数据进行计算。

通常，这些指标的计算方式为从日志明细表中查询数据进行计算。例如，运行如下SQL语句计算商品最近30天的访客数。

SELECT item_id --商品id 
  ,COUNT(DISTINCT visitor_id) AS ipv_uv_1d_001 
FROM 用户访问商品日志明细表 
WHERE ds <= ${bdp.system.bizdate} 
AND ds >=to_char(dateadd(to_date(${bdp.system.bizdate},'yyyymmdd'),-29,'dd'),'yyyymmdd') 
GROUP BY item_id;

INSERT OVERWRITE TABLE mds_itm_vsr_xx(ds='${bdp.system.bizdate} ')
SELECT item_id,visitor_id,count(1) AS pv 
  SELECT item_id,visitor_id
  FROM 用户访问商品日志明细表 
  WHERE ds =${bdp.system.bizdate} 
  GROUP BY item_id,visitor_id 
) a;

SELECT item_id
        ,COUNT(DISTINCT visitor_id) AS uv
        ,SUM(pv) AS pv
  FROM mds_itm_vsr_xx
  WHERE ds <= '${bdp.system.bizdate} '
  AND ds >= to_char(dateadd(to_date('${bdp.system.bizdate} ','yyyymmdd'),-29,'dd'),'yyyymmdd')
  GROUP BY item_id;

SELECT item_id --商品id 
        ,buyer_id AS old_buyer_id
FROM 用户购买商品明细表 
WHERE ds < ${bdp.system.bizdate} 
AND ds >=to_char(dateadd(to_date(${bdp.system.bizdate},'yyyymmdd'),-29,'dd'),'yyyymmdd') 
GROUP BY item_id
        ,buyer_id;

长周期指标的计算优化方案

实验背景

实验目的

实验方案

影响及思考

场景示例