数据如何流转的?
提示:架构图复制代码
为什么要进行分层?分了哪几层?每层的作用是什么?
表如何分类?分别使用什么同步方案?具体如何实现同步?
提示:实体表、维度表、事务事实表、周期事实表,全量、增量、更新+新增复制代码
数据库设计三范式是什么?
提示: 列不能再分,不存在部分依赖和传递依赖复制代码
数据仓库OLAP使用哪种建模方案?业务数据库OLTP使用哪种建模方案?
提示:关系建模 VS 维度建模复制代码
维度建模有几种常见模型?
提示:星型模型、雪花模型、星座模型复制代码
业务数据库如何导入?导入哪种格式?
提示:sqoop,text,可以支持orc,sqoop参数复制代码
为什么要进行维度退化?如何进行维度退化?
提示:减少Join复制代码
用户行为指标有哪些?如何计算?
提示:活跃、新增、留存、流失、回流、沉默、连续活跃复制代码
GMV指标是什么?如何计算?
转化率指标是什么?如何计算?
漏斗模型是什么?如何计算?
品牌复购率是什么?如何计算?
拉链表是什么?如何生成?
提示:通过关系型数据库的create time和update time获取数据的新增和变化,用临时表解决了Hive中数据不能更新的问题。复制代码