博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
数据仓库
阅读量:6829 次
发布时间:2019-06-26

本文共 571 字,大约阅读时间需要 1 分钟。

数据如何流转的?

提示:架构图复制代码

为什么要进行分层?分了哪几层?每层的作用是什么?

表如何分类?分别使用什么同步方案?具体如何实现同步?

提示:实体表、维度表、事务事实表、周期事实表,全量、增量、更新+新增复制代码

数据库设计三范式是什么?

提示: 列不能再分,不存在部分依赖和传递依赖复制代码

数据仓库OLAP使用哪种建模方案?业务数据库OLTP使用哪种建模方案?

提示:关系建模 VS 维度建模复制代码

维度建模有几种常见模型?

提示:星型模型、雪花模型、星座模型复制代码

业务数据库如何导入?导入哪种格式?

提示:sqoop,text,可以支持orc,sqoop参数复制代码

为什么要进行维度退化?如何进行维度退化?

提示:减少Join复制代码

用户行为指标有哪些?如何计算?

提示:活跃、新增、留存、流失、回流、沉默、连续活跃复制代码

GMV指标是什么?如何计算?

转化率指标是什么?如何计算?

漏斗模型是什么?如何计算?

品牌复购率是什么?如何计算?

拉链表是什么?如何生成?

提示:通过关系型数据库的create time和update time获取数据的新增和变化,用临时表解决了Hive中数据不能更新的问题。复制代码

转载于:https://juejin.im/post/5d09a221f265da1b667bdea4

你可能感兴趣的文章