data-market
latest
Contents:
数据仓库项目启动会议
项目时间大致安排
系统分层设计
src:源数据层
ods 原始数据层
mid 中间数据层
dm 数据集市
mdw 元数据管理层
明天的任务
第一阶段目标
对数据仓库的理解
MDW模块设计
2018-08-02例会
2018-08-01_例会
2018-08-09例会
2018-08-13例会
2018-08-14例会
2018-08-15例会
2018-08-16例会
cdh hdp 区别
命名规范
8.20会议记录
8.22会议记录
8.23会议记录
8.24会议记录
kylo install
kylo issue
8.29会议记录
8.29会议记录
kylo-issue(accessory)
data-market
Docs
»
数据仓库项目启动会议
Edit on GitHub
数据仓库项目启动会议
¶
项目时间大致安排
¶
设计到8月3号
开发一期预计到9月底
系统分层设计
¶
src:源数据层
¶
需要通过etl抽取的数据 nifi
flume
从db中同步的数据 nifi sqoop
ods 原始数据层
¶
数据主要存放在hdfs
mid 中间数据层
¶
数据全部存储在hive
dm 数据集市
¶
数据主要存储在hbase、es、mysql。
先不做api接口开发的相关工作。
mdw 元数据管理层
¶
基于mysql的web系统。
明天的任务
¶
根据设计分层学习数据仓库的概念,查漏补缺。尽量定义命名规范。
第一阶段目标
¶
给出设计文档