data-market
latest
Contents:
数据仓库项目启动会议
对数据仓库的理解
MDW模块设计
2018-08-02例会
2018-08-01_例会
2018-08-09例会
2018-08-13例会
2018-08-14例会
2018-08-15例会
2018-08-16例会
cdh hdp 区别
命名规范
8.20会议记录
8.22会议记录
8.23会议记录
8.24会议记录
kylo install
kylo issue
8.29会议记录
8.29会议记录
kylo-issue(accessory)
data-market
Docs
»
<no title>
Edit on GitHub
Contents:
数据仓库项目启动会议
项目时间大致安排
系统分层设计
src:源数据层
ods 原始数据层
mid 中间数据层
dm 数据集市
mdw 元数据管理层
明天的任务
第一阶段目标
对数据仓库的理解
问题
总结
任务:
补充:kylo
尝试实现每一层的主要技术:
MDW模块设计
大家相互培训一下
2018-08-02例会
今天任务
2018-08-01_例会
2018-08-09例会
当前情况
任务现状
任务安排
2018-08-13例会
爬虫的问题
数据仓库进度
任务安排
2018-08-14例会
2018-08-15例会
2018-08-16例会
cdh hdp 区别
kylo
疑问点
命名规范
hdfs:
kafka:
hive:
spark: 清洗的根据系统的名字来。
kylin
hbase:
es
mysql:dm_subject_业务
8.20会议记录
当前情况
kylo
HDF
后续计划
kylo
HDF
8.22会议记录
当前遇到的问题
阶段性总结
接下来要做的事
8.23会议记录
当前进度
计划
8.24会议记录
当前进度
之后计划
kylo install
kylo issue
安装完成,启动kylo 创建kylo表,初始化数据过程中报错。
执行自定义feed
执行spark job 报错
执行transform表数据预览时spark-shell报错。
8.29会议记录
当前进度
之后计划
8.29会议记录
当前进度
之后计划
kylo-issue(accessory)
问题一:elasticsearch 9300链接不上
问题二:org.apache.hive.service.cli.HiveSQLException: Error while compiling statement: FAILED: SemanticException Cannot find class ‘org.apache.hadoop.hive.druid.DruidStorageHandler’