项目简介
本项目参考美团、OPPO、知乎等大数据实时数仓项目架构,采用当前主流的实时数据处理框架Flink进行搭建,对接多种数据源,并实现了对结果数据的实时展示,与离线数仓可以无缝对接,真正实现了流批一体,可以无缝满足企业实时数据处理需求。
项目架构
Nginx SpringBoot Flume1.9 Kafka2.4.1 Flink1.2 Canal HA Redis ElasticSearch HBase2.0.5 Phoenix ECharts MySQL5.7 Maxwell Kibana ClickHouse DataV
项目场景
可满足各种行业、不同规模的企业的实时数据处理场景,例如实时分析新用户注册人群、实时显示交易额、实时对账、实时预警等。
技术点
通过分层处理,让实时计算复用性更好,结构更清晰;通过结合MySQL动态配置表实现数据的动态分流;使用HBase Redis 实现维度数据的管理与关联查询;提供针对不同情境的双流Join解决方案,优化双流Join解决方案;结合keyed state实现数据的去重、计算等功能;实现对于所有需求提供Flink代码和Flink SQL代码两种解决方案,可满足不同的企业开发需求;使用Table Function 扩展FlinkSQL功能;使用Flink CEP实现不同用户行为模式的识别;使用Clickhouse 实现宽表数据的存储,提高数据查询效率,提供即席查询解决方案;结合Springboot对接百度sugar实现数据可视化大屏展示。
项目特色
本项目采用最新的实时数据处理框架Flink进行搭建,对接多种数据源,并实现了对结果数据的实时展示,与离线数仓可以无缝对接,真正实现了流批一体,可以无缝满足企业实时数据处理需求。通过分层处理,让实时计算复用性更好,结构更清晰。通过结合MySQL动态配置表实现数据的动态分流。使用HBase Redis 实现维度数据的管理与关联查询;提供针对不同情境的双流join解决方案,优化双流join解决思路;结合keyed state实现数据的去重、计算等功能;实现对于所有需求提供Flink代码和Flink SQL代码两种解决方案,可满足不同的企业开发需求;使用Table Function 扩展FlinkSQL功能;使用Flink CEP实现不同用户行为模式的识别;使用Clickhouse 实现宽表数据的存储,提高数据查询效率,提供即席查询解决方案;结合SpringBoot对接百度sugar实现数
课程目录
502_尚硅谷大数据之Spark
502_尚硅谷大数据之Spark
视频
资料
503_尚硅谷大数据之实时项目
视频
PART1
PART2
PART3
PART4
701_在线教育实战项目
4.视频
CDH
在线教育项目
大数据就业相关
大数据就业相关
01_就业指导
02_优秀数仓架构图(发给学生参考)
03_大厂内部技术分享
04_企业开发资料
05_埋点
06_各个班级就业问题反馈
尚硅谷大数据技术之高频面试题7.8.docx 24.71M
尚硅谷大数据技术之企业真题V1.1.1.doc 11.87M
作业.txt 0.39kb
就业答疑
就业答疑
就业答疑第1次
评论0