hadoop hadoop科普 大数据书籍 大数据学习路线图 How Study 阅读官方文档 看大牛博客 hadoop 导图笔记 hadoop伪分布式搭建 hadoop介绍 hadoop经典面试题及解题思路 hive 阅读官方文档 导图笔记 hive必会50道sql hive在离线计算用的比较多,工作好找,有sql基础入门比较快 Scala 阅读官方文档 导图笔记 scala 工作中spark代码一般都是使用 Scala 实现 优先学! Flink 阅读官方文档 流计算利器,但是资料比较少,建议直接看官方文档 我会将自己的翻译的文档不定期上传到Flink的目录下 Spark 阅读官方文档 导图笔记 SparkStreaming 阅读官方文档 导图笔记 Spark Structured Streaming 阅读官方文档 导图笔记 HBase 文档笔记 见HBase目录,不定期更新 kafka 阅读官方文档 导图笔记 开源的消息队列,流计算架构一定要有的一个组件 solr 阅读官方文档 导图笔记 全文检索 redis Redis命令参考 导图笔记 持续更新.. 会不定期的将在工作中接触大数据组件时做的去敏测试代码上传到对应的文件夹下供初学者参考,少走弯路 包括自己每天更新的大数据印象笔记 更新的进度和规划在issues 中 由于精力有限 今年计划重心是在实时计算上 flink 和 sparkStreaming spark结构化流公司不用 有空再去搞