名站推荐

zhisheng博客

专注于Flink,Spark,大数据技术的个人博客

过往记忆

知名的大数据技术架构与应用分享技术博客，分享包括但不限于 Hadoop、Spark、Kafka、Hudi、Iceberg、Delta Lake 等大数据相关的技术。

lxw大数据田地

有关 Hadoop、Spark、Hive、HBase、Flume、Kafka、Kylin、Druid.io等大数据技术；大数据分析平台；数据仓库；Spark实时计算；大数据视频下载；Hadoop视频下载；Spark视频下载的大数据田地

技术博客

zhisheng博客

专注于Flink,Spark,大数据技术的个人博客

董的博客

关注大规模数据处理，包括Hadoop，YARN，Spark，Flink，Presto等

过往记忆

知名的大数据技术架构与应用分享技术博客，分享包括但不限于 Hadoop、Spark、Kafka、Hudi、Iceberg、Delta Lake 等大数据相关的技术。

lxw大数据田地

dwgeek

程序员DD

该站是程序猿DD（翟永超）的技术分享博客。内容涵盖Java后端技术、Spring Boot、Spring Cloud、微服务架构、运维开发、系统监控等相关的研究与知识分享。

技术官网

Hadoop

Hadoop是一个分布式系统基础架构。

Spark官网

Spark是一个通用内存并行计算框架。

Kudu

Kudu是运行在hadoop平台上的列式存储系统

Mysql

MySQL是关系型数据库管理系统

Hive

Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供类SQL查询功能。

Scala

Scala是一门多范式的编程语言

Sqoop

Sqoop是用来实现结构型数据和Hadoop之间进行数据迁移的工具。

Flume

Flume 是一个分布式日志收集系统

Kafka

Kafka是一款分布式发布订阅消息系统

Redis

Redis是一个开源的内存中的数据结构存储系统，它可以用作数据库、缓存和消息中间件。

Cassandra

Cassandra是一个开源，分布式和分散式/分布式存储系统，用于管理遍布世界各地的大量结构化数据

ElasticSearch

Elasticsearch是一个基于Lucene的搜索服务器。

Clickhouse

ClickHouse 是面向 OLAP 的分布式列式 DBMS。

Pig

Pig 是一种探索大规模数据集的脚本语言，为了填补MapReduce开发周期长的缺点而产生。

Storm

Storm是Twitter开源的分布式实时大数据处理框架。

Mesos

Mesos是Apache下的开源分布式资源管理框架，它被称为是分布式系统的内核。

Flink

Flink是一个面向数据流处理和批量数据处理的可分布式的开源计算框架。

Samza

Samza是一个分布式流处理框架，专用于实时数据的处理。

Kylin

Apache Kylin™是一个开源的、分布式的分析型数据仓库，提供Hadoop/Spark 之上的 SQL 查询接口及多维分析（OLAP）能力以支持超大规模数据，最初由 eBay 开发并贡献至开源社区。它能在亚秒内查询巨大的表。

Impala

Impala是Cloudera公司主导开发的新型查询系统，它提供SQL语义，能查询存储在Hadoop的HDFS和HBase中的PB级大数据。

Presto

Presto是由Facebook开发的一个分布式SQL查询引擎，是专门设计为用来专门进行大数据实时查询计算而设计和开发的产品。

Druid

Druid 是一个为在大数据集之上做实时统计分析而设计的开源数据存储。

Zookeeper

ZooKeeper是一个分布式的，开放源码的分布式应用程序协调服务。

Oozie

Oozie 是一个工作流调度系统用来管理 Hadoop 任务

Ambari

Ambari是Hortonworks开源的Hadoop平台的管理软件，具备Hadoop组件的安装、管理、运维等基本功能，提供Web UI进行可视化的集群管理，简化了大数据平台的安装、使用难度。

Phoenix

Phoenix是构建在HBase上的一个SQL层，能让我们用标准的JDBC APIs而不是HBase客户端APIs来创建表，插入数据和对HBase数据进行查询。

学习教程

文档手册

Clickhouse中文文档

ClickHouse是一个用于联机分析(OLAP)的列式数据库管理系统(DBMS)。

Flink1.11中文文档

Apache Flink1.11中文文档

Mysql学习笔记

社区论坛

大数据中国

大数据中国关注数据产业，大数据资讯门户

大数据人

大数据人，中国大数据第一社区。

海牛部落

海牛部落是大数据技术交流论坛

Elasticsearch中文社区

Elastic 官方中文社区，围绕 Elastic 开源项目：elasticsearch、logstash、kibana、beats 等及周边技术的交流与探讨。

综合网站

数据分析网

数据分析网，大数据、数据分析、数据挖掘、人工智能(AI)、机器学习和数据科学领域领先的门户。

技术资讯

数据猿

数据猿是中国最权威的大数据媒体与企业应用服务平台，提供各行业大数据、大数据新闻资讯、大数据报告、数据交易共享、大数据案例、大数据分析应用、大数据挖掘、大数据营销、大数据企业指数等服务，致力成为大数据行业第一媒体服务平台！

数据通

数据通是一个大数据论坛，数据资源分享平台

数据观

数据观是一个大数据新闻门户网站，专注大数据、大数据分析和大数据应用，同时涉及移动互联网、征信、云计算等领域，为读者提供专业的大数据信息交流平台。

大数据世界

大数据世界提供大数据技术，大数据应用案例，汇聚大数据资料，讨论大数据话题。中国大数据是国内较早的公益性大数据网站。

中国大数据

中国大数据-大数据门户，技术共享，人工智能

名站推荐

zhisheng博客

过往记忆

lxw大数据田地

技术博客

zhisheng博客

董的博客

过往记忆

lxw大数据田地

dwgeek

程序员DD

技术官网

Hadoop

Spark官网

Kudu

Mysql

Hive

Scala

Sqoop

Flume

Kafka

Redis

Cassandra

ElasticSearch

Clickhouse

Pig

Storm

Mesos

Flink

Samza

Kylin

Impala

Presto

Druid

Zookeeper

Oozie

Ambari

Phoenix

学习教程

文档手册

Clickhouse中文文档

Flink1.11中文文档

Mysql学习笔记

社区论坛

大数据中国

大数据人

海牛部落

Elasticsearch中文社区

综合网站

数据分析网

技术资讯

数据猿

数据通

数据观

大数据世界

中国大数据

数据新闻

软件服务

常用工具

热门标签

热门文章