欢迎访问九五青年博客,本博客致力于大数据技术、应用和项目技术架构分享
  1. 文章总数:101
  2. 阅读总数:1,057,006
  3. 分类目录:28个
  4. 最近更新:2020年5月20日
  5. 稳定运行:1166天

Elasticsearch 在各大互联网公司的应用以及业务解决方案和系统架构分享, ES在各大厂的应用还是很广泛的,包括携程、滴滴、今日头条、饿了么、360安全、小米、vivo等诸多知名公司。 除了搜索之外,结合Kibana、Logstash、Beats,Elastic Stack还被广泛运用在大数据近实时分析领域,包括日志分析、指标监控……

美团外卖数据仓库通过MOLAP+ROLAP双引擎模式来适配不同应用场景。MOLAP引擎使用了Apache Kylin。ROLAP我们经过综合考虑,选择了Apache Doris。本文将介绍Doris在美团外卖数仓的实践。 序言 本文侧重于以Doris引擎为“发动机”的数仓生产架构的改进与思考。在开源的大环境下,各种数据引擎百花齐放,但由于……

什么是数据湖? 数据湖是一个存储库,可以存储大量结构化、半结构化和非结构化数据。它是一个以本机格式存储每种类型数据的地方,不受帐户大小或文件的固定限制。它提供了高数据量来提高分析性能和本地集成。 数据湖就像一个大容器,非常类似于真实的湖泊和河流。就像在一个湖中有多个支流,一个数据湖有结构化数据,非结构化数据,机器对机器,实时流动的日志。 ……

什么是数据仓库? 数据仓库是一个包含来自单个或多个源的历史和交换数据的信息系统。它简化了组织的报告和分析过程。 对于任何一家公司来说,这也是一个用于决策和预测的真理的单一版本。 数据仓库的特点 数据仓库具有以下特点: 面向主题的(Subject-Oriented) 集成的(Integrated) 反映时间变化的(Time-Variant)……