2019年比较好的、最流行的25个数据仓库ETL工具排行榜,推荐

由于市场上有许多数据库仓库工具,因此很难为项目选择最佳工具。下面是最流行的开源/商业ETL工具的精选列表,其中包含一些关键特性和下载链接。

1) QuerySurge

QuerySurge是RTTS开发的ETL测试解决方案。它是专门为自动化数据仓库和大数据的测试而建立的。它还确保从数据源提取的数据在目标系统中保持完整。

特点:

  • 改进数据质量和数据治理
  • 加快数据交付周期
  • 帮助自动化手工测试工作
  • 提供跨不同平台的测试,如Oracle、Teradata、IBM、Amazon、Cloudera等。
  • 它加快了高达1000倍的测试过程,并提供高达100%的数据覆盖
  • 它为大多数构建、ETL和QA管理软件集成了开箱即用的DevOps解决方案
  • 提供可共享的、自动化的电子邮件报告和数据健康指示板

工具链接:http://bit.ly/2lDdumz

2) CloverDX

CloverDX是一个数据集成平台,它为那些需要对自己的工作进行全面、精细的控制、需要在密集的环境中解决复杂问题、以及宁愿购买最好的工具而不是开发自己的工具的人提供服务。

特点:

  • 自动化和协调转换和流程
  • 主机在云或内部,跨核心或集群节点伸缩
  • 代码在需要的地方
  • 开发人员和低成本团队之间的协作
  • 与现有的复杂IT环境共存
  • 构建可扩展框架以节省资金并与同事共享
  • 享受立体式企业级个人支持

工具链接:https://bit.ly/2I3Ec2q

3) Xplenty

Xplenty是一个基于云的ETL解决方案,它提供了简单的可视化数据管道,用于跨多种源和目的地的自动化数据流。该公司强大的平台转换工具允许客户清理、规范和转换他们的数据,同时遵守遵从性最佳实践。

特性

  • 为BI集中和准备数据
  • 在内部数据库或数据仓库之间传输和转换数据
  • 将额外的第三方数据发送到Heroku Postgres(然后通过Heroku Connect发送到Salesforce)或直接发送到Salesforce。
  • 从任何Rest API中拉入数据的Rest API连接器。

工具链接:https://bit.ly/2P33YdY

4) Skyvia

Skyvia是一个云ETL解决方案,可以帮助您快速地将数据从各种云应用程序和本地数据库获取到云数据仓库服务,如Amazon Redshift、谷歌BigQuery和Azure SQL数据仓库。

  • 基于向导的、不需要太多技术知识的无编码集成配置
  • 配置和自动化数据加载从云应用程序到数据仓库只需几分钟
  • 自动创建目标表
  • 增量更新以保持数据仓库是最新的
  • 强大的数据过滤
  • 广泛支持不同的云应用程序和数据库
  • 能够反向加载数据——从数据仓库到云应用程序和数据库
  • 只需要一个web浏览器-不需要安装任何东西或拥有IT基础设施

工具链接:https://bit.ly/30yGMWQ

5) Panoply

Panoply是一个智能数据仓库,它自动化了数据分析堆栈的所有三个关键方面:数据收集和转换()、数据库存储管理和查询性能优化

  • 超过100个预先构建的自动化数据源集成
  • 通过实时自动分配存储和计算需求来自动伸缩
  • 机器学习自动化连接和构建模式
  • 自动查询物化的自动查询性能优化
  • 无代码管理UI支持非技术用户
  • 建立在AWS架构和SOC 2认证和实践HIPAA准则
  • 连接到任何BI可视化工具,例如Chartio、Looker、Tableau、PowerBI

工具链接:https://bit.ly/2GeSLBV

6) Oracle

Oracle数据仓库软件是作为一个单元处理的数据集合。这个数据库的目的是存储和检索相关信息。它帮助服务器可靠地管理大量数据,以便多个用户可以访问相同的数据。

特点:

  • 以相同的方式跨磁盘分发数据,以提供统一的性能
  • 适用于单实例和实际应用程序集群
  • 提供真正的应用程序测试
  • 任何私有云和Oracle公共云之间的公共架构
  • 高速连接移动大数据
  • 与UNIX/Linux和Windows平台无缝协作
  • 它提供虚拟化支持
  • 允许连接到远程数据库、表或视图

下载链接:https://www.oracle.com/downloads/index.html

7) Amazon RedShift

Amazon Redshift是一个易于管理、简单且成本效益高的数据仓库工具。它可以使用标准SQL分析几乎所有类型的数据。

特点:

  • 无需预付安装费用
  • 它允许自动化大多数常见的管理任务来监视、管理和扩展数据仓库
  • 可以更改节点的数量或类型
  • 有助于增强数据仓库集群的可靠性
  • 每个数据中心都配备了完整的气候控制系统
  • 持续监视集群的健康状况。它会自动重新复制失败驱动器中的数据,并在需要时替换节点

下载链接:https://aws.amazon.com/redshift/

8) Domo

Domo是一个基于云的数据仓库管理工具,它可以很容易地集成各种类型的数据源,包括电子表格、数据库、社交媒体和几乎所有基于云的或内部数据仓库解决方案。

特点:

  • 帮助您建立您的梦想仪表板
  • 无论你去哪里,都要保持联系
  • 集成所有现有的业务数据
  • 帮助您获得对业务数据的真实见解
  • 连接所有现有的业务数据
  • 轻松的沟通和信息平台
  • 它支持使用SQL进行特别查询
  • 它可以处理大多数并发用户运行复杂和多个查询

下载链接:https://www.domo.com/product

9) Teradata Corporation

Teradata数据库是唯一商业上可用的无共享或大规模并行处理(MPP)数据仓库工具。它是查看和管理大量数据的最佳数据仓库工具之一。

特点:

  • 简单有效的解决方案
  • 该工具最适合任何规模的组织
  • 快速和最有洞察力的分析
  • 在多个部署选项上获得相同的数据库
  • 它允许多个并发用户询问与数据相关的复杂问题
  • 它完全建立在一个并行架构之上
  • 提供高性能、多种查询和复杂的工作负载管理

下载链接:https://downloads.teradata.com/

10) SAP

SAP是一个集成的数据管理平台,用于映射组织的所有业务流程。它是用于开放客户机/服务器系统的企业级应用程序套件。它为提供最佳的业务信息管理解决方案制定了新的标准。

特点:

  • 它提供高度灵活和最透明的业务解决方案
  • 使用SAP开发的应用程序可以与任何系统集成
  • 它遵循模块化的概念,便于设置和空间利用
  • 您可以创建一个结合分析和事务的数据库系统。这些下一代数据库可以部署在任何设备上
  • 提供对内部部署或云部署的支持
  • 简化数据仓库体系结构
  • 与SAP和非SAP应用程序集成

下载链接:https://support.sap.com/en/my-support/software-downloads.html

11) SAS

SAS是一个领先的Datawarehousing工具,允许跨多个源访问数据。它可以执行复杂的分析并在整个组织中交付信息。

特点:

  • 从中心位置管理活动。因此,用户可以通过Internet远程访问应用程序
  • 应用程序交付通常更接近一对多模型,而不是一对一模型
  • 集中功能更新,允许用户下载补丁和升级。
  • 允许查看外部数据库中的原始数据文件
  • 使用数据输入、格式化和转换工具管理数据
  • 使用报表和统计图形显示数据

下载链接:https://www.sas.com/en_in/home.html

12) IBM – DataStage

IBM data Stage是一个用于跨各种企业系统集成可信数据的业务智能工具。它利用了一个高性能的并行框架,可以在云中使用,也可以在内部使用。此数据仓库工具支持扩展元数据管理和通用业务连接。

特点:

  • 支持大数据和Hadoop
  • 不需要安装新的软件和硬件就可以访问额外的存储或服务
  • 实时数据集成
  • 随时随地提供可信的ETL数据
  • 解决复杂的大数据挑战
  • 优化硬件利用率并对关键任务进行优先级排序
  • 部署在本地或云中

下载链接:http://www ibm.com/support/docview.wss?uid=swg24037518

13) Informatica

Informatica PowerCenter是Informatica公司开发的数据集成工具。该工具提供了从不同来源连接和获取数据的功能。

特点:

  • 它有一个集中的错误日志记录系统,可以方便地记录错误并将数据拒绝到关系表中
  • 内置智能以提高性能
  • 限制会话日志
  • 能够扩展数据集成
  • 数据体系结构现代化基础
  • 更好的设计和代码开发的最佳实践
  • 与外部软件配置工具的代码集成
  • 地理分布的团队成员之间的同步

下载链接:https://informatica.com/

14) MS SSIS

SQL Server Integration Services是一个用于执行ETL操作的数据仓库工具;即提取、转换和加载数据。SQL Server集成还包括一组丰富的内置任务。

特点:

  • 与Microsoft Visual Studio和SQL Server紧密集成
  • 更容易维护和打包配置
  • 允许移除网络作为插入数据的瓶颈
  • 数据可以在多个位置并行加载
  • 它可以在同一个包中处理来自不同数据源的数据
  • SSIS使用FTP、HTTP、MSMQ和分析服务等比较困难的数据。
  • 数据可以并行地加载到许多不同的目的地

下载链接:https://www.microsoft.com/en-us/download/details.aspx?id=39931

15) Talend Open Studio

Open Studio是Talend开发的一个开源数据仓库工具。它的目的是在不同的位置转换、组合和更新数据。该工具提供了一组直观的工具,使处理数据变得更加容易。它还允许大数据集成、数据质量和主数据管理。

特点:

  • 它支持广泛的数据集成转换和复杂的流程工作流
  • 为900多个不同的数据库、文件和应用程序提供无缝连接
  • 它可以管理集成流程的设计、创建、测试、部署等
  • 跨数据库平台同步元数据
  • 管理和监控工具,以部署和监督作业

下载链接:https://www.talend.com/download/

16) The Ab Initio software

从头开始是一种基于数据分析、批处理和GUI的并行处理数据仓库工具。它通常用于提取、转换和加载数据。

特点:

  • 元数据管理
  • 业务和流程元数据管理
  • 能够运行,调试从头开始的作业和跟踪执行日志
  • 管理和运行图并控制ETL进程
  • 组件可以在图的各个分支上同时执行

下载链接:https://www.abinitio.com/en/

17) Dundas

Dundas是一个企业级的商业智能平台。它用于构建和查看交互式仪表板、报告、记分卡等。可以将Dundas BI部署为组织的中心数据门户,也可以将其集成到现有网站中作为自定义BI解决方案。

特点:

  • 为业务用户和IT专业人员提供的数据仓库工具
  • 通过web浏览器轻松访问
  • 允许使用样本或Excel数据
  • 具有完整产品功能的服务器应用程序
  • 集成和访问所有类型的数据源
  • 特别报告工具
  • 可定制的数据可视化
  • 智能拖放工具
  • 通过映射可视化数据
  • 预测和先进的数据分析

下载链接:http://www.dundas.com/support/dundas-bi-free-trial

18) Sisense

Sisense 是一个商业智能工具,可以实时分析和可视化大型和不同的数据集。它是一种理想的工具,可以为创建具有多种可视化的仪表板准备复杂的数据。

特点:

  • 将不相关的数据统一到一个集中的地方
  • 使用无缝数据创建一个真实的单一版本
  • 允许建立互动仪表板没有技术技能
  • 以非常快的速度查询大数据
  • 甚至可以在移动设备中访问仪表板
  • 拖放用户界面
  • 吸引眼球的可视化
  • 支持提供交互式tb级的分析
  • 导出数据到Excel, CSV, PDF图像和其他格式
  • 对大量数据的特别分析
  • 在单个商品服务器上按比例处理数据
  • 使用筛选和计算确定关键指标

下载链接:https://www.sisense.com/get/watch-demo/

19) TabLeau

Tableau Server是一个在线数据仓库,包含桌面、服务器和在线三个版本。它是一个安全、可共享和移动友好的数据仓库解决方案。

特点:

  • 安全地连接到本地或云中任何数据源
  • 灵活部署的理想工具
  • 大数据,实时或内存
  • 专为移动优先的方式设计
  • 安全共享和协作数据
  • 集中管理元数据和安全规则
  • 强大的管理和监控
  • 连接到任何地方的任何数据
  • 通过这个业务分析平台,从您的数据中获取最大价值
  • 在云中共享和协作
  • Tableau与现有的安全协议无缝集成

下载链接:https://public.tableau.com/en-us/s/download

20) MicroStrategy

MicroStrategy是一种企业商业智能应用软件。该平台支持交互式仪表板、记分卡、高度格式化的报表、特别查询和自动报表分发。

特点:

  • 无与伦比的速度、性能和可伸缩性
  • 使企业投资价值最大化
  • 消除了对多种工具的依赖
  • 支持高级分析和大数据
  • 深入了解用于增强组织安全性的复杂业务流程
  • 强大的安全和管理功能

下载链接:https://www.microstrategy.com/us/get-started

21) Pentaho

Pentaho是一个数据仓库和业务分析平台。该工具具有一种简化的交互式方法,允许业务用户访问、发现和合并所有类型和大小的数据。

特点:

  • 企业平台加速数据管道
  • Community Dashboard Editor允许快速高效的开发和部署
  • 无需编码的大数据集成
  • 简化嵌入式分析
  • 使用自定义仪表板可视化数据
  • 易于使用,具有集成所有数据的能力
  • mongo dB的运行报告
  • 加速数据管道平台建设

立即下载:http://www.pentaho.com/testdrive

22) BigQuery

Google’s BigQuery是一个企业级数据仓库工具。通过启用超高速SQL查询,它减少了存储和查询大量数据集的时间。它还控制对项目的访问,并提供查看或查询数据的功能。

特点:

  • 提供灵活的数据摄取
  • 通过云数据流、Hadoop和Spark读写数据。
  • 自动数据传输服务
  • 完全控制对存储数据的访问
  • 易于通过云数据流、Spark和Hadoop在BigQuery中读写数据
  • BigQuery提供了成本控制机制

立即下载:https://cloud.google.com/bigquery/

23) Numetric

Numetric是一个快速简单的BI工具。它提供从数据集中到清理、分析和发布的商业智能解决方案。它足够强大,任何人都可以使用。这个数据仓库工具有助于度量和提高生产力。

特点:

  • 基准测试数据
  • 预算和预测
  • 数据图表可视化
  • 数据分析
  • 数据映射与字典
  • 关键性能指标

下载链接:https://www.numetric.com/

24) Solver 360 Suite

Solver BI360是一个最全面的商业智能工具。它可以360º洞察任何数据,使用报告、数据仓库和交互式仪表板。BI360驱动高效、基于数据的生产力。

特点:

  • 使用预定义模板的基于excel的报告
  • 货币转换和公司间的交易消除可以自动化
  • 用户友好的预算和预测功能
  • 它减少了编写报告和规划的时间
  • 配置简单,界面友好
  • 自动化的数据加载
  • 结合财务和运营数据
  • 允许在数据资源管理器中查看数据
  • 轻松添加模块和维度
  • 任何维度上无限的树
  • 支持Microsoft SQL Server/SQL Azure

下载链接:http://www.solverglobal.com/products/

25) MarkLogic

MarkLogic是一个数据仓库解决方案,它使用一系列企业特性使数据集成更容易、更快。该工具有助于执行非常复杂的搜索操作。它可以查询包括文档、关系和元数据在内的数据。

特点:

  • optical API可以在文档、三元组和行上执行连接和聚合。
  • 它允许为文档中的所有元素指定更复杂的安全规则
  • 以JSON、XML、文本或二进制格式编写、读取、修补和删除文档
  • 用于灾难恢复的数据库复制
  • 在App服务器配置上指定输出选项
  • 导入和导出配置信息

下载链接:https://developer.marklogic.com/products

点赞

发表评论

电子邮件地址不会被公开。 必填项已用*标注