大数据领域的顶级开源工具大集合

2016.11.21 / View:0

随着大数据与预测分析的成熟,开源作为底层技术授权解决方案的最大贡献者的优势越来越明显。

如今,从小型初创企业到行业巨头,各种规模的供应商都在使用开源来处理大数据和运行预测分析。借助开源与云计算技术,新兴公司甚至在很多方面都可以与大厂商抗衡。

以下是一些大数据方面的顶级开源工具,分为四个领域:数据存储、开发平台、开发工具和集成、分析和报告工具。

数据存储:

 

Apache Hadoop– Cloud Foundry(VMware), Hortonworks, Hadapt NoSql 数据库 – MongoDB, Cassandra, Hbase SQL 数据库 – MySql(Oracle), MariaDB, PostgreSQL, TokuDB

开发平台:

Apache Hadoop平台 – Impala(开源大数据分析引擎); Lingual(ANSI SQL); Pattern(analytics);Cascading(开源大数据应用程序开发框架) Apache Lucene和 Solr平台 OpenStack(构建私有云和公有云) Red Hat (搭载 Hadoop 服务器的标准 Linux 发行版) REEF(微软的Hadoop开发者平台) Storm(集成了各种排队系统和数据库系统)

开发工具和集成:

Apache Mahout(机器学习的编程语言) Python 和 R(预测分析编程语言)

分析和报告工具:

Jaspersoft(报告和分析服务器) Pentaho(数据集成和业务分析) Splunk(IT分析平台) Talend(大数据集成,数据管理和应用集成)

以上就是我们总结的大数据方面不错的工具,希望对您有所帮助。

扫描微信下面二维码,随时了解大数据最新动向,添加36大数据官方微信公共帐号dashuju36:

永洪科技
致力于打造全球领先的数据技术厂商

申请试用
Copyright © 2012-2024开发者:北京永洪商智科技有限公司版本:V10.2
京ICP备12050607号-1京公网安备110110802011451号 隐私政策应用权限