VentureBeat已经了解到,大数据软件公司Cloudera将于本周晚些时候在圣何塞的Strata + Hadoop世界大会上发布新的数据科学软件。
Cloudera计划推出数据科学软件和云服务
两位熟悉此事的消息人士告诉VentureBeat,该公司将推出Data Science Workbench软件,帮助数据科学家和数据工程师协同工作,并与Python,R,H2O和其他工具集成。这是继Cloudera 2016年收购创业公司Sense之后,该公司建立了一个数据科学协作工具。
Cloudera热衷于在Sense收购之前建立数据科学软件,但最终收购而不是发布自己的工具,Cloudera的产品高级副总裁Charles Zedlewski在接受采访时告诉VentureBeat。Zedlewski表示,自从收购Cloudera开发出与Apache Spark,Kerberos和Hadoop分布式文件系统(HDFS)的集成以来。
Zedlewski说,该软件的基于云的和本地版本将可用。Zedlewski说,三个月前该软件的私人测试版已经上市,有30位客户正在等待它。竞争对手包括Domino Data Lab。
此外,Cloudera正准备推出新的基于云的服务,VentureBeat 在8月份报道了这项服务。
第一个消息来源称,新产品中包括将在亚马逊网络服务(AWS)公共云上运行的企业数据中心(EDH)的托管版本。Cloudera将处理节点的管理,因此客户不必这样做。这将区别于AWS自己的弹性地图减少(EMR)和其他运行Hadoop开源软件某些组件版本的云服务,用于存储和处理大量不同类型的数据。
第一个消息来源称,还将推出基于云的Cloudera Impala大规模并行处理(MPP)引擎版本,人们将能够对亚马逊广泛使用的S3存储服务中存储的数据进行查询。此次发布将遵循AWS对Athena查询服务的介绍。Zedlewski说,Impala去年获得了对Amazon S3的支持。
消息人士表示,将在AWS基础设施上运行Altus元数据服务。该名称是对Apache Atlas开源元数据和数据治理软件的引用。消息人士不确定这三种云服务何时启动。
第一消息来源称,Cloudera在2016财年带来了3.3亿美元的收入,截至1月份。Zedlewski不会对此发表评论,也不会谈论除Data Data Workbench之外即将推出的服务。他说公司总是在寻找让Cloudera软件更容易在公共云上运行的方法。Zedlewski说,在过去的三年里,在公共云上运行公司的软件而不是在本地数据中心,这一点变得越来越受欢迎。
上周彭博社报道称,Cloudera已经为首次公开募股(IPO)提交了保密文件。Cloudera在Hadoop世界的竞争对手之一Hortonworks 于2014年上市。