24小时联系电话:185 8888 888

要闻
您现在的位置: 首页 > 要闻 > Databricks宣布数据集成合作伙伴计划,称其为“ Data Lakehouse”模型
  • 破记录的2万亿美元刺激计划中有什么?

    破记录的2万亿美元刺激计划中有什么?

    发布时间:2020/03/27

    经过几天的谈判,美国参议院今晚对第三项反对冠状病毒危机的法案进行投票。前两个法案着重于为医学研究提供资金并向病毒受害者提供经济支持,而“第三阶段”刺激法案则是对整个美国经济的大规模救助方案。这将花费...

  • 世界在煤炭支持上花费了半万亿美元

    世界在煤炭支持上花费了半万亿美元

    发布时间:2020/03/17

    全世界的国家有可能继续支持煤炭行业,而不是投资于成本更低,对环境更友好的风能和太阳能项目,从而浪费6400亿美元。 金融智囊团Carbon Tracker在周四发布的一份报告中说,全球60%的燃煤发电厂以比可再生能源替...

  • 您还不知道怎么毫无危险的投资?

    您还不知道怎么毫无危险的投资?

    发布时间:2020/03/13

    查看了许多财务平台,阅读有关加密货币、证券交易所的信息并没找到了答案? 我也处于过类似情况。我现在写出这篇文章,以帮助您与AlysDax公司一起开始工作! 前几天,我的朋友建议我AlysDax平台,哪个专为机构投...

  • MK FOREX提醒您:黄金:迈向短期阻力的路上

    MK FOREX提醒您:黄金:迈向短期阻力的路上

    发布时间:2020/03/02

    金价延续自1625美元/盎司开始的反弹 正常的RSI情况表明反弹将持续 关键的斐波纳奇回撤位,附近的上升趋势线限制了短线下跌 截至周四早间,金价在每盎司1,650美元附近。金价周三走出了U型走势。 黄金价格最近从162...

Databricks宣布数据集成合作伙伴计划,称其为“ Data Lakehouse”模型

发布时间:2020/02/26 要闻 浏览次数:927

 
由Apache Spark的创建者创建的Databricks公司今天宣布了其新的Data Ingestion Network程序。该合作伙伴计划(可能命名笨拙)将第三方数据集成,DataOps,集成平台即服务(iPaaS)以及更改数据捕获提供程序引入了公司的Unified Data Analytics Platform。
Databricks产品营销副总裁Bharath Gowda通过电话向ZDNet通报了这一消息。他说,数据摄取网络的章程成员包括Fivetran,Qlik(及其数据集成产品,以前是Attunity),Infoworks,StreamSets和Syncsort。 Databricks说,Informatica,客户数据平台Segment和Talend的Stitch Data Loader即将加入该计划。 Gowda指出,提供Azure Databricks作为第一方服务的Microsoft已将其与Azure Data Factory集成。
Databricks平台所基于的Apache Spark在流和批处理分析以及机器学习和更多面向代码的数据工程工作方面表现出色。但是开源Spark和商业Databricks平台都没有专注于可视化数据管道创作或从企业SaaS应用程序移出数据所需的全部连接器。同时,像Snowflake和Amazon的Redshift这样的竞争数据仓库平台一直在与数据集成提供商建立丰富的合作伙伴关系。数据提取网络将使Databricks与那些仓库平台进行强有力的竞争。
可以欣赏湖景的仓库?
在谈到数据仓库时,Databricks的首席执行官Ali Ghodsi强烈地认为,将这些数据仓库与数据湖平台分开运行会导致“孤立的数据……缓慢的处理和部分结果太延迟或太不完整而无法有效利用”。这就是为什么Databricks大力推广(也许更命名为“ data lakehouse”)的概念,它的概念是融合的数据湖/数据仓库平台。
毫无疑问,Spark作为数据湖的适用性。但是Databricks认为,平台的Delta Lake组件具有ACID事务和强大的一致性,因此也非常适合仓库工作负载。将其与包括Spark MLlib和MLflow在内的机器学习功能相结合,Databricks将自身视为分析和AI的综合平台,而Data Ingestion Network则将其牢牢抓住。
此Microsoft Access 2007中级技能演示文稿提供了预格式化的演示文稿,以帮助员工更好地利用数据库应用程序的功能。它涵盖了诸如创建和格式化报告,创建表格和…等内容。
TechRepublic Premium提供的工具和模板
数据湖和数据仓库是不同的结构,每个都有很大的优点。该湖是对处理较少的数据进行探索性分析的好地方,而仓库则可以很好地用于企业数十年来在此进行的高度结构化数据的运营分析。但是,仅仅因为结构是不同的,并不一定意味着平台就必须如此。
数据仓库结合了列式存储,内存操作和跨服务器集群的并行处理来完成工作。即使实现不同,Spark和Databricks(通过Parquet文件格式,核心Spark和Spark SQL的组合)也可以复制其中的大部分内容。添加第三方数据集成平台可能会选中最后一个框。