您的位置首页百科知识

数据仓库与数据湖的区别

数据仓库与数据湖的区别

的有关信息介绍如下:

数据仓库与数据湖的区别

数据分析中,关于数据的存储位置一直是数据分析师们特别关心的问题,因为位置的不同,就会导致取数,以及数据清洗的不同,现在应用最多的是数据库和数据湖,但是,人们通常在理解“数据湖”和“数据仓库”等术语时往往会犯错误。下面我们就来具体了解一下他们的区别。

数据湖:在数据湖中,无论其结构如何,都可以存储数据,并以原始形式保存数据,直到需要使用为止。

数据仓库:但是在数据仓库中,提取的数据组成了定量指标,其中对数据进行了清理和转换。

数据湖:数据湖中使用的像大数据这样的技术是一个新概念。

数据仓库:像数据仓库这样的概念已经使用了数十年。

数据湖:具有存储所有数据的能力,可以存储当前数据和将来需要使用的数据。

数据仓库:需要花费大量时间专门用于分析多个源。

数据湖:可以收集所有类型的数据,包括结构化和非结构化。

数据仓库:它会收集结构化数据并将其按照专门为数据仓库设计的架构进行排列。

数据湖:包含所有类型的数据,并促使用户在处理和清除数据之前访问数据。

数据仓库:提供对预定义数据类型的预定义问题的见解。