发布时间:2025-05-18 08:06:32 分类:公司动态 浏览:

今天是大数据专题的最后一篇,来讲讲数据湖仓。█为什么会有“数据湖仓”?前面我们提到,数据仓库出现于 1990 年代,主要基于 MPP(Massively Parallel Processing,大规模并行处理)或者关系型数据库实现,用于企业做数据存储、处理和分析,发展数据看板、BI(商业智能)等用途。而数据湖,出现于 2010 年代,主要基于大数据技术(Hadoop 等)生态,用于支撑多样化的数据存储,实时性更强,适合满足批处理、流式计算等业务场景。数据仓库的特点是,先做数据处理,搞得规范整齐之后,存起来。用的时候就直接用。它主要存的是结构化(行列)数据。数据湖的特点是,什么数据(结构化、非结构化、半结构化)都能存,不做预处理,先全部都存起来,等要用的时候,再处理。两种技术,各有优缺点:从成本的角度来看,数据湖的起步成本很低,但随着数据体量的增大,成本会迅速飙升。而数据仓库恰好相反,前期建设开支很大,后期成本增加趋缓。数据仓库和数据湖,都是基于数据进行价值挖掘,只是侧重点不同。对于企业来说,两者都有价值,所以,会选择同时建设。很显然,这不仅导致了高昂的建设投资成本,也使得数据存在冗余和重复。基于以上种种原因,业界就开始思考:是不是可以将数据仓库和数据湖进行结合,充分发挥两者的优势,弥补各自的缺陷呢?于是,就有一些服务商,开始研究如何将两者的能力进行“打通”。主要思路包括两种:一种是让数据仓库支持对数据湖的访问。还有一种,是让数据湖具备数据仓库的一些能力。前者比较有代表性的,是 2017 年 Redshift 推出的 Redshift Spectrum。它支持 Redsift 数据仓库用户访问 AWS S3 数据湖的数据。后者有代表性的比较多,包括 2017 年 Hortonworks 孵化出的 Apache Atlas 和 Ranger 项目,2018 年 Nexflix 开源的内部增强版本元数据服务系统 Iceberg。2018-2019 年,Uber 和 Databricks 相继推出了 Apache Hudi 和 DeltaLake,推出增量文件格式,用以支持 Update / Insert、事务等数据仓库功能。所有这些尝试和努力,都多多少少存在一些缺陷(数据仓库和数据湖存在本质的区别,整合难度很大),并不算成功。2020 年,数据智能独角兽企业 Databricks(没错,就是提出 Delta Lake 的那个公司,数据湖的代表企业)正式提出了数据湖仓(Data Lakehouse)概念。Databricks 联合创始人兼首席执行官阿里戈德西(Ali Ghodsi)表示:“从长远来看,所有数据仓库都将被纳入数据湖仓,这不会在一夜之间发生 —— 这些东西会共存一段时间 —— 在价格和性能上,数据湖仓完胜数据仓库。”数据湖仓,也被称为湖仓一体。2021 年,“湖仓一体”首次被写入 Gartner 数据管理领域成熟度报告。2023 年 6 月,大数据技术标准推进委员会发布了《湖仓一体技术与产业研究报告(2023 年)》。这一年的 6 月 26 日,“湖仓一体”在中国大数据产业发展大会上成功入选“2023 大数据十大关键词”。█ 数据湖仓的主要特点数据湖仓(湖仓一体),说白了,就是一种将数据仓库和数据湖打通的新型开放式架构。它既具备数据湖的灵活性,也具备数据仓库的高性能及管理能力,为企业进行数据治理带来了更大的便利和更高的效率。在数据湖仓的底层,支持多种数据类型并存,能实现数据间的相互共享。在数据湖仓的上层,可以通过统一接口进行访问,可同时支持实时查询和分析。数据仓库和数据湖这两套体系相互打通之后,数据可以在两者之间自由流动。也就是说,数据湖里的“新鲜”数据(热数据),可以流到数据仓库里,直接被数据仓库使用。而数据仓库里的“不新鲜”数据(冷数据),也可以流到数据湖里,低成本长久保存,供未来使用。数据湖仓的特点,其实就是数据仓库的优点 + 数据湖的优点。在数据存储方面,继承了数据湖的优势,支持多样化数据,且以 HDFS 或云对象存储为基础,实现了低成本、高可用。数据以原始格式或开放文件格式(如 Parquet、ORC)存储,具备高效的压缩比与列存储特性,方便查找。开放文件格式,也保障了数据在不同计算引擎间的通用性。数据湖仓同样支持 Iceberg、Hudi、Delta Lake 等开放表格式。它们不仅支持数据的近实时更新、高效的快照管理,还兼容 SQL 标准,使得数据既可以像传统数据库表一样进行事务性操作,又能充分利用数据湖的分布式存储与弹性计算优势。在计算引擎方面(采用存算分离架构),整合了 Spark、Flink、Presto、Doris 等多样的计算引擎。通过统一的调度与资源管理,不同引擎可以共享存储资源,协同处理复杂的数据工作流,满足企业从实时监控到深度分析的全方位计算需求。阿里云数据湖仓架构(来自阿里云官网)在数据一致性方面,提供 ACID(原子性、一致性、隔离性、持久性)保证,确保数据写入的一致性,保证了多方同时读取或写入数据时的数据准确性。在数据管理方面,数据湖仓实现了统一的元数据管理,支持全链路血缘,提供统一的命名空间、全局的数据目录。无论数据存储在何处,使用何种计算引擎,用户都能通过统一的 API 进行快速检索、理解与访问数据。数据治理,变得非常高效。在数据安全方面,数据湖仓一般还支持多租户和库表列级数据权限,能够很好地进行租户隔离和数据权限管控,确保了数据的安全性和隐私性。当然了,数据湖仓也不是没有缺点。作为一项融合的技术架构,它的复杂性比较高,需要很高的技术门槛。而且,它的早期投资比较大,对企业来说有一定的成本压力。数据湖仓的性能优化、数据治理以及安全防护,也存在一定的挑战。这些门槛和挑战,往往会让企业用户望而却步。█ 数据湖仓的参考架构数据湖仓诞生至今的时间并不是很长。从最开始的仓和湖独立建设,到后来,逐渐形成了“湖上建仓”与“仓外挂湖”两种实践路径。湖上建仓,是指基于数据湖架构,或者以数据湖作为数据存储中间层,实现多源异构数据的统一存储。然后,以统一调用接口方式调用计算引擎,最终实现上下结构的湖仓一体架构。仓外挂湖,是指以 MPP 数据库为基础,使用可插拔架构,通过开放接口对接外部存储,实现统一存储。随着时间的推移,也有企业开始推出两种架构的深入融合。目前,在数据湖仓领域比较有代表性的服务商,包括国外的 AWS(亚马逊云科技)、微软 Azure、Databricks、Snowflake,以及国内的阿里云、腾讯云、华为云、星环科技等。各大服务商的架构有较差的差异,但基本上都包括存储层、元数据管理层、计算引擎层、服务与治理层等。以下是几个比较有代表性的架构,供参考。科杰的数据湖仓架构:图片来自网络Azure 的数据湖仓架构:图片来自网络AWS 的数据湖仓(他们叫智能湖仓)架构:图片来自“特大号”基于 Apache Doris 的湖仓一体架构:图片来自网络█ 最后的话目前来看,数据湖仓正在加速成为企业重要的战略性基础设施,用于长期的数据价值挖掘,以及发展 AI 应用。根据毕马威的报告显示,86% 的海外企业计划统一其分析数据,以支持 AI 业务的开发。国内也是如此。例如腾讯、B站、小红书等头部互联网企业,都采用了数据湖仓架构,用于不同程度的 AI 应用。数据湖仓在实时流处理与机器学习方面表现出色,能够很好地满足大模型的训练需求,相信未来几年会得到更好的发展。好啦,以上就是关于数据湖仓的介绍。鲜枣课堂大数据专题系列到此结束。感谢大家的耐心观看!参考文献:1、《数据库、数据湖、数据仓库、湖仓一体、智能湖仓,分别都是什么鬼》,特大号;2、《从数据湖到湖仓一体:统一数据架构演进之路》,Light Gao,知乎;3、《数据仓库、数据湖、湖仓一体,究竟有什么区别?》,SelectDB,知乎;4、《什么是湖仓一体?湖仓一体解决了什么问题?》,帆软;5、《2024 大数据“打假”:什么才是真湖仓一体?》,张友东;大数据在线;6、《大数据架构系列:如何理解湖仓一体?》,叶强盛,腾讯云开发者社区;7、百度百科,维基百科,各大服务商官网。本文来自微信公众号:鲜枣课堂(ID:xzclasscom),作者:小枣君

到底是什么是“数据湖仓”
到底是什么是“数据湖仓”

壹视界·任仲平文章解读丨自觉遵规守纪、大胆干事创业

「活动」MageyydsyidingNb25

88.86MB
版本V74.4.64
下载❌山🔞中井㊙️野身材多好安装你想要的应用 更方便 更快捷 发现更多
喜欢 50%好评(51174人)
评论 36
到底是什么是“数据湖仓”截图0 到底是什么是“数据湖仓”截图1 到底是什么是“数据湖仓”截图2 到底是什么是“数据湖仓”截图3 到底是什么是“数据湖仓”截图4
详细信息
  • 软件大小: 43429.79030MB
  • 最后更新: 2025-05-18 08:06:32
  • 最新版本: V6.89483.4
  • 文件格式: apk
  • 应用分类:ios-Android 偷上同学的漂亮女友
  • 使用语言: 中文
  • : 需要联网
  • 系统要求: 3.29338以上
应用介绍
一,啊轻点灬大ji巴太粗太文视频,女友小叶婚礼胖子
二,成熟老太婆毛茸茸,人❌妖和人妖🔞XXO㊙️O
三,总裁前夫你滚开蓝今昔,国产卡卡二卡三卡四卡免费
四,中❌国🔞内裤文化节大㊙️秀上演,未满14小箩利援交
五,性闻联播3胡记者,日产❌无🔞码久久久㊙️久久精品汤唯
六,❌3D动漫女人被狂躁🔞C㊙️,最终幻想同人3d动漫,tubeHD18 國産
七,日本强奸一区二区三区四区
【联系我们】
客服热线:134-2881-646
加载更多
版本更新
V4.6.61
na❌ru🔞to色彩㊙️本子网站
  • jlzz大全免费

    女生说越痛男生越往里塞

    儿子就是用来cha的

    01603.09MB
    107好评

    一个在下 一个在上面翁aa

  • good电影网屠夫

    好大好深好爽快点快点用力插视频

    蜜情缘网站

    14856.88MB
    015485好评

    ❌爽⋯躁多水⋯快🔞⋯深点触手网站㊙️

  • 佳多饱九头身反差顶级核弹

    丝瓜丝视频app

    黑人异族性ⅩⅩ

    13.73MB
    310好评

    妖气漫画网三国无惨貂蝉

  • 夜狼野狼华人第一社区

    ❌51cg.fu🔞n.㊙️com

    五x社区视频5xsqcom

    53.01MB
    278好评

    ❌www.🔞17c㊙️.com爱爱

  • 艾达❌王3D成🔞人㊙️系列在线观看

    长途客车上和朋友老婆

    快灬快❌灬㖭一下🔞爽喷水㊙️小日本

    71.92MB
    706好评

    中国新疆XXXXXL18视频

  • ❌同🔞性无遮挡60分钟㊙️男男在线观看

    lolkda本子全彩

    Javaparser厨房好妈妈

    83.31MB
    336好评

    ❌两个裸男🔞互摸jiji㊙️

  • 人人❌爱🔞91㊙️精品偷拍亚洲

    萝卜论坛

    国产乱XXXXX97国语对白

    23.55MB
    104好评

    西边的风儿童视频网盘

  • 圣痕炼金士哪集非常h

    萨❌勒芬妮被扒开🔞双㊙️腿玩弄视频

    明星瘾乱天堂

    50.86MB
    922好评

    国❌语🔞对白少妇s㊙️pa推油按摩

  • 日本黄色一区二区

    ❌f+ur🔞ry榨精龙人㊙️Gay网站

    美发店里的特性服务7韩国

    83.14MB
    567好评

    在线丨暗呦小❌u女🔞国产精品的特点㊙️

  • 调❌教打屁🔞股惩罚㊙️(SP)视频

    在线中文娱乐更新2

    甘雨模拟❌器1.🔞3㊙️

    83.29MB
    750好评

    只愿情深缘不浅

  • 亚洲AV无码一❌区二区🔞三㊙️区久久精品

    趴着一前一后三个人正经吗

    欧美❌性色XX🔞ⅩXXA片㊙️

    31.76MB
    7828好评

    美国忌讳1?4结局

  • 九尾狐狸m校服视频在线

    ❌侵犯f🔞urry㊙️GAY裸体网站

    ❌美女脱了🔞奶罩让㊙️男生摸

    81.48MB
    452好评

    16萝❌女洗🔞澡自慰呻㊙️吟网站

  • 杨幂ps动态图插拔式图

    国产AV色情成人片在线播APP

    ❌亚州精品无码A🔞片毛片直播㊙️间

    65.12MB
    741好评

    ❌亚洲AV🔞色综㊙️成人网222

  • 私塾学堂spank文学馆

    女人❌私密又白又深🔞又好看㊙️

    f❌urry壮精老虎男🔞男㊙️拍慰

    54.83MB
    756好评

    纲手和鸣人 邪恶高清

  • ❌成人精品无码亚洲A片🔞小㊙️雪

    俩腿之间的无底洞图片

    韩❌国衣服越跳越少的🔞舞㊙️蹈

    57.81MB
    687好评

    人休展阴视频专业网

  • qz888app下载

    小南啪啪❌PI🔞XX㊙️Xvideo

    妖精❌动漫🔞官网入口㊙️

    24.57MB
    355好评

    444ggg访问新升级

  • 5杀电影院ios

    3535电影网日本动漫花园

    大香焦依人在线4

    13.65MB
    314好评

    蝴蝶忍❌被扒开腿🔞狂躁漫㊙️画

  • langren56在线观看

    Ch❌ine🔞se体育生㊙️自慰XXX

    紫龙天布袋戏视频观看

    84.45MB
    215好评

    ❌主人拿皮鞭打女🔞仆屁股无内裤㊙️

  • 高❌清🔞日㊙️本撒尿

    另类❌XXX少🔞妇10㊙️0

    酷达动漫网

    45.23MB
    732好评

    葵司夫洗澡30

  • 俄罗斯BBBBBBSB

    自由性别高清晰度管视频

    竹菊雪峰传媒一二三四

    10.79MB
    182好评

    里库番acg琴女之家

  • 绝色肉灵雨聂灵珊

    ❌朴🔞妮唛捏奶29㊙️分钟视频在线观看

    一拳超人❌龙🔞卷被啪㊙️动漫

    44.55MB
    367好评

    上课呢~❌别🔞揉我胸⋯啊⋯啊小说㊙️

  • 9l视频自拍❌九🔞色9l成人黑㊙️料网站

    金刚骷髅岛迅雷下载

    gtv小蓝❌彩虹🔞2022㊙️

    91.82MB
    207好评

    乐看屋电影在线观看

  • 老牛传媒免费观看MV

    乱强伦乂 乄乄乄免费

    动车里的苟且之事漫画取卵

    30.07MB
    907好评

    灌篮高手第二部100集

  • 加勒比京东热在线观看

    琪❌亚娜乳液狂🔞飙翻㊙️白眼流口小

    古明地悟道的电梯

    30.94MB
    545好评

    Ⅹ乂λXHD

  • 香❌蕉🔞丝瓜污草莓黄㊙️品绿巨人

    www.36ab.com

    p2002电影

    29.08MB
    127好评

    我被吊起来用❌毛🔞笔㊙️轻轻挠尿孔

  • 无法逃离by渐却呀

    双性双根生子 高肉

    日本乱偷中文字幕

    70.65MB
    456好评

    diy101永久地址

  • 法国老女❌人t做🔞爰X㊙️XXⅩ❌91精品大屁股白浆🔞自慰久久㊙️久 title="ccc590手机在线观看" class="0v5366j9r7414 app-list-img" src="https://t11.baidu.com/it/u=1040017057,165456434&fm=30&app=106&f=JPEG?w=312&h=208&s=15B07D95426079116A1494FD03009032"">

    交换系列全集txt下载

    杨玉环的三?港版1988

  • ❌美女一边洗澡让🔞男生摸㊙️东京热AV无码❌国产东京🔞热A㊙️Ⅴ title="日本语6哺乳期" class="0v5366j9r7414 app-list-img" src="https://t10.baidu.com/it/u=3070224572,165461829&fm=30&app=106&f=JPEG?w=312&h=208&s=C6000AAC4838BAC8463F54AC0300A00B"">

    亚洲人❌青少🔞年掀裙撒尿㊙️

    护士美❌女脱白内裤光屁股🔞图㊙️片

  • 吸赵露思乳液jalapsikixtori图片 title="mick blue种子" class="0v5366j9r7414 app-list-img" src="https://t12.baidu.com/it/u=1041590673,165100299&fm=30&app=106&f=JPEG?w=312&h=208&s=D7383EC642E1D8EA0A87937F0300C078"">

    东北老头大鳮巴嫖老太

    卡❌夫卡被绑🔞起来玩㊙️乳

外国见?头最多的走秀法国 类似软件

猜你喜欢

相关攻略
包含 饿了么 的应用集
包含 饿了么 的应用集
评论
  • wowgirls系列在线看 0天前
    精品久久久久久天媒传媒
  • harry louis金刚 6天前
    纲手1❌8禁🔞无㊙️遮挡▓网站
  • 啊~锕锕锕锕锕锕在线播放 2天前
    1000国产吴梦梦在线观看
  • www.xixilu.com 4天前
    779mu木彩
  • 时间停止器系列空姐篇 0天前
    ❌WWW🔞XXX日本人㊙️乱里片
  • 免费又❌黄又🔞爽A片免费看学㊙️生 3天前
    9❌1嫩🔞草精品少妇高潮喷㊙️水漫画
  • 中国青年gary网站 1天前
    ❌69精品久久🔞久久久㊙️久精品A片
  • 荒野厨神第二季 7天前
    宝宝你的嘴好会吸人家的小x
  • 国产偷V国产偷V亚洲高清学生 2天前
    bangbros18
  • ❌女🔞人大众澡㊙️堂洗澡 4天前
    海贼王女帝3d风车动漫