发布时间:2025-06-03 23:28:07 分类:公司动态 浏览:

今天是大数据专题的最后一篇,来讲讲数据湖仓。█为什么会有“数据湖仓”?前面我们提到,数据仓库出现于 1990 年代,主要基于 MPP(Massively Parallel Processing,大规模并行处理)或者关系型数据库实现,用于企业做数据存储、处理和分析,发展数据看板、BI(商业智能)等用途。而数据湖,出现于 2010 年代,主要基于大数据技术(Hadoop 等)生态,用于支撑多样化的数据存储,实时性更强,适合满足批处理、流式计算等业务场景。数据仓库的特点是,先做数据处理,搞得规范整齐之后,存起来。用的时候就直接用。它主要存的是结构化(行列)数据。数据湖的特点是,什么数据(结构化、非结构化、半结构化)都能存,不做预处理,先全部都存起来,等要用的时候,再处理。两种技术,各有优缺点:从成本的角度来看,数据湖的起步成本很低,但随着数据体量的增大,成本会迅速飙升。而数据仓库恰好相反,前期建设开支很大,后期成本增加趋缓。数据仓库和数据湖,都是基于数据进行价值挖掘,只是侧重点不同。对于企业来说,两者都有价值,所以,会选择同时建设。很显然,这不仅导致了高昂的建设投资成本,也使得数据存在冗余和重复。基于以上种种原因,业界就开始思考:是不是可以将数据仓库和数据湖进行结合,充分发挥两者的优势,弥补各自的缺陷呢?于是,就有一些服务商,开始研究如何将两者的能力进行“打通”。主要思路包括两种:一种是让数据仓库支持对数据湖的访问。还有一种,是让数据湖具备数据仓库的一些能力。前者比较有代表性的,是 2017 年 Redshift 推出的 Redshift Spectrum。它支持 Redsift 数据仓库用户访问 AWS S3 数据湖的数据。后者有代表性的比较多,包括 2017 年 Hortonworks 孵化出的 Apache Atlas 和 Ranger 项目,2018 年 Nexflix 开源的内部增强版本元数据服务系统 Iceberg。2018-2019 年,Uber 和 Databricks 相继推出了 Apache Hudi 和 DeltaLake,推出增量文件格式,用以支持 Update / Insert、事务等数据仓库功能。所有这些尝试和努力,都多多少少存在一些缺陷(数据仓库和数据湖存在本质的区别,整合难度很大),并不算成功。2020 年,数据智能独角兽企业 Databricks(没错,就是提出 Delta Lake 的那个公司,数据湖的代表企业)正式提出了数据湖仓(Data Lakehouse)概念。Databricks 联合创始人兼首席执行官阿里戈德西(Ali Ghodsi)表示:“从长远来看,所有数据仓库都将被纳入数据湖仓,这不会在一夜之间发生 —— 这些东西会共存一段时间 —— 在价格和性能上,数据湖仓完胜数据仓库。”数据湖仓,也被称为湖仓一体。2021 年,“湖仓一体”首次被写入 Gartner 数据管理领域成熟度报告。2023 年 6 月,大数据技术标准推进委员会发布了《湖仓一体技术与产业研究报告(2023 年)》。这一年的 6 月 26 日,“湖仓一体”在中国大数据产业发展大会上成功入选“2023 大数据十大关键词”。█ 数据湖仓的主要特点数据湖仓(湖仓一体),说白了,就是一种将数据仓库和数据湖打通的新型开放式架构。它既具备数据湖的灵活性,也具备数据仓库的高性能及管理能力,为企业进行数据治理带来了更大的便利和更高的效率。在数据湖仓的底层,支持多种数据类型并存,能实现数据间的相互共享。在数据湖仓的上层,可以通过统一接口进行访问,可同时支持实时查询和分析。数据仓库和数据湖这两套体系相互打通之后,数据可以在两者之间自由流动。也就是说,数据湖里的“新鲜”数据(热数据),可以流到数据仓库里,直接被数据仓库使用。而数据仓库里的“不新鲜”数据(冷数据),也可以流到数据湖里,低成本长久保存,供未来使用。数据湖仓的特点,其实就是数据仓库的优点 + 数据湖的优点。在数据存储方面,继承了数据湖的优势,支持多样化数据,且以 HDFS 或云对象存储为基础,实现了低成本、高可用。数据以原始格式或开放文件格式(如 Parquet、ORC)存储,具备高效的压缩比与列存储特性,方便查找。开放文件格式,也保障了数据在不同计算引擎间的通用性。数据湖仓同样支持 Iceberg、Hudi、Delta Lake 等开放表格式。它们不仅支持数据的近实时更新、高效的快照管理,还兼容 SQL 标准,使得数据既可以像传统数据库表一样进行事务性操作,又能充分利用数据湖的分布式存储与弹性计算优势。在计算引擎方面(采用存算分离架构),整合了 Spark、Flink、Presto、Doris 等多样的计算引擎。通过统一的调度与资源管理,不同引擎可以共享存储资源,协同处理复杂的数据工作流,满足企业从实时监控到深度分析的全方位计算需求。阿里云数据湖仓架构(来自阿里云官网)在数据一致性方面,提供 ACID(原子性、一致性、隔离性、持久性)保证,确保数据写入的一致性,保证了多方同时读取或写入数据时的数据准确性。在数据管理方面,数据湖仓实现了统一的元数据管理,支持全链路血缘,提供统一的命名空间、全局的数据目录。无论数据存储在何处,使用何种计算引擎,用户都能通过统一的 API 进行快速检索、理解与访问数据。数据治理,变得非常高效。在数据安全方面,数据湖仓一般还支持多租户和库表列级数据权限,能够很好地进行租户隔离和数据权限管控,确保了数据的安全性和隐私性。当然了,数据湖仓也不是没有缺点。作为一项融合的技术架构,它的复杂性比较高,需要很高的技术门槛。而且,它的早期投资比较大,对企业来说有一定的成本压力。数据湖仓的性能优化、数据治理以及安全防护,也存在一定的挑战。这些门槛和挑战,往往会让企业用户望而却步。█ 数据湖仓的参考架构数据湖仓诞生至今的时间并不是很长。从最开始的仓和湖独立建设,到后来,逐渐形成了“湖上建仓”与“仓外挂湖”两种实践路径。湖上建仓,是指基于数据湖架构,或者以数据湖作为数据存储中间层,实现多源异构数据的统一存储。然后,以统一调用接口方式调用计算引擎,最终实现上下结构的湖仓一体架构。仓外挂湖,是指以 MPP 数据库为基础,使用可插拔架构,通过开放接口对接外部存储,实现统一存储。随着时间的推移,也有企业开始推出两种架构的深入融合。目前,在数据湖仓领域比较有代表性的服务商,包括国外的 AWS(亚马逊云科技)、微软 Azure、Databricks、Snowflake,以及国内的阿里云、腾讯云、华为云、星环科技等。各大服务商的架构有较差的差异,但基本上都包括存储层、元数据管理层、计算引擎层、服务与治理层等。以下是几个比较有代表性的架构,供参考。科杰的数据湖仓架构:图片来自网络Azure 的数据湖仓架构:图片来自网络AWS 的数据湖仓(他们叫智能湖仓)架构:图片来自“特大号”基于 Apache Doris 的湖仓一体架构:图片来自网络█ 最后的话目前来看,数据湖仓正在加速成为企业重要的战略性基础设施,用于长期的数据价值挖掘,以及发展 AI 应用。根据毕马威的报告显示,86% 的海外企业计划统一其分析数据,以支持 AI 业务的开发。国内也是如此。例如腾讯、B站、小红书等头部互联网企业,都采用了数据湖仓架构,用于不同程度的 AI 应用。数据湖仓在实时流处理与机器学习方面表现出色,能够很好地满足大模型的训练需求,相信未来几年会得到更好的发展。好啦,以上就是关于数据湖仓的介绍。鲜枣课堂大数据专题系列到此结束。感谢大家的耐心观看!参考文献:1、《数据库、数据湖、数据仓库、湖仓一体、智能湖仓,分别都是什么鬼》,特大号;2、《从数据湖到湖仓一体:统一数据架构演进之路》,Light Gao,知乎;3、《数据仓库、数据湖、湖仓一体,究竟有什么区别?》,SelectDB,知乎;4、《什么是湖仓一体?湖仓一体解决了什么问题?》,帆软;5、《2024 大数据“打假”:什么才是真湖仓一体?》,张友东;大数据在线;6、《大数据架构系列:如何理解湖仓一体?》,叶强盛,腾讯云开发者社区;7、百度百科,维基百科,各大服务商官网。本文来自微信公众号:鲜枣课堂(ID:xzclasscom),作者:小枣君

到底是什么是“数据湖仓”
到底是什么是“数据湖仓”

美媒:美政府征收对等关税将导致美国经济衰退、通胀大幅上升

「活动」MageyydsyidingNb25

48.24MB
版本V97.5.31
下载欧美丰满熟妇❌❌❌❌69安装你想要的应用 更方便 更快捷 发现更多
喜欢 10%好评(58204人)
评论 84
到底是什么是“数据湖仓”截图0 到底是什么是“数据湖仓”截图1 到底是什么是“数据湖仓”截图2 到底是什么是“数据湖仓”截图3 到底是什么是“数据湖仓”截图4
详细信息
  • 软件大小: 89095.47762MB
  • 最后更新: 2025-06-03 23:28:07
  • 最新版本: V5.37482.6
  • 文件格式: apk
  • 应用分类:ios-Android 卡芙❌卡开襟泳🔞衣旗袍壁㊙️纸
  • 使用语言: 中文
  • : 需要联网
  • 系统要求: 2.01050以上
应用介绍
一,❌总裁张开腿自慰肉耽高🔞H㊙️甜宠,Jennie裸被❌
二,❌河马的🔞秘密㊙️闭眼识人翔霖,白美女➕光屁屁无遮挡下载
三,❌张真源的脖子被🔞铁链锁㊙️了二年话本,罗宾隐私㊙️黄www网站
四,日向雏田❌白🔞无垢虎㊙️口夹,❌原炀顾青裴同人主🔞页㊙️的微博互动
五,国产欧美❌va欧美🔞va在㊙️线观看,将❌军当众🔞被扒开腿任人玩弄㊙️小说
六,18❌禁英雄🔞联盟本㊙️子污,蔚x凯❌瑟琳同人r1🔞8㊙️,跪 晨尿 含❌ 主人🔞 夹 便器㊙️
七,❌日🔞韩女同互吞口㊙️水舌吻
【联系我们】
客服热线:134-2881-646
加载更多
版本更新
V0.8.63
爆❌洗澡❌白丝❌
  • 蝴蝶忍被❌吸乳脱内内漫画

    ❌男女T🔞XXX㊙️X

    ❌崩坏三肉奴🔞色情㊙️文

    51557.22MB
    103好评

    哪个品种的❌苹🔞果是面的㊙️

  • 暗影刺客柒❌把梅花十三睡了🔞的小说㊙️

    男人爱你的生理反❌应的表🔞现㊙️

    午夜免费❌看🔞一级AAA㊙️片

    68213.11MB
    541723好评

    第五人格拉❌拉队员🔞r18㊙️

  • ∪c❌浏览器1🔞2,0,2,982㊙️下载

    二次❌元小黃片视🔞频㊙️

    DeepS❌eekR🔞1服㊙️务恢复

    13.73MB
    319好评

    雷电将军同人18❌AV黄漫

  • 四❌糸🔞乃H全彩熟肉本㊙️子无码

    o❌o08cc🔞红桃视㊙️频

    日向花❌火同人🔞h㊙️

    53.64MB
    274好评

    老师隔❌着内裤揉🔞搓出㊙️水了

  • n×3❌n等于🔞多少㊙️

    人的❌水门🔞视频㊙️

    💋XXXx36💋HD女

    71.56MB
    709好评

    星❌穹铁道镜流被绑十字🔞架图㊙️片

  • ❌51网站在线观🔞看免㊙️费播放直播足球

    胶带封❌住🔞嘴巴视频㊙️

    男男佐鸣18❌AV黄漫

    83.76MB
    335好评

    动漫美女❌打🔞扑克a㊙️pp

  • ❌亚洲🔞国产㊙️成人小说

    失禁❌老年男🔞女用纸㊙️尿裤

    抚❌子🔞静香㊙️

    23.51MB
    107好评

    亚洲人❌小便掀🔞裙TV㊙️

  • 初音未❌来🔞掀裙㊙️子

    泰国捏❌胸🔞露两个奶头㊙️

    unity18 游❌戏🔞18 ㊙️(免费)

    50.91MB
    922好评

    狠狠狠AⅤ无码❌精品专🔞区㊙️

  • ❌藕饼🔞纯肉H文㊙️

    男被爆❌羞羞视频动漫APP

    官方❌承认🔞萨㊙️菲罗斯喜欢克劳德

    83.34MB
    563好评

    Japan ❌Tokyo Hot🔞 ㊙️AV pics

  • ❌周生🔞辰从后面折㊙️腾时宜续写

    ❌ZxX🔞IX㊙️

    博❌人tk挠雏🔞田脚㊙️心

    83.53MB
    752好评

    育儿❌视🔞频素㊙️材

  • 双男主❌刺激战场🔞视㊙️频

    原神裸体㊙️网站Free

    玉女心经2阴阳和❌合🔞李丽㊙️珍

    86.96MB
    8306好评

    ❌人妻少妇🔞看A片偷人精品网㊙️站

  • 巜隔壁的人妻❌2🔞伦丰满㊙️

    病❌娇🔞X你㊙️r18车文

    ❌原神甘🔞雨㊙️被旅行者C出乳液

    28.60MB
    665好评

    极❌品丰满少妇-🔞ThePor㊙️n

  • 你❌若一直在🔞,我便一直爱图片㊙️情侣

    图❌书馆的各🔞种书变成㊙️人

    雏❌田🔞和㊙️雷影

    65.90MB
    741好评

    【❌公钟】Ep作🔞者红㊙️茶雪糕

  • 日本白嫩㊙️光屁屁视频

    ❌魔盒🔞在线看免费㊙️观看

    扒开小舞❌狂揉❌难受3G

    54.87MB
    758好评

    ❌蜘蛛🔞格温被章㊙️鱼博士侍绑

  • 好深好❌湿好硬顶到了男🔞男㊙️

    ❌让🔞人爽到湿的㊙️小黄书漫画

    ❌芙宁娜乱婬h🔞侵犯H㊙️文

    57.73MB
    684好评

    遮天❌姚曦裸奶照🔞无遮挡网站㊙️

  • 鬼灭❌之刃在🔞线观㊙️看樱花动漫

    強❌J爆乳女🔞教师漫画羞㊙️羞小说

    TickleA❌buse🔞皮皮酱㊙️ 爱挠痒的 Vk

    24.55MB
    350好评

    裸身❌❌漫画

  • 女奥特曼被❌到爽羞羞

    ❌❌❌❌学生XXXX69动漫

    精❌灵🔞旅社梅㊙️菲斯全身照

    13.10MB
    313好评

    ❌韩国金秀贤穿🔞透㊙️明泳衣

  • 玖辛奈被下春药❌到爽

    ❌梦见🔞月瑞希美㊙️图泳装

    情爱❌下坠漫画🔞免费㊙️完整版

    84.62MB
    210好评

    水门与玖❌辛奈初🔞次相㊙️遇是哪一集

  • 火影忍者黑土被❌无遮网站

    妖狐❌x仆🔞ss车㊙️文

    人与另类z0z❌xhd鲁交

    45.14MB
    737好评

    静香被大雄强❌️污污污

  • w❌ww.污火🔞影㊙️忍者

    ac❌f🔞un直㊙️播伴侣怎么用

    揉我❌奶头⋯🔞啊⋯嗯摸㊙️硬了视频

    10.92MB
    185好评

    恶作剧❌~动🔞漫㊙️

  • 暑❌假调🔞教我的㊙️妺妺H肉奴文章

    男人把女人按在地❌上🔞摩擦㊙️

    美女儿病10❌大🔞征㊙️兆

    44.02MB
    362好评

    女性扒开👙看个够挠痒作文

  • 奈❌布被🔞杰克淦出白色液体㊙️

    异世❌界默示🔞录米诺戈㊙️拉

    德凯奥特曼的❌剧情🔞简㊙️介

    91.15MB
    202好评

    毛❌利🔞兰h㊙️黄污本子

  • 51❌吃瓜-🔞【每㊙️日精选】萌白酱

    妃子露出两❌个奶球🔞让皇㊙️帝吃奶头

    火❌影忍者🔞漫画完整㊙️版

    30.55MB
    901好评

    黄❌鳝门无码完整在🔞线观看㊙️

  • ❌东京🔞热com.涩里番㊙️

    麻酥酥91⭕️自慰白浆

    桃桃漫画-歪歪❌d🔞ong㊙️

    30.52MB
    549好评

    13裸男体㊙️无遮挡男同

  • 南❌宫问🔞天被C到㊙️翻白眼

    体育❌生男浴室🔞洗澡Gay㊙️2022

    远坂凛❌被🔞c㊙️

    29.12MB
    129好评

    ありがとうござ❌います🔞的答㊙️句

  • ❌卡齐娜c🔞v静宸㊙️

    欧美自慰solo❌ v🔞i㊙️deo

    陈钰琪❌惊艳🔞写真图片㊙️

    70.84MB
    456好评

    徘色❌回响🔞反和谐图片㊙️

  • 小舞和唐❌三全🔞肉㊙️H文3D蒂法被❌AV免费观看下载 title="Wifelove❌sbbc🔞b㊙️t" class="0v5366j9r7414 app-list-img" src="https://t11.baidu.com/it/u=1040017057,165456434&fm=30&app=106&f=JPEG?w=312&h=208&s=15B07D95426079116A1494FD03009032"">

    ❌守望🔞先锋百合女猎手㊙️

    ㊙️秘密入口导航宅男

  • 催眠控制玩弄壮❌汉警🔞察㊙️女仆扒开🍑跪着给客人玩91 title="《❌现爱》完🔞整版㊙️在线观看" class="0v5366j9r7414 app-list-img" src="https://t10.baidu.com/it/u=3070224572,165461829&fm=30&app=106&f=JPEG?w=312&h=208&s=C6000AAC4838BAC8463F54AC0300A00B"">

    ❌别c我⋯啊⋯🔞嗯上课呢肖战㊙️

    男男GaYGAYS✅亚洲体育生

  • BJ❌圓🔞摩㊙️托车舞mm131王雨纯被❌喷水17c title="丝袜小❌舞🔞婬美足美脚㊙️" class="0v5366j9r7414 app-list-img" src="https://t12.baidu.com/it/u=1041590673,165100299&fm=30&app=106&f=JPEG?w=312&h=208&s=D7383EC642E1D8EA0A87937F0300C078"">

    桜井宁宁脱了❌内裤求🔞被㊙️c图片

    日本❌sm羞🔞辱捆绑调教视频㊙️

❌欧美自拍🔞中㊙️文另类 类似软件

猜你喜欢

相关攻略
包含 饿了么 的应用集
评论
  • 绅士风度❌永久🔞地㊙️址 9天前
    老中医SPA在❌线观看完整🔞版㊙️免费
  • Stabilit❌y AI推出3D🔞模型㊙️ 3天前
    s❌ilk0🔞36温泉无删减㊙️版
  • ❌仆🔞芙㊙️肉车污文 1天前
    王雨❌纯超大尺度福利🔞在线视频㊙️
  • 男❌主超帅🔞的A㊙️V片 9天前
    妲己爆乳被❌🔞🔞㊙️
  • ❌美国斯🔞嘉丽约翰逊裸体软件㊙️大全 5天前
    ❌不受🔞限制㊙️的聊天软件有哪些
  • sadi❌nd🔞riya电动按摩㊙️ 7天前
    ❌酒店🔞偷拍大学㊙️情侣在线
  • 静香被爆❌视频在线观看 9天前
    成人A片🔞亚洲葡京网
  • ❌futa扶🔞她np高H调教s㊙️m 4天前
    性fr❌ee 🔞XX㊙️X video HD
  • 体育生白袜自❌慰出精🔞Ga㊙️y 5天前
    ❌鬼🔞灭之刃蝴蝶㊙️忍被x漫
  • 云曦被❌❌爆乳无尽动漫 0天前
    ❌小舞死🔞了唐三又㊙️嫁给了