首页 星云 工具 资源 星选 资讯 热门工具
:

PDF转图片 完全免费 小红书视频下载 无水印 抖音视频下载 无水印 数字星空

图书《数据资产管理核心技术与应用》分享

编程知识
2024年08月02日 12:59

《数据资产管理核心技术与应用》是由清华大学出版社出版的一本图书,该图书主要特点如下:

1、依托于大数据技术,独家解密数据血缘的底层技术实现

2、详解数据资产管理的知识体系和核心技术

3、应用元数据管理和数据建模技术,充分发挥出数据资产的更大潜力和价值。

4、全书从元数据、数据血缘、数据质量、数据服务、数据监控、数据建模、数据架构等多个维度来剖析大数据资产管理的核心技术与应用。

5、全书配套了PPT课件以及作者微信答疑服务

核心章节介绍如下:全书依托于大数据技术,独家解密数据血缘的底层技术实现

通常来说,数据血缘的来源可以包括数据源自身、数据处理的任务、数据任务的编排系统等。

  • 数据源自身:比如像Hive,由于其本身就是支持通过HQL做数据处理的,所以其本身就可以通过数据处理的过程来分析从而获取血缘。
  • 数据处理的任务:这点很容易理解,因为不管是实时任务还是离线任务,都会涉及到数据逻辑的处理,从数据任务的底层实现技术上来说,不管是Hadoop的Map-Reduce 任务还是Spark任务还是Flink任务,本质也都是在做数据的转换处理,有数据的转换,就可能会有数据血缘的变化。
  • 数据任务的编排系统:这点也很容易理解,如下图3-1-1所示,在任务编排时,可能会将很多不同的任务节点按照依赖顺序串联起来。前一个任务节点的数据输出会是下一个任务节点的数据输入,所以肯定也会产生数据的转换,就肯定也会存在血缘。

  • 重点介绍了数据血缘的底层技术实现,包括:
  1. 如何从Hive中获取数据血缘
  2. 从Spark 执行计划中获取数据血缘
  3. 从Spark  SQL语句中获取数据血缘
  4. 从Flink中获取数据血缘
  5. 从数据任务的编排系统中获取数

 

 

 

 

 

From:https://www.cnblogs.com/laoqing/p/18338631
本文地址: http://www.shuzixingkong.net/article/702
0评论
提交 加载更多评论
其他文章 园子的困境:技术社区的自我革新之路
在技术社区的快速变革中,园子似乎未能跟上时代的步伐。从.NET on Linux的尝试到对博客时代的执着,园子的决策似乎总是与市场趋势背道而驰。面对微信订阅号的崛起和移动流量的流失,园子显得反应迟缓,错失了转型的黄金时期。 园子在用户定位上的模糊不清,导致了产品策略的摇摆不定。开发者需要的是一个能够
硬件开发笔记(二十九):TPS54331电源设计(二):12V转3.3V和12V转4V原理图设计
前言 电源供电电路设计很重要,为了更好的给对硬件设计有需求的人,特意将电源设计的基础过程描述出来。 紧接前一篇12V转5V的,本篇设计常用的12V转3.3V电路,不常用的12V转4V电路。 12V转3.3V电路 步骤一:应用典型电路 (依据底板和典型电路得差别,电感和电容在3.3~5V范围内,我们可
硬件开发笔记(二十九):TPS54331电源设计(二):12V转3.3V和12V转4V原理图设计 硬件开发笔记(二十九):TPS54331电源设计(二):12V转3.3V和12V转4V原理图设计 硬件开发笔记(二十九):TPS54331电源设计(二):12V转3.3V和12V转4V原理图设计
EF Core性能优化技巧
代码层面的优化 1. 使用实例池 EFCore2.0 为DbContext引入新的注册方式:透明地注册了 DbContext实例池,使用这种方式可以避免始终创建新的实例,EF Core 将重置其状态并将其存储在内部池中;当下次请求新的实例时,将返回该共用实例,而不是设置新的实例 使用示例: serv
.NET 8 通用权限框架 前后端分离,开箱即用
前言​ 推荐一个基于.NET 8 实现的通用权限开发框架Admin.NET,前端使用Vue3/Element-plus开发。 基于.NET 8(Furion)/SqlSugar实现的通用管理平台。整合最新技术,模块插件式开发,前后端分离,开箱即用。 集成多租户、缓存、数据校验、鉴权、事件总线、动态A
.NET 8 通用权限框架 前后端分离,开箱即用 .NET 8 通用权限框架 前后端分离,开箱即用 .NET 8 通用权限框架 前后端分离,开箱即用
07 输入捕获和编码器接口
前言 前面介绍了定时器和输出比较,这一节主要介绍一下输入捕获测量输入频率和PWM占空比,然后介绍一下编码器接口。 一、输入捕获 1.什么是输入捕获 当输入的引脚有指定电平跳变时,会将计数器CNT中的值保存在CCR中,这个就称为输入捕获。 2.输入捕获测频率 我们可以通过获取输入的值来测量频率,这里有
07 输入捕获和编码器接口 07 输入捕获和编码器接口 07 输入捕获和编码器接口
PixiJS源码分析系列:第四章 响应 Pointer 交互事件(上篇)
响应 Pointer 交互事件(上篇) 上一章我们分析了 sprite 在 canvasRenderer 上的渲染,那么接下来得看看交互上最重要的事件系统了 最简单的 demo 还是用一个最简单的 demo 演示 example/sprite-pointerdown.html 为 sprite 添加
PixiJS源码分析系列:第四章 响应 Pointer 交互事件(上篇) PixiJS源码分析系列:第四章 响应 Pointer 交互事件(上篇) PixiJS源码分析系列:第四章 响应 Pointer 交互事件(上篇)
使用Cython调用CUDA Kernel函数
从Python接口调用GPU进行加速的方案有很多,包括Cupy和PyCuda以及之前介绍过的Numba,还可以使用MindSpore、PyTorch和Jax等成熟的深度学习框架,这里介绍了一种直接写CUDA Kernel函数的方案。为了能够做到CUDA-C和Python编程的分离,这里引入了Cyth
Apache COC闪电演讲总结【OSGraph】
与一般的演讲不同,lightning talk主打一个字就是“快”,如何在5min内给听众表达清楚你的观点,就很具挑战性了,整个一开源版的“电梯一分钟”。
Apache COC闪电演讲总结【OSGraph】 Apache COC闪电演讲总结【OSGraph】 Apache COC闪电演讲总结【OSGraph】