首页

星云

工具

资源

星选

资讯

热门工具

自选颜色:

PDF转图片完全免费

小红书视频下载无水印

抖音视频下载无水印

数字星空

图书《数据资产管理核心技术与应用》分享

编程知识

2024年08月02日 12:59

《数据资产管理核心技术与应用》是由清华大学出版社出版的一本图书，该图书主要特点如下：

1、依托于大数据技术，独家解密数据血缘的底层技术实现

2、详解数据资产管理的知识体系和核心技术

3、应用元数据管理和数据建模技术，充分发挥出数据资产的更大潜力和价值。

4、全书从元数据、数据血缘、数据质量、数据服务、数据监控、数据建模、数据架构等多个维度来剖析大数据资产管理的核心技术与应用。

5、全书配套了PPT课件以及作者微信答疑服务

核心章节介绍如下：全书依托于大数据技术，独家解密数据血缘的底层技术实现

通常来说，数据血缘的来源可以包括数据源自身、数据处理的任务、数据任务的编排系统等。

数据源自身：比如像Hive，由于其本身就是支持通过HQL做数据处理的，所以其本身就可以通过数据处理的过程来分析从而获取血缘。
数据处理的任务：这点很容易理解，因为不管是实时任务还是离线任务，都会涉及到数据逻辑的处理，从数据任务的底层实现技术上来说，不管是Hadoop的Map-Reduce 任务还是Spark任务还是Flink任务，本质也都是在做数据的转换处理，有数据的转换，就可能会有数据血缘的变化。
数据任务的编排系统：这点也很容易理解，如下图3-1-1所示，在任务编排时，可能会将很多不同的任务节点按照依赖顺序串联起来。前一个任务节点的数据输出会是下一个任务节点的数据输入，所以肯定也会产生数据的转换，就肯定也会存在血缘。

重点介绍了数据血缘的底层技术实现，包括：

如何从Hive中获取数据血缘
从Spark 执行计划中获取数据血缘
从Spark SQL语句中获取数据血缘
从Flink中获取数据血缘
从数据任务的编排系统中获取数

From:https://www.cnblogs.com/laoqing/p/18338631

本文地址: http://shuzixingkong.net/article/702

0评论

提交

加载更多评论

其他文章

园子的困境：技术社区的自我革新之路

在技术社区的快速变革中，园子似乎未能跟上时代的步伐。从.NET on Linux的尝试到对博客时代的执着，园子的决策似乎总是与市场趋势背道而驰。面对微信订阅号的崛起和移动流量的流失，园子显得反应迟缓，错失了转型的黄金时期。园子在用户定位上的模糊不清，导致了产品策略的摇摆不定。开发者需要的是一个能够

硬件开发笔记（二十九）：TPS54331电源设计（二）：12V转3.3V和12V转4V原理图设计

前言电源供电电路设计很重要，为了更好的给对硬件设计有需求的人，特意将电源设计的基础过程描述出来。紧接前一篇12V转5V的，本篇设计常用的12V转3.3V电路，不常用的12V转4V电路。 12V转3.3V电路步骤一：应用典型电路（依据底板和典型电路得差别，电感和电容在3.3~5V范围内，我们可

硬件开发笔记（二十九）：TPS54331电源设计（二）：12V转3.3V和12V转4V原理图设计

硬件开发笔记（二十九）：TPS54331电源设计（二）：12V转3.3V和12V转4V原理图设计

硬件开发笔记（二十九）：TPS54331电源设计（二）：12V转3.3V和12V转4V原理图设计

EF Core性能优化技巧

代码层面的优化 1. 使用实例池 EFCore2.0 为DbContext引入新的注册方式：透明地注册了 DbContext实例池，使用这种方式可以避免始终创建新的实例，EF Core 将重置其状态并将其存储在内部池中；当下次请求新的实例时，将返回该共用实例，而不是设置新的实例使用示例： serv

.NET 8 通用权限框架前后端分离，开箱即用

前言推荐一个基于.NET 8 实现的通用权限开发框架Admin.NET，前端使用Vue3/Element-plus开发。基于.NET 8(Furion)/SqlSugar实现的通用管理平台。整合最新技术，模块插件式开发，前后端分离，开箱即用。集成多租户、缓存、数据校验、鉴权、事件总线、动态A

.NET 8 通用权限框架前后端分离，开箱即用

.NET 8 通用权限框架前后端分离，开箱即用

.NET 8 通用权限框架前后端分离，开箱即用

07 输入捕获和编码器接口

前言前面介绍了定时器和输出比较，这一节主要介绍一下输入捕获测量输入频率和PWM占空比，然后介绍一下编码器接口。一、输入捕获 1.什么是输入捕获当输入的引脚有指定电平跳变时，会将计数器CNT中的值保存在CCR中，这个就称为输入捕获。 2.输入捕获测频率我们可以通过获取输入的值来测量频率，这里有

07 输入捕获和编码器接口

07 输入捕获和编码器接口

07 输入捕获和编码器接口

PixiJS源码分析系列：第四章响应 Pointer 交互事件(上篇)

响应 Pointer 交互事件(上篇) 上一章我们分析了 sprite 在 canvasRenderer 上的渲染，那么接下来得看看交互上最重要的事件系统了最简单的 demo 还是用一个最简单的 demo 演示 example/sprite-pointerdown.html 为 sprite 添加

PixiJS源码分析系列：第四章响应 Pointer 交互事件(上篇)

PixiJS源码分析系列：第四章响应 Pointer 交互事件(上篇)

PixiJS源码分析系列：第四章响应 Pointer 交互事件(上篇)

使用Cython调用CUDA Kernel函数

从Python接口调用GPU进行加速的方案有很多，包括Cupy和PyCuda以及之前介绍过的Numba，还可以使用MindSpore、PyTorch和Jax等成熟的深度学习框架，这里介绍了一种直接写CUDA Kernel函数的方案。为了能够做到CUDA-C和Python编程的分离，这里引入了Cyth

Apache COC闪电演讲总结【OSGraph】

与一般的演讲不同，lightning talk主打一个字就是“快”，如何在5min内给听众表达清楚你的观点，就很具挑战性了，整个一开源版的“电梯一分钟”。

Apache COC闪电演讲总结【OSGraph】

Apache COC闪电演讲总结【OSGraph】

Apache COC闪电演讲总结【OSGraph】