首页 星云 工具 资源 星选 资讯 热门工具
:

PDF转图片 完全免费 小红书视频下载 无水印 抖音视频下载 无水印 数字星空

Apache COC闪电演讲总结【OSGraph】

编程知识
2024年08月02日 14:54

 

精彩回顾 | CommunityOverCode Asia 2024 在杭圆满收官

闪电演讲主题:《OSGraph:以图谱思维重新思考开源数据》

 

大家能看到我最近一直在折腾与OSGraph这个产品相关的事情,之前在文章《妙用OSGraph:发掘GitHub知识图谱上的开源故事》中向大家阐述过这个产品的设计理念和应用价值。比方说以下问题就可以在OSGraph上找到明确的答案。

 

从技术角度说,我们是用GitHub开放数据结合图技术(TuGraph)解答了上述问题。而在产品的未来规划中,除了功能性的建设之外,还有一个很重要的一个方向就是更丰富的底层图谱数据,而不仅限于当下的GitHub数据。

 

当然,最典型的莫过于论文数据,这个我也在文章《论文图谱当如是:Awesome-Graphs用200篇图系统论文打个样》表述过这部分数据的价值。为此,确实花了不少力气手动整理了图计算系统15年来的论文图谱。200多篇论文加班加点地逐个翻下来,真的会手指发抖,血压升高……

 

所幸的是,这些付出并未白费。用Awesome-Graphs这个项目,不仅对图计算系统论文做了收录整理,还可以很清楚地描述未来OSGraph上论文图谱的产品形态,同时还可以为每个论文生成一份独一无二的血缘名片,既而带出最近更新的图计算系统论文解读文:

  1. 《我用Awesome-Graphs看论文:解读Pregel》
  2. 《我用Awesome-Graphs看论文:解读PowerGraph》
  3. 《我用Awesome-Graphs看论文:解读X-Stream》
  4. 《我用Awesome-Graphs看论文:解读Naiad》
  5. 《我用Awesome-Graphs看论文:解读GraphBolt》

 

更意外的是,OSPO的边sir突然找来希望可以在月底的Apache COC上做一个OSGraph主题的lightning talk(闪电演讲)。当时我就在想,既然要讲OSGraph,这块内容不刚好可以加点料么

与一般的演讲不同,lightning talk主打一个字就是“快”,整个演讲过程只有5min,并且会严格计时。所以,如何在5min内给听众表达清楚你的观点,就很具挑战性了,整个一开源版的“电梯一分钟”。做开源布道这么久以来,演讲没少搞,但带这种特殊要求的还真没搞过,我的“胜负欲”上来了,那不得挑战一下自己么!

 

玩归玩,闹归闹,认真对待肯定少不了。既然要在5min讲清楚一个完整的故事,那演讲思路必须要清晰。

 

 

首先,就是演讲主题要吸睛?OSGraph一直以来的官方的表述是:“一个开源图谱关系洞察工具”,说实话确实太官方、太技术了。为了让主题更鲜明,最终确定了演讲主题是:“像图一样重新思考开源数据”。修改后相比前者会更容易引导听众的好奇心:怎么重新思考的?像图一样应该是什么样?

 

其次,就是立意要鲜明。就是想输出什么理念,传递什么价值观?说白了,就是勾起用户好奇心的问题,能不能通过你的立意得到解决。这里跳过思考的路径,直接抛出结论:“我们认为2跳图特征可以作为描述图分析的基本单位,或者叫图分析的第一性原理”。

 

听起来有点悬,看一下ppt图就明白了。熟悉OSGraph产品功能的同学,一眼就能看出来,不管是开发者贡献、开源协作、项目社区、开发兴趣等图谱,都可以拆解为2跳图特征去表述。甚至多跳的图特征最终也可以通过多步拆解表述为2跳图特征的组合。

 

有了2跳图特征的假设,既而推导出现有的图谱渲染逻辑,从而校验了这个假设的正确性。这也就回应了听众的“怎么用图重新思考”这个问题。

 

然后,就是例证有趣。光有严谨的推导逻辑,还不足以打动听众,结合生动有趣的例子,会让立意的观点更加深刻令人信服。

 

最后,肯定是展望,也就是“画大饼”环节。这时候,Awesome-Graphs的工作也就派上了用场。

 

当然,要保证严格的时间控制,一定要做充分预演。前面的slides内容准备完成后,我发现足足有19页,瞬间汗就下来了。简单计算一下,平均每页演讲时间不能超过5 * 60 / 19 = 15.8s,基本上也就2~3句话的时间。这部分就没有捷径了,只能不断retry,最终我这part的lightning talk结束后,用时4'45s,和我自己排练的用时基本一致(Richard Lin看到我在最后1min时偷瞄了一下计时器,连倒计时提醒都省了)。全程体验完lightning talk,从看别人讲到自己上,简单描述就是:别开生面、紧张刺激、好玩有趣!

 

最后的最后,谈一下产品的用户反馈。大会期间,我先后给Paul King(Apache Groovy VP)、Dirk-Willem(ASF VP)、Tison等社区朋友当面演示了OSGraph的产品功能,获得了一致的好评,尤其是海外人士都表示这是一件很酷的事情。lightning talk结束后,也陆陆续续听到不少用户认可的反馈,感觉过去所做的一切都是值得的!

7月份的事情暂时收尾了,感谢所有参与到OSGraph项目中的同学、感谢OSPO、感谢社区伙伴,也要感谢一直在路上的自己!

 

 

From:https://www.cnblogs.com/fanzhidongyzby/p/18338943/coc2024
本文地址: http://shuzixingkong.net/article/706
0评论
提交 加载更多评论
其他文章 使用Cython调用CUDA Kernel函数
从Python接口调用GPU进行加速的方案有很多,包括Cupy和PyCuda以及之前介绍过的Numba,还可以使用MindSpore、PyTorch和Jax等成熟的深度学习框架,这里介绍了一种直接写CUDA Kernel函数的方案。为了能够做到CUDA-C和Python编程的分离,这里引入了Cyth
PixiJS源码分析系列:第四章 响应 Pointer 交互事件(上篇)
响应 Pointer 交互事件(上篇) 上一章我们分析了 sprite 在 canvasRenderer 上的渲染,那么接下来得看看交互上最重要的事件系统了 最简单的 demo 还是用一个最简单的 demo 演示 example/sprite-pointerdown.html 为 sprite 添加
PixiJS源码分析系列:第四章 响应 Pointer 交互事件(上篇) PixiJS源码分析系列:第四章 响应 Pointer 交互事件(上篇) PixiJS源码分析系列:第四章 响应 Pointer 交互事件(上篇)
07 输入捕获和编码器接口
前言 前面介绍了定时器和输出比较,这一节主要介绍一下输入捕获测量输入频率和PWM占空比,然后介绍一下编码器接口。 一、输入捕获 1.什么是输入捕获 当输入的引脚有指定电平跳变时,会将计数器CNT中的值保存在CCR中,这个就称为输入捕获。 2.输入捕获测频率 我们可以通过获取输入的值来测量频率,这里有
07 输入捕获和编码器接口 07 输入捕获和编码器接口 07 输入捕获和编码器接口
图书《数据资产管理核心技术与应用》分享
《数据资产管理核心技术与应用》是由清华大学出版社出版的一本图书,该图书主要特点如下: 1、依托于大数据技术,独家解密数据血缘的底层技术实现 2、详解数据资产管理的知识体系和核心技术 3、应用元数据管理和数据建模技术,充分发挥出数据资产的更大潜力和价值。 4、全书从元数据、数据血缘、数据质量、数据服务
图书《数据资产管理核心技术与应用》分享 图书《数据资产管理核心技术与应用》分享 图书《数据资产管理核心技术与应用》分享
无缝融入,即刻智能[1]:MaxKB知识库问答系统,零编码嵌入第三方业务系统,定制专属智能方案,用户满意度飙升
无缝融入,即刻智能[1]:MaxKB知识库问答系统,零编码嵌入第三方业务系统,定制专属智能方案,用户满意度飙升
无缝融入,即刻智能[1]:MaxKB知识库问答系统,零编码嵌入第三方业务系统,定制专属智能方案,用户满意度飙升 无缝融入,即刻智能[1]:MaxKB知识库问答系统,零编码嵌入第三方业务系统,定制专属智能方案,用户满意度飙升 无缝融入,即刻智能[1]:MaxKB知识库问答系统,零编码嵌入第三方业务系统,定制专属智能方案,用户满意度飙升
stable diffusion 实践与测试
stable diffusion 实践与测试 放大 原图高清放大 原始图片 当不满意图片质量的时候 使用stable diffusion进行二次处理 选择适合图片风格的模型,再次根据图片写出提示词 输入原图像1024尺寸之后调整重绘幅度 采样器automatic在这里会选择karras 原图异变放大
stable diffusion 实践与测试 stable diffusion 实践与测试 stable diffusion 实践与测试
图书《数据资产管理核心技术与应用》核心章节节选-3.1.2. 从Spark 执行计划中获取数据血缘
本文节选自清华大学出版社出版的图书《数据资产管理核心技术与应用》,作者为张永清等著。 从Spark 执行计划中获取数据血缘 因为数据处理任务会涉及到数据的转换和处理,所以从数据任务中解析血缘也是获取数据血缘的渠道之一,Spark 是大数据中数据处理最常用的一个技术组件,既可以做实时任务的处理,也可以
图书《数据资产管理核心技术与应用》核心章节节选-3.1.2. 从Spark 执行计划中获取数据血缘 图书《数据资产管理核心技术与应用》核心章节节选-3.1.2. 从Spark 执行计划中获取数据血缘 图书《数据资产管理核心技术与应用》核心章节节选-3.1.2. 从Spark 执行计划中获取数据血缘
Label Studio数据标注--通过源码安装
Label Studio是Heartex公司开发的一款在线数据标注工具,本文就介绍如何从github上clone源码安装Label Studio。