首页 星云 工具 资源 星选 资讯 热门工具
:

PDF转图片 完全免费 小红书视频下载 无水印 抖音视频下载 无水印 数字星空

MYSQL DQL in 到底会不会走索引&in 范围查询引发的思考。

编程知识
2024年07月16日 22:06

前情引子

in 会不会走索引?很多人肯定会回答、废话、如果命中了索引、那肯定会走。

其实我和大多数人一样、一开始也是这么想的、直至有一个血淋淋的案子让我有所改观、有所思考。

背景介绍

业务的工单表、我们分了64张、以userId作为分表键、业务实际场景中未使用到搜索引擎、主要是一些B端业务。

业务有一个场景是使用userId作为条件 使用in语句查询工单数据。

这里分析一下、

  • 第一个userId作为分表键作为查询条件是合理的
  • 第二个、该业务场景下的SQL为userId字段添加了索引、是考虑到的

实际发生问题

该需求上线之后、我们发现个别B端使用人员、他需要查询userId为5w左右的条件查询、经日志查询该查询的耗时大概在35S左右、正常查询都是3S以内。当问题发生的时候、我就在分析、in 到底有没有走索引、如下

  • 5w/64张表=781 个 假设按照平均分配  每个表的in包含的个是不足1k
  • 第二个每张分表其实都是添加了索引的
  • 数据库的监控服务没有查询到有慢SQL出现

综合以上初步判断、这么小的量、如果命中索引、那不该需要查询这么长的时间。

解决方案

既然出现了问题、那肯定是要解决方案的、思考的角度如下:

  1. 分表情况下、无法使用大家熟悉的explain 语句 直接查询数据库、让数据库告诉你有没有使用索引、当然、如果你指定其中一张分表还是可以使用explain语句的
  2. 数据库分表、DB的操作实际上是将每张表的查询结果出来之后、全部load到内存聚合之后再返回给实际调用他的Java服务的
  3. 假设这里命中了索引、基于第二点那慢的另一个因素可能就是DB服务器内存被打满了

这里我基于第三点的假设、对于业务代码进行了改造

使用in条件进行查询

限制了每次查询数据库in所包含的userId个数最多是5000个、即时就是我们经常说的批量查询、这样子做、最大量的5w就会分成10批去查询数据库、结果再聚合。而分到每张表的in包含的个数、按平均情况就只有了78个左右了、改成这种写法、从宏观的角度、就是把DB的一部分压力转移到业务服务器上。

结果如何

新的代码拿到正式环境进行验证之后、使用同样的用户进行测试、in的条件个数仍是5w、但最后的查询结果仅在3S左右就返回了、完成了从35S到3S的质的飞跃的提升。

对于解决问题而言、我们已经是成功的Solver、We are white cat or black cat.

But 这里有仍有两个疑问、

批次的数量具体是哪个值合适2k or 5k、这里我的5k值是与我的正常业务的水平相一致的、所以我说是适合我的、但并不是适合所有场景、所有人。

从最后的结果提升来看、我更倾向于改造后的代码既是走了索引、也为DB减少了压力、才会有这么高的性能提升。

我请教一位现世高人

  • 索引的类型和质量:B-TREE、不需要回表查询、完全命中。
  • in条件值的分布:分布均匀可能会使用到索引
  • 成本估算:MYSQL的查询优化器会基于统计信息对不同的执行计划进行成本估算?全表嫂 or 还是用索引比较合适呢?
  • 系统配置和资源限制:innodb-buffer-pool-size?系统的资源使用情况 都会影响执行计划的选择
  • 数据库的版本和配置:5.5及以上查询优化器对in操作进行了优化、但仍旧不能保证。

 

 

From:https://www.cnblogs.com/richicewoo/p/18304194
本文地址: http://shuzixingkong.net/article/125
0评论
提交 加载更多评论
其他文章 Go微服务开发指南
在这篇深入探讨Go语言在微服务架构中的应用的文章中,我们介绍了选择Go构建微服务的优势、详细分析了主要的Go微服务框架,并探讨了服务发现与注册和API网关的实现及应用。 关注TechLead,复旦博士,分享云服务领域全维度开发技术。拥有10+年互联网服务架构、AI产品研发经验、团队管理经验,复旦机器
Go微服务开发指南 Go微服务开发指南
Apache基于IP和端口
Apache基于IP 步骤1:添加并配置虚拟网卡 添加虚拟网卡:通常在虚拟机环境中,可以通过虚拟机软件(如VMware或VirtualBox)的网络设置来添加额外的网络适配器。 配置IP地址:编辑/etc/sysconfig/network-scripts/ifcfg-ethX文件,,并将它们设置为
Apache基于IP和端口 Apache基于IP和端口 Apache基于IP和端口
Linux 提权-密码搜寻
本文通过 Google 翻译 Password Hunting – Linux Privilege Escalation 这篇文章所产生,本人仅是对机器翻译中部分表达别扭的字词进行了校正及个别注释补充。 导航 0 前言 1 密码搜寻 – 文件名和文件内容 1.1 寻找有趣的文件名 1.2 寻找有趣的
Linux 提权-密码搜寻 Linux 提权-密码搜寻 Linux 提权-密码搜寻
yolov5 损失函数代码详解
模型的损失计算包括3个方面,分别是: 1. 定位损失 2. 分类损失 3. 置信度损失 本篇主要讲解yolov5中损失计算的实现,包括损失的逻辑实现,张量操作的细节等。
yolov5 损失函数代码详解 yolov5 损失函数代码详解 yolov5 损失函数代码详解
企业级环境部署:在 Linux 服务器上如何搭建和部署 Python 环境?
在大部分企业里,自动化测试框架落地都肯定会集成到Jenkins服务器上做持续集成测试,自动构建以及发送结果到邮箱,实现真正的无人值守测试。 不过Jenkins搭建一般都会部署在公司的服务器上,不会在私人电脑里,而服务器大部分都是Linux操作系统的。所以,我们如果要在Linux上的Jenkins服务
企业级环境部署:在 Linux 服务器上如何搭建和部署 Python 环境? 企业级环境部署:在 Linux 服务器上如何搭建和部署 Python 环境? 企业级环境部署:在 Linux 服务器上如何搭建和部署 Python 环境?
给博客园的几点现实建议
博客园又遇到了生存危机,老实说,意料之中。 因为,付费会员就能支撑一个完全免费的网站,这种商业模式还没成功过。 博客园的理念我完全理解,但是多听听现实性的建议才是正道。 第一计:祸水东引 博客园不接广告这种坚持我理解,但是,你就不能注册个小号? 比如注册个:hotspot.dev 开发热点
玄机-第一章 应急响应- Linux入侵排查
玄机-第一章 应急响应- Linux入侵排查 简介 账号:root 密码:linuxruqin ssh root@IP 1.web目录存在木马,请找到木马的密码提交 2.服务器疑似存在不死马,请找到不死马的密码提交 3.不死马是通过哪个文件生成的,请提交文件名 4.黑客留下了木马文件,请找出黑客的服
玄机-第一章 应急响应- Linux入侵排查 玄机-第一章 应急响应- Linux入侵排查 玄机-第一章 应急响应- Linux入侵排查
iOS开发基础102-后台保活方案
iOS系统在后台执行程序时,有严格的限制,为了更好地管理资源和电池寿命,iOS会限制应用程序在后台的运行时间。然而,iOS提供了一些特定的策略和技术,使得应用程序可以在特定场景下保持后台运行(即“后台保活”)。以下是iOS中几种常见的后台保活方案,并附上示例代码: 一、后台任务 利用beginBac