记一次异常排查过程:druid连接池抛出DataSourceDisableException

2023-05-16

为什么80%的码农都做不了架构师?>>>   hot3.png

先交待下项目背景,项目中有个功能是从mysql中获取数据库信息来创建数据库连接,用的连接池是druid,jar包版本是1.0.9。

1. 异常的发生

最近项目中出现了一个神奇的异常:

读取MySQL数据错误: jdbc:mysql://61.160.xxx.xxx:3306/xxx?characterEncoding=utf-8&autoReconnect=false&connectTimeout=15000&socketTimeout=60000, taskId=xxxxx, message: null

这个发生在数据库操作时,神奇之处在于:

  1. 异常偶尔会发生,同一时间的连接,有的会成功,而有的会报异常;
  2. 异常信息为null。

2. 异常抛出位置

抛出异常的代码如下:

@Override
protected Result<Date> doImportData() {
   String url = getJdbcUrl();
   String host = getHost();
   int port = getPort();
   String username = getUsername();
   String password = getPassword();
   Connection con = null;

   DataSource dataSource = null;
   try {
      long t1 = System.currentTimeMillis();
      dataSource = DataSourceProvider.getDataSource(host, port, username, 
	  		password, url, MAX_POOL_SIZE, MIN_POOL_SIZE, INITIAL_POOL_SZIE);
      con = dataSource.getConnection();
      long getConnectionCostTime = System.currentTimeMillis() - t1;
      logger.info("taskId=" + task.getTaskId() + ",getConnection()=" + getConnectionCostTime + "ms");
      ···
   } catch (SQLException e) {
      logger.error("读取MySQL数据错误: " + url + ", taskId=" + task.getTaskId() + ", message: " + e.getMessage());
      ···
   } finally {
      if (con != null) {
         try {
            con.close();
         } catch (SQLException e) {
            // ignore
         }
      }
   }
   return result;
}

3. 异常分析与推断

3.1 从异常信息来看,可以得出如下判断:

  1. 异常是由SQLException捕获到的,因此代码运行到了try代码块;
  2. 异常的message是null,很容易联想到抛出的是NullPointerException,但SQLException捕获不到NPE,因此不会是NPE;
  3. 从运行日志排查,没有运行到代码 logger.info("taskId=" + task.getTaskId() + ",getConnection()=" + getConnectionCostTime + "ms");

3.2 从以上信息来排除,发现可疑问代码只有三行了:

long t1 = System.currentTimeMillis();
dataSource = DataSourceProvider.getDataSource(host, port, username, 
		password, url, MAX_POOL_SIZE, MIN_POOL_SIZE, INITIAL_POOL_SZIE);
con = dataSource.getConnection();

3.3 再看看方法的具体实现,发现异常的抛出是在

con = dataSource.getConnection();
// 项目中用的是druid连接池
// com.alibaba.druid.pool.DruidDataSource
public DruidPooledConnection getConnection() throws SQLException

在方法里往下找下去,没找到什么有用的信息,终于还是放弃了...

4.峰回跳转-打印异常堆栈信息

项目中的异常还在报,好想假装异常没发生...嗯,还是继续排查吧。

接下来,刚好碰上项目发布,果断修改了打印异常信息的方式,这次直接打出异常堆栈而不仅仅是message了:

logger.error("读取MySQL数据错误: " + url + ", taskId=" + task.getTaskId() 
		+ ", message: " + ExceptionUtils.getStackTrace(e));

ExceptionUtils是apache commmons包提供的类,封装了异常相关的操作方法。

等待着,等待着,异常信息终于来了:

[游戏数据采集异常]读取MySQL数据错误: jdbc:mysql://61.160.xxx.xxx:3306/xxx?characterEncoding=utf-8&autoReconnect=false&connectTimeout=15000&socketTimeout=60000, taskId=xxxxxx, message: com.alibaba.druid.pool.DataSourceDisableException
    at com.alibaba.druid.pool.DruidDataSource.pollLast(DruidDataSource.java:1482)
    at com.alibaba.druid.pool.DruidDataSource.getConnectionInternal(DruidDataSource.java:1074)
    at com.alibaba.druid.pool.DruidDataSource.getConnectionDirect(DruidDataSource.java:941)
    at com.alibaba.druid.pool.DruidDataSource.getConnection(DruidDataSource.java:921)
    at com.alibaba.druid.pool.DruidDataSource.getConnection(DruidDataSource.java:911)
    at com.alibaba.druid.pool.DruidDataSource.getConnection(DruidDataSource.java:98)
	···

5.异常排查

从异常堆栈信息来看,报错的异常是DataSourceDisableException,代码是DruidDataSource.java的1482行。

5.1 DataSourceDisableException异常:

首先来认识下DataSourceDisableException异常:

public class DataSourceDisableException extends SQLException

这个类继承了SQLException,所以代码中能catch到。

5.2 异常相关代码

再看看异常抛出的的位置:

if (!enable) {
	connectErrorCount.incrementAndGet();
	throw new DataSourceDisableException();
}

发现两个问题:

  1. if块里的代码执行了,说明enable为false了,只需找到导致enable为false的地方就可以查到异常原因了;
  2. 抛出异常时,没有指定任何的异常信息,如new DataSourceDisableException('出现异常了'),这就导致了异常信息是null。

情况已经很明显了,接下来只要找到导致enable为false的位置就行了。

通过搜索得知,enable初始化时为true,对外暴露了setEnable(boolean)方法:

public void setEnable(boolean enable) {
	···
	this.enable = enable;
	···
}

同时在close()方法中明确地将enable设置成了false:

public void close() {
	···
	enable = false;
	···
}

5.3 得出结论

进一步排查,发现setEnable()方法没有地方调用,而close()方法有地访问在调用。对照代码逻辑,得出的结论如下:

代码里有这样一个操作:数据库连接时,以host、port为key,从缓存中获取dataSource,若username、password与连接里的不一致时,就会关闭获取到的dataSource,并以新的username、password创建新的dataSource.但是,当同一个host、port有多个账号跟密码时,这种操作会有问题,原因是多线程情况下,关闭的dataSource可以会被其他线程获取到。

5.4 问题的解决

知道了问题的所在,解决办法就很简单了:保证dataSource只能被一个线程获取,这里用的缓存数据结构是ConcurrentHashMap,获取数据源时,用的是操作是get()方法,这里只要将操作改成remove(),并且使用完之后,再将dataSourceput()方法返还就可以了。

6.反思

这个异常困扰了我两天,原因与解决方法并不复杂,难点在于异常信息。对于异常信息为null的情况,实在无人下午,只能对着代码干瞪眼。本次排查的转机出现在异常堆栈信息的打印,详细的异常信息有助于问题的快速解决。

7.总结

写了这么多,总结如下:

  1. 吐槽下ali大厂,异常信息竟然不写。
  2. 实际开发中,异常信息应尽量简洁明了,不能啥都不写,更不能故意制造混乱。只有异常发生了,才懂异常信息的可贵。
  3. 异常堆栈信息最好还是要打出来的,不然项目一复杂、调用一多,短短的一句异常信息,可能看不出是在哪里抛出来的,不利于排查。

转载于:https://my.oschina.net/funcy/blog/1933131

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

记一次异常排查过程:druid连接池抛出DataSourceDisableException 的相关文章

随机推荐

  • 动态创建HTML内容

    document write xff08 xff09 方法 document write方法可以方便快捷的把字符串插入到文档里 它最大的缺点是违背了 分离javascript 原则 即使把document write语句挪到外部函数里 xf
  • Linux练习(write写入)

    include lt unistd h gt include lt stdlib h gt int main if write 1 34 here is some data n 34 18 61 18 write 2 34 write er
  • matlab练习程序(随机游走图像)

    随机游走类似布朗运动 xff0c 就是随机的向各个方向走吧 虽然代码没什么技术含量 xff0c 不过产生的图像实在太漂亮了 xff0c 所以还是贴上来吧 产生的图像 xff1a matlab代码如下 xff1a clear all clos
  • [翻译完成] 树莓派搭建Google TV

    为什么80 的码农都做不了架构师 xff1f gt gt gt Google TV是啥玩意 Google TV是支持自选图像 宽带网络 传统电视信号的综合平台 xff0c 更附带电视节目搜索功能 谷歌公布了其新版电视的两个版本 第一个叫做B
  • jdk17.0.1安装教程

    1 解压到某文件夹 2 在此电脑 gt 属性 gt 高级系统设置 gt 环境变量 gt 系统变量 加一条JAVA HOME 3 在系统变量Path里 xff0c 加一条 JAVA HOME bin xff08 不能放在第一条 xff09 4
  • 推荐几本GIS专业书籍

    对于开设GIS专业的高校 xff0c 基本上都会有自己的专业教材 xff0c 用的比较多的像邬伦的 地理信息系统 xff1a 原理 方法和应用 和中科院陈述彭院士的 地理信息系统导论 在当初考研的时候 xff0c 自己也买了不少教材 xff
  • Linux 通过命令发送udp 数据

    2019独角兽企业重金招聘Python工程师标准 gt gt gt 如果往本地UDP端口發送數據 xff0c 那麼可以使用以下命令 xff1a echo hello gt dev udp 192 168 1 81 5060 意思是往本地19
  • Qt学习之路(17): Qt标准对话框之QMessageBox

    好久没有更新博客 xff0c 主要是公司里面还在验收一些东西 xff0c 所以没有及时更新 而且也在写一个基于Qt的画图程序 xff0c 基本上类似于PS的东西 xff0c 主要用到的是Qt Graphics View Framework
  • 2019年开发者必读!20位阿里技术大牛们帮你列了一份经典书单! ...

    导读 xff1a 寒冬中 xff0c 最值得投资的是学习 xff0c 是增厚的知识储备 下面就是20位阿里技术大牛们为我们推荐的经典书籍 书籍类型涉及技术 管理 哲学等方面 xff0c 希望这些书籍陪伴你度过这个漫长的寒冬 书单之外 xff
  • 发表一篇顶会论文的经验分享

    背景 xff1a 最近半个月 xff0c 对之前发表的一篇顶会论文进行了修改 xff0c 并重新提交了 这篇论文是一篇计算机领域的A会文章 本篇文章主要对计算机领域论文写作及发表过程中的相关经验做一个总结 希望可以对研究生小白们有点用 刚刚
  • jQuery的md5加密插件及其它js md5加密代码

    jQuery MD5 hash algorithm function lt code gt Calculate the md5 hash of a String String md5 String str lt code gt Calcul
  • matlab双目相机标定校正_基于双目视觉的无人机避障算法(一)

    讲述在10月到12月所做的所有工作 对于一个无人机自主避障来说 xff0c 存在着以下流程 xff1a 感知 xff1a 障碍物检测 行人检测 目标检测SLAM xff1a 为无人机提供位置估计 xff0c 构建稀疏环境地图路径规划 xff
  • pdf文件显示白色

    主要原因是pdf默认关联应用 xff0c 在版本更替时出现了错误 xff0c 重新给pdf设置一下默认关联应用即可 window10步骤如下 xff1a 1 打开我的电脑 选择计算机 打开设置 2 点 应用 3 选择 默认应用 中的 按文件
  • mysql数据库想要保持固定条数数据的操作

    2019独角兽企业重金招聘Python工程师标准 gt gt gt 限定数据库数据条数 xff1a SELECT FROM 表名 order by 字段 desc limit 条数 这样查询到的是倒数几条数据 xff0c 保证了最新的数据
  • Docker容器的创建、启动、和停止

    1 容器是独立运行的一个或一组应用 xff0c 及他们的运行环境 容器是Docker中的一个重要的概念 2 docker容器的启动有三种方式 a 交互方式 xff0c 基于镜像新建容器并启动 例如我们可以启动一个容器 xff0c 打印出当前
  • 每天一个linux命令(4):mkdir命令

    linux mkdir 命令用来 创建指定的 名称的 目录 xff0c 要求创建目录的用户在当前目录中具有写权限 xff0c 并且指定的目录名不能是当前目录中已有的目录 1 xff0e 命令格式 xff1a mkdir 选项 目录 2 xf
  • ansible报错:Failed to connect to the host via ssh: Permission denied

    原因 xff1a 没有在ansible管理节点 xff08 即安装ansible的节点 xff09 上添加目标节点 xff08 即需要管理的节点 xff09 的ssh认证信息 解决办法 xff1a 1 在管理节点生成公钥 ssh keyge
  • 值传递和引用传递-----函数参数传递的两种方式

    回顾 xff1a 在定义函数时函数括号中的变量名成为形式参数 xff0c 简称形参或虚拟参数 xff1b 在主调函数中调用一个函数时 xff0c 该函数括号中的参数名称为实际参数 xff0c 简称实参 xff0c 实参可以是常量 变量或表达
  • Andriod监听支付宝收款实现个人支付宝支付接口!附安卓App

    首先呢 xff0c 我不会开发安卓App xff0c 这款APP是我在酷安网看到的 xff0c 非常简单的一款APP xff0c 安装后填写我们的后端接口 xff08 用于接收收款通知的 xff09 就可以接收收款通知了 所以就算我们没有这
  • 记一次异常排查过程:druid连接池抛出DataSourceDisableException

    为什么80 的码农都做不了架构师 xff1f gt gt gt 先交待下项目背景 xff0c 项目中有个功能是从mysql中获取数据库信息来创建数据库连接 xff0c 用的连接池是druid xff0c jar包版本是1 0 9 1 异常的