所讨论的 Sql Server 2008 R2 实例是一个重负载 OLTP 生产服务器。几天前出现了僵局问题,但仍未解决。我们收到了 Xml 死锁报告,其中列出了死锁涉及的存储过程以及其他一些详细信息。我将首先尝试列出此 xml 中的事实:
死锁涉及两个存储过程,即 SP1 和 SP2。据报道SP1 正在隔离级别“可串行化”下运行 and SP2 正在“ReadCommissed”状态下运行.
我们调查了以下内容:
我们是否设置 SP1 的 IsolationLevel
到 SP 内或中的“可序列化”
代码? - 不。
是否有任何其他 SP,其 IsolationLevel
是“可序列化”调用 SP1 吗? - 不。
SP1 使用的表是否被调用
任何其他具有隔离功能的 SP
级别为“可序列化”? - 是的。
有些 SP 具有隔离功能
级别设置为“可序列化”并且
访问与 SP1 相同的表,
但我们不知道他们是否
当时正在运行
死锁与否作为死锁
报告仅显示 SP1 和 SP2。
思路:
我们考虑了以下可能的原因:
发生死锁是因为 SP1 处于
作为“可序列化”运行。 - 为什么是
此 SP 运行在 Serialized 时
我没设置过吧?是否隔离
级别升级(就像锁一样)?如果
我们弄清楚了这一点并让它运行
ReadCommited,问题会是
解决?
任何其他 SP 正在运行,锁定
SP1 使用的表并导致
SP1 和 SP2 之间出现死锁。 -
这个 SP 不会列在
僵局报告?能否陷入僵局
报告错过了这样的依赖关系?如果是
那么我们可能只得到部分
信息。这还是不行
解决 SP1 的运行方式
不过,可序列化。
建议:
Update:
这是跟踪日志信息为了僵局。我已经更改了 SP 等的名称,但已检查并验证这些更改不会遗漏任何相关信息。检查代码后面的注释以获取有关表格等的更多信息。
?<EVENT_INSTANCE>
<EventType>DEADLOCK_GRAPH</EventType>
<PostTime>2010-09-07T11:27:47.870</PostTime>
<SPID>16</SPID>
<TextData>
<deadlock-list>
<deadlock victim="process5827708">
<process-list>
<process id="process5827708" taskpriority="0" logused="0" waitresource="KEY: 7:72057594228441088 (8d008a861f4f)"
waittime="5190" ownerId="1661518243" transactionname="SELECT" lasttranstarted="2010-09-07T11:27:42.657"
XDES="0x80bf3b50" lockMode="RangeS-S" schedulerid="4" kpid="2228" status="suspended" spid="76" sbid="0"
ecid="0" priority="0" trancount="0" lastbatchstarted="2010-09-07T11:27:42.657"
lastbatchcompleted="2010-09-07T11:27:42.657" clientapp=".Net SqlClient Data Provider"
hostname="xxx" hostpid="5988" loginname="xxx" isolationlevel="serializable (4)"
xactid="1661518243" currentdb="7" lockTimeout="4294967295" clientoption1="673185824" clientoption2="128056">
<executionStack>
<frame procname="SP1" line="12" stmtstart="450" stmtend="6536"
sqlhandle="0x0300070090cbdc7742720c00e99d00000100000000000000">
Select ... from Table1, Table2, Table4, Table5
</frame>
</executionStack>
<inputbuf>
Proc [Database Id = 7 Object Id = 2010958736]
</inputbuf>
</process>
<process id="process5844bc8" taskpriority="0" logused="1873648" waitresource="KEY: 7:72057594228441088 (0e00ce038ed0)"
waittime="4514" ownerId="1661509575" transactionname="user_transaction" lasttranstarted="2010-09-07T11:27:40.423"
XDES="0x37979ae90" lockMode="X" schedulerid="7" kpid="3260" status="suspended" spid="104" sbid="0" ecid="0"
priority="0" trancount="2" lastbatchstarted="2010-09-07T11:27:43.350" lastbatchcompleted="2010-09-07T11:27:43.350"
clientapp=".Net SqlClient Data Provider" hostname="xxx" hostpid="5988" loginname="xxx"
isolationlevel="read committed (2)" xactid="1661509575" currentdb="7" lockTimeout="4294967295"
clientoption1="673185824" clientoption2="128056">
<executionStack>
<frame procname="SP2" line="68" stmtstart="5272" stmtend="5598"
sqlhandle="0x030007003432350f109a0c00e99d00000100000000000000">
UPDATE Table1 ...
</frame>
</executionStack>
<inputbuf>
Proc [Database Id = 7 Object Id = 255144500]
</inputbuf>
</process>
</process-list>
<resource-list>
<keylock hobtid="72057594228441088" dbid="7" objectname="Table1" indexname="Index1"
id="lock448e2c580" mode="X" associatedObjectId="72057594228441088">
<owner-list>
<owner id="process5844bc8" mode="X" />
</owner-list>
<waiter-list>
<waiter id="process5827708" mode="RangeS-S" requestType="wait" />
</waiter-list>
</keylock>
<keylock hobtid="72057594228441088" dbid="7" objectname="Table1" indexname="Index1"
id="lock2ba335880" mode="RangeS-S" associatedObjectId="72057594228441088">
<owner-list>
<owner id="process5827708" mode="RangeS-S" />
</owner-list>
<waiter-list>
<waiter id="process5844bc8" mode="X" requestType="wait" />
</waiter-list>
</keylock>
</resource-list>
</deadlock>
</deadlock-list>
</TextData>
<TransactionID />
<LoginName>xx</LoginName>
<StartTime>2010-09-07T11:27:47.867</StartTime>
<ServerName>xxx</ServerName>
<LoginSid>xxx</LoginSid>
<EventSequence>116538375</EventSequence>
<IsSystem>1</IsSystem>
<SessionLoginName />
</EVENT_INSTANCE>
SP1 正在执行从 5 个不同表(Table1 到 Table5)获取数据的选择(使用内部查询等)。SP2 对 Table1 执行更新。
有趣的是,SP2 更新的列之一是 Table1 中的外键字段和 Table2 的主键,而 Table1 和 Table2 都是 SP1 的 select 语句的一部分,不确定这是否相关,但不想错过任何事物。
注意:indexname="Index1"(在上面的死锁图中)--Index1 与 Table1 中的外键和 Table2 中的主键位于同一列上。
检查这个MSDN 文章 http://msdn.microsoft.com/en-us/library/tcbchxcb.aspx其中指出:
隔离级别具有连接范围的范围,并且一旦设置为
与 SET TRANSACTION ISOLATION LEVEL 语句连接,它
保持有效,直到连接关闭或另一个隔离
级别已设定。当连接关闭并返回到池中时,
上次 SET TRANSACTION ISOLATION LEVEL 的隔离级别
声明被保留。后续连接重用池化的连接
连接使用当时有效的隔离级别
连接被池化。
问题是连接以可串行化隔离级别打开;关联的事务已被处理,连接也已被处理,但连接并未被销毁并进入连接池。下次当发出连接请求(使用相同的连接字符串)时,就会返回该连接,并且由于查询未指定任何隔离级别,因此它在可序列化隔离级别中执行。
基本上,如果您有一个连接池并在特定隔离级别(例如可序列化)中打开一个连接,那么该连接将返回到隔离级别设置为可序列化的池中。下次请求连接时,您无法确定不会返回该连接,因此即使默认隔离级别为 ReadCommissed,您也可能会获得这些“可序列化”连接之一。
另一个需要注意的是,每次将隔离级别设置为可序列化(或其他任何相关级别)时,您可能会选择不同的连接,并且慢慢地,您可能会通过将隔离级别设置为可序列化(或其他任何级别)来污染连接池中越来越多的连接。你设置)。
我没有找到任何机制来重置处置连接(当执行查询后返回到连接池时)。一种解决方法是显式重置每个连接的隔离级别。但这很乏味。
所以最好的选择是为不同的隔离级别创建单独的连接池.
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)