NVarchar、Bin 排序规则、Bin2 排序规则之间有什么区别？

2023-11-26

所有 3 个选项均区分大小写和重音，并支持 Unicode。根据文档：

NVarchar 根据“相关语言或字母表的词典”（？）对数据进行排序和比较
Bin 根据“位模式”（？）对数据进行排序和比较
Bin2 根据“Unicode 数据的 Unicode 代码点”（？）对数据进行排序和比较

为了让复杂的事情变得简单，我可以说Bin是NVarchar的改进，Bin2是Bin的改进吗？除非我受到向后兼容性的限制，否则总是建议使用 Bin2 或至少 Bin 以获得更好的性能？

=================================================== ======================= 我会再次尝试解释我自己。

看一看：

If Object_ID('words2','U') Is Not Null Drop Table words2;
Create  Table words2(word1 NVarchar(20),
                    word2 NVarchar(20) Collate Cyrillic_General_BIN,
                    word3 NVarchar(20) Collate Cyrillic_General_BIN2);

Insert
Into    words2
Values  (N'ھاوتایی',N'ھاوتایی',N'ھاوتایی'),
        (N'Συμμετρία',N'Συμμετρία',N'Συμμετρία'),
        (N'אבַּג',N'אבַּג',N'אבַּג'),
        (N'対称性',N'対称性',N'対称性');
Select * From words2;

所有 3 个选项都支持所有类型的字母表，无论排序规则是什么。

问题是 - 这 3 个选项之间的实际区别是什么？假设我想用不同的字母存储私有名称，我可以使用哪个选项？我想我必须找到特定的名称（选择..来自..哪里..），订单名称（选择..来自..订购依据..）。

所有 3 个选项均区分大小写和重音，并支持 Unicode。

NVARCHAR是一种数据类型（例如INT, DATETIME等）而不是一个选项。它以 UCS-2 / UTF-16（Little Endian）编码存储 Unicode 字符。 UCS-2 和 UTF-16 在 U+0000 到 U+FFFF（十进制值 0 - 65535）范围内是相同的代码点。 UTF-16 处理 U+10000 及以上代码点（称为补充字符），所有这些代码点都定义为 UCS-2 范围中存在的代码点对（称为代理对）。由于两者之间的字节序列相同，唯一的区别在于数据的处理。意思是，内置函数在使用排序规则时不知道如何解释补充字符not end in _SC，而当使用以结尾的排序规则时，它们确实可以在整个 UTF-16 范围内正常工作_SC. The _SCSQL Server 2012 中添加了排序规则，但您仍然可以在以前的版本中存储和检索补充字符；只有内置函数在操作增补字符时无法按预期运行。

更直接：

NVARCHAR作为一种数据类型，本质上不区分大小写或重音（或任何其他敏感性）敏感或不敏感。确切的行为取决于为列设置的排序规则、数据库的默认排序规则或COLLATE子句，取决于表达式的上下文。
虽然这是一个极其常见的误解，但二进制排序规则既不区分大小写也不区分重音。它只是appears简单地看，它们就是这样的。 “敏感”意味着能够检测特定敏感度（大小写、重音、宽度、假名类型以及从 SQL Server 2017 开始：变体选择器）的差异，同时仍然允许其他敏感度和/或底层字节表示形式的差异。更多详细信息和示例请参见：不，二进制排序规则不区分大小写.

排序规则，虽然字面上是关于字符如何排序和相互比较，但在 SQL Server 中还意味着区域设置/LCID（它确定覆盖这些比较的默认处理的文化规则）以及用于VARCHAR data.

非二进制排序规则被视为“字典”排序/比较，因为它们考虑了排序规则指定的特定区域性的规则（特别是关联的 LCID）。另一方面，二进制排序规则不处理任何特定于区域性的规则，仅根据每个 2 字节序列的数值进行排序和比较。因此，二进制排序规则要快得多，因为它们不需要应用大量规则，但它们也无法知道单个两字节代码点是一个u带重音符号与 2 个两字节序列不同，它们是u以及一个单独的重音符号，它将在屏幕上呈现为与单个两字节代码点相同，并且在使用非二进制排序规则时将比较为相等。

和...之间的不同_BIN and _BIN2 is 分拣精度，而不是性能。年龄较大的_BIN排序规则进行简单的逐字节排序和比较（在第一个字符之后，它被视为代码点而不是两个字节，因此it排序正确）而较新的_BIN2排序规则（从 SQL Server 2005 开始）比较每个代码“单元”（补充字符由两个代码单元组成，并且_BIN2排序规则单独查看每个代码单元，而不是将它们的组合视为代码点）。这两种方法之间的排序顺序存在差异，主要是由于 SQL Server 是存储字节的“Little Endian”（对于单个实体：UTF-16 代码单元，INT value, BIGINT值等）以相反的顺序。因此，代码点 U+0206 实际上会排序afterU+0402 使用时_BIN整理：

SELECT *, CONVERT(VARBINARY(20), tmp.[Thing]) AS [ThingBytes]
FROM  (VALUES (1, N'a' + NCHAR(0x0206)), (2, N'a' + NCHAR(0x0402))) tmp ([ID], [Thing])
ORDER BY tmp.[Thing] COLLATE Latin1_General_100_BIN;
/*
ID    Thing    ThingBytes
2     aЂ       0x61000204
1     aȆ       0x61000602  <-- U+0206, stored as 0x06 then 0x02, should sort first
*/

SELECT *, CONVERT(VARBINARY(20), tmp.[Thing]) AS [ThingBytes]
FROM  (VALUES (1, N'a' + NCHAR(0x0206)), (2, N'a' + NCHAR(0x0402))) tmp ([ID], [Thing])
ORDER BY tmp.[Thing] COLLATE Latin1_General_100_BIN2;
/*
ID    Thing    ThingBytes
1     aȆ       0x61000602
2     aЂ       0x61000204
*/

有关此区别的更多详细信息和示例，请参阅：各种二进制排序规则之间的差异（文化、版本以及 BIN 与 BIN2）.

此外，当涉及 Unicode / 时，所有二进制排序规则都以完全相同的方式进行排序和比较。NVARCHAR数据。代码点是数值，在比较它们时无需考虑语言/文化差异。因此，拥有多个全局“BINARY”排序规则的唯一目的是仍然需要指定要使用的代码页VARCHAR data.

假设我想用不同的字母存储私有名称，我可以使用哪个选项？

如果您正在使用VARCHAR字段，那么特定于排序规则（无论二进制或非二进制）将确定哪些字符可用，因为它是 8 位扩展 ASCII，通常具有 256 个不同字符的范围（除非使用双字节字符集，其中它可以处理更多的情况，但这些仍然大部分属于单一文化/字母表）。如果使用NVARCHAR为了存储数据，因为它是 Unicode，所以它有一个由所有语言的所有字符以及许多其他内容组成的字符集。

所以选择NVARCHAR解决了能够保存来自不同语言的名称的正确字符的问题。但是，您仍然需要选择特定文化的字典规则，以便以每种特定文化期望的方式进行排序。这是一个问题，因为无法动态设置排序规则。所以选择最常用的一个。二进制排序规则在这里对你没有帮助，事实上会违背你想要做的事情。然而，当您需要区分原本相等的字符时，它们非常方便，例如在本例中：SQL Server过滤CJK标点字符（这里是S.O.）。

我使用过的另一个相关场景_BIN2排序规则正在检测 URL 中的大小写更改。 URL 的某些部分不区分大小写，例如主机名/域名。但是，在 QueryString 中，传入的值可能是敏感的。如果您在不区分大小写的操作中比较 URL 值，则http://domain.tld/page.ext?var1=val相当于http://domain.tld/page.ext?var1=VAL，并且这些值不应被假定为相同。使用区分大小写的排序规则也会通常工作，但我用Latin1_General_100_BIN2因为它更快（没有语言规则）并且不会忽略ü to u+ 结合分音符（呈现为ü).

我对以下答案有更多关于排序规则的解释（因此不会在此处重复，因为其中大多数都包含几个示例）：

UCS-2 和 SQL Server
SQL Server默认字符编码
nvarchar (Unicode) 列的 COLLATIONS 有何意义？
Unicode 到非 unicode 的转换
NVARCHAR 存储 SQL Server 上 UCS-2 编码不支持的字符

这些都在 DBA.StackExchange 上：

如何去除希伯来语重音符号
更改数据库默认排序规则时 Latin1_General_BIN 性能影响
在表中存储日语字符

有关使用排序规则、编码、Unicode 等的更多信息，请访问：校对信息

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

NVarchar、Bin 排序规则、Bin2 排序规则之间有什么区别？的相关文章

SQL Server 实例名称的最大长度？

我需要知道以下版本的 SQL Server 实例名称的最大字符长度如果它们之间存在差异 SQL Server 2000 SQL Server 2005 SQL Server 2008 SQL Server 2008 R2 我正在开发一个应
消息 203，级别 16，状态 2，不是有效标识符

我收到以下错误消息 203 级别 16 状态 2 过程 getQuestion 第 18 行名称 select top 1 from tlb Question inner join tlb options on tlb options q
无法将数据加载到 mvc 4 中的 jTable 中

好的我第一次尝试 jTable 我可以加载表但这对我没有什么好处因为它不会加载我的任何数据当我调试程序时我想要的表中的所有行都存储在我的列表中因此我很困惑为什么当我运行应用程序时会弹出一个对话框显示与服务器通信时发生错误 H
如何在 SQL Server 2012 中选择除一列之外的所有列？ [复制]

这个问题在这里已经有答案了有没有一种方法可以选择所有列但只选择我不想选择的特定列我的意思是有时我会遇到这样的问题表有数百个字段而我只需要删除一个字段我需要重写所有列吗有什么窍门吗喜欢select
跳过行：将数据从 SSIS 导出到 Excel 文件

我正在尝试使用 SSIS 将数据从 SQL Server 数据库导出到 Excel 文件中我希望从第 6 行插入数据第 5 行有标题我可以映射标题名称Excel 目标编辑器通过编写 SQL 命令到 SQL 表头 SELECT FRO
SQL中如何识别字符串的第一个字符是数字还是字符

我需要将数据中的第一个字符识别为 SQL Server 中的数字或字符我对此比较陌生我不知道从哪里开始但这是我到目前为止所做的事情我的数据看起来像这样 TypeDep Transfer From 4Z2 Transfer From
无法批量加载。操作系统错误代码 5（访问被拒绝。）

由于某些奇怪的原因我在执行批量插入时遇到问题 BULK INSERT customer stg FROM C Users Michael workspace pydb data andrew out txt WITH FIRSTROW 0
作为 UDF 结果的列上的 Where 子句

我有一个用户定义的函数例如myUDF a b 返回一个整数我试图确保该函数仅被调用一次并且其结果可以用作WHERE clause SELECT col1 col2 col3 myUDF col1 col2 AS X From myTa
根据最大值连接表

这是我正在谈论的内容的一个简化示例 Table students exam results id name id student id score date 1 Jim 1 1 73 8 1 09 2 Joe 2 1 67 9 2 09 3
SQL Server 每年的第一个星期一

如何使用 T SQL 查找一年中的第一个星期一这是 ngruson 发布的链接中的示例 http sqlbump blogspot nl 2010 01 first monday of year html http sqlbump bl
SQL Server 中的每个实体自动增量字段？

我的数据库中有一个稳定的食物主键为 fooD 我有第二个表 foo Attributes 其外键引用 foo fooD 我想在 fooAttributes 表上有一个组合键 fooID attributeNumber 当我插入新属性时
SQL Server - 仅执行存储过程角色

如何创建只能运行的自定义 SQL Server 数据库服务器角色SELECT查询和存储过程这意味着该角色的用户不允许执行自定义查询但可以运行具有 CRUD 和 SysAdmin 语句的存储过程 UPDATES DELETES ALTE
查询获取每条记录的最小日期[重复]

这个问题在这里已经有答案了我想获取表中每条记录的最小日期该表具有多个带有一个主键的日期条目看看我的桌子 CaseNo Entry date ABC 001 2 12 13 ABC 002 2 09 13 ABC 001 1 01 13
将逗号分隔的主数据替换为列中的描述

有 2 个 SQL Server 表 Products Name Status Code Product 1 1001 1003 Product 2 1001 1005 1006 Status Code Description 1001 S
unicode().decode('utf-8', 'ignore') 引发 UnicodeEncodeError

这是代码 gt gt gt z u u2022 decode utf 8 ignore Traceback most recent call last File
如何在 Python 2.7 中编写 unicode csv

我想将数据写入文件其中 CSV 中的行应如下所示直接来自 Python 控制台 row xef xbb xbft 11651497 http kozbeszerzes ceu hu entity t 11651497 xml Szabo
从头开始构建 OLAP 解决方案时应该注意什么？

我在一家运行基于 MS SQL 数据库服务器的软件产品的公司工作多年来我已经用 PHP 开发了 20 30 个相当高级的报告直接从数据库获取数据这非常成功人们对此感到高兴但它有一些缺点对于新的变化它可能是相当开发密集型的用户
如何选择列值不不同的每一行

我需要运行一个 select 语句返回列值不不同的所有行例如 EmailAddress 例如如果表格如下所示 CustomerName EmailAddress Aaron email protected cdn cgi l emai
INNER/RIGHT/LEFT JOIN 怎么会比 FULL JOIN 慢 14 倍？

我有一个查询使用 FULL JOIN 需要 2 5 秒使用 INNER RIGHT 或 LEFT JOIN 需要 40 秒这是查询子查询完成两次本身只需要 1 3 秒 SELECT T1 time T1 Total T1 rn
Razor C# - 从数据库获取数据

我正在使用 WebMatrix 我创建了一个数据库并放置了一个包含几行数据的表我可以连接到它并获取数据WebGrid 但它只提供了一种使用表格输出数据的方法这是我的 shows cshtml 代码 var db Database Ope

随机推荐

Swing：无法更新 JButton - repaint() 不起作用

我第一次使用 Swing 来创建一个简单的 GUI 它由一个JFrame我在其上放置了一个JButton单击时会调用一些其他代码大约需要花费时间 3秒返回就在调用此代码之前在actionPerformed 我想更新按钮上的文本以通知
Java 中 fileSystemWatcher 的建议/示例代码

我正在尝试在 java 中构建一个 fileSystemWatcher 类似于 C 中的 FileSystemWatcher 请建议java是否有任何内置框架功能或者建议直接到任何示例开源项目查看Apache Commons JCI
获取可用 WiFi 点列表

我正在创建一个需要互联网连接的应用程序因此当 WiFi 设置未启用时我会弹出一条消息来将其打开但当它打开时它不一定连接到 WiFi 接入点有什么方法可以在列表中显示当前所有可用的 WiFi 点吗提前致谢看看下面的方法Wifi
Jackson - 如何处理（反序列化）嵌套 JSON？

vendors vendor id 367 name Kuhn Pollich company id 1 vendor id 374 name Sawayn Hermann company id 1 我有一个 Vendor 对象可以从单个
为什么此 D3 代码将
元素添加到正文外部，而不是内部？

我正在学习 D3 并且在使用选择运算符时遇到了问题具体来说为什么下面的代码要添加 p 元素在身体之外而不是在身体内部 var pData1 d3 select body select p data 1 enter append p 我
如何通过 Spring 将本地 xsd 用于 EhCache

当我们将 ehcache xml 中的 XSD 文件指向http ehcache org ehcache xsd 一切正常我们的应用程序可以正确启动但是我们的服务器无法访问外部网站因此我们将 XSD 位置更改为本地如下所示但应用程
Websphere 中的证书链接错误

我正在尝试从 url 使用 RESTful 服务https someurl com 我在代码中添加了以下属性 Security setProperty ssl SocketFactory provider com ibm jsse2 SSL
无法解析 com.android.support:appcompat-v7:26.1.0 [重复]

这个问题在这里已经有答案了升级到 android studio 3 0 gradle 后停止工作无法解析 app debug compileClasspath 的依赖关系无法解析com android support appcompa
如何在 Firefox > 108 中设置日期输入日历图标的样式？

在旧版本的 Firefox 直到 109 中可以像 Chromium 一样选择日期选择器的图标 input type date webkit calendar picker indicator display none Hides the
如何将对象拆分为嵌套对象？（递归方式）

我有一个包含下划线变量名称的数据集比如下面这样 const data m name my name m address my address p 1 category cat 1 p 1 name name 1 p 2 category
RSA 私钥仅支持 RSAPrivate (Crt) KeySpec 和 PKCS8EncodedKeySpec

我按照链接中的步骤操作如何读取 pem文件来获取私钥和公钥我执行了以下三个命令 1 openssl genrsa out mykey pem 2048 2 openssl pkcs8 topk8 inform PEM outform
在多个单元格中生成随机数的脚本

寻找一种在单元格 c2 f2 中生成 1 9 随机数的方法重复的值是可以的只要它在每个单元格中都是一个数字并且只有当我单击按钮或与此相关的内容时值才会发生变化而不是每次我在单元格中键入内容时有点像你可以使用 Excel 和表单
Laravel 5 和 Internet Explorer：令牌不匹配

我的 Laravel 网站使用 csrf 令牌来防止 CSRF 攻击在 Chrome 和 Firefox 上一切正常我提交了网站供我的客户测试当他使用 Internet Explorer 9 10 时他在使用令牌的每个页面上都出现
放大时 D3 轴标签变得太细粒度

我正在尝试创建一个轴函数其刻度标签是动态的这意味着它们会自动隐藏显示但最重要的是我希望在某个缩放级别停止渲染更多刻度标签下面是一个示例首先轴显示年份然后当您放大时刻度线会变成月份当您进一步放大时它会显示日期即
如何将整个流读入 std::vector ？

I read 这里有一个答案展示如何使用以下一两行将整个流读入 std string std istreambuf iterator
带有护照 jwt 的非对称密钥。验证始终返回未经授权

正在开发一个应用程序我从一开始就希望安全所以我创建了一个私钥公钥对并且正在设置passport jwt像这样 key是密钥对的公共部分 passport key gt const opts jwtFromRequest Extrac
在 Apps 脚本中取消 gzipping Blob 时出现“无效参数”错误

我有一个脚本可以从第 3 方 API 接收 gzipped blob 我正在尝试使用它来解压它Utilities ungzip 但出现无效参数错误这是示例代码 var liveReportResponse UrlFetchApp fet
将 Mongoose 文档转换为 json

我以这种方式将 mongoose 文档作为 json 返回 UserModel find function err users return res end JSON stringify users 但是 user proto 也被返回没
Maven：如何避免版本附加到 Maven 中的 war 文件？

我使用 Maven 作为构建文件这是我对要生成的 war 文件名的以下设置我使用的是 Maven 版本 2 2 1
NVarchar、Bin 排序规则、Bin2 排序规则之间有什么区别？

所有 3 个选项均区分大小写和重音并支持 Unicode 根据文档 NVarchar 根据相关语言或字母表的词典对数据进行排序和比较 Bin 根据位模式对数据进行排序和比较 Bin2 根据 Unicode 数据的 Unicode

NVarchar、Bin 排序规则、Bin2 排序规则之间有什么区别？

NVarchar、Bin 排序规则、Bin2 排序规则之间有什么区别？ 的相关文章

随机推荐

热门标签

NVarchar、Bin 排序规则、Bin2 排序规则之间有什么区别？的相关文章