Postgres UTF-8 字符排序

2023-11-27

我正在构建一个小型应用程序，其中包含数据库中的世界语单词，因此我有 ĉapelojn 和 brakhorloĝo 等带有“特殊”字符的单词。

使用 PostgreSQL 9.4.4 我有一个words具有以下架构的表：

lingvoj_dev=# \d words
                                      Table "public.words"
   Column    |            Type             |                     Modifiers
-------------+-----------------------------+----------------------------------------------------
 id          | integer                     | not null default nextval('words_id_seq'::regclass)
 translated  | character varying(255)      |
 meaning     | character varying(255)      |
 times_seen  | integer                     |
 inserted_at | timestamp without time zone | not null
 updated_at  | timestamp without time zone | not null
Indexes:
    "words_pkey" PRIMARY KEY, btree (id)

但以下查询给出了一些奇怪的输出：

lingvoj_dev=# SELECT w."translated" FROM "words" AS w ORDER BY w."translated" desc limit 10; 
translated
------------
 ĉu
 ŝi
 ĝi
 ĉevaloj
 ĉapelojn
 ĉapeloj
 ĉambro
 vostojn
 volas
 viro
(10 rows)

顺序不一致 - 我可以接受所有以特殊字符开头的单词放在最后，但所有以 ĉ 开头的单词应该组合在一起，但事实并非如此！为什么 ŝi 和 ĝi 位于 ĉu 和 ĉevaloj 之间？

服务器编码为 UTF8，排序规则为 en_AU.UTF-8。

edit:看起来它对所有特殊字符进行了等效排序 - 它根据每个单词中的第二个字符正确排序。如何让 PostgreSQL 发现 ĉ、ŝ 和 ĝ 不等价？

我可以接受所有以特殊字符开头的单词处于最后……

使用整理“C”：

SELECT w."translated" 
FROM "words" AS w 
ORDER BY w."translated" collate "C" desc limit 10;

也可以看看“order by”子句中的不同行为：Oracle 与 PostgreSQL

使用 ORM 时查询可能会出现问题。解决方案可能是使用以下命令重新创建数据库LC_COLLATE = C选项，正如OP在评论中建议的那样。还有一个选项 - 更改单个列的排序规则：

ALTER TABLE "words" ALTER COLUMN "translated" TYPE text COLLATE "C";

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

postgresql

UTF8

Postgres UTF-8 字符排序的相关文章

php postgresql pdo 从标准输入复制

COPY table name field1 field2 field3 FROM STDIN CSV 1 2 q w 3 4 a s 5 6 d 如何通过 PDO 执行此查询 Update 问题是 PDO 驱动程序将此查询作为语句执行例
PostgreSQL 中的逆透视表

我有下表作为 SUM Case End 的结果 Account Product A Product B Product C 101 1000 2000 3000 102 2000 1000 0 103 2000 1000 0 104 200
更改 IdentityServer4 实体框架表名称

我正在尝试更改由 IdentityServer4 的 PersistedGrantDb 和 ConfigurationDb 创建的默认表名称并让实体框架生成正确的 SQL 例如而不是使用实体IdentityServer4 EntityF
使用 pg-promise 进行多行插入

我想用一个插入多行INSERT查询例如 INSERT INTO tmp col a col b VALUES a1 b1 a2 b2 有没有一种方法可以轻松地做到这一点最好是对于像这样的对象数组 col a a1 col b b1 co
将 List 作为参数传递到 postgres 的函数中

我有这样的 Spring 数据存储库接口 public interface MyEntityRepository extends JpaRepository
具有 createSQLQuery 的 ResultTransformer 强制实体字段中不使用驼峰式命名法

我有一个sql查询如下 List
为什么在尝试使用 Java 连接到 RDS PostgreSQL 数据库时会收到 SocketTimeoutException？

我有一个 Spring 应用程序我试图在 AWS 上托管几天来我一直在努力配置我有一个 EC2 实例并且能够通过 SSH 连接到它我还在 AWS 中设置了 Postgres RDS 数据库但我无法使用 IDE 中的代码连接到它
是否可以从数据库转储生成 knex 种子文件？

就我而言我使用的是 mysql 但是我正在寻找一种通用解决方案用于从当前运行的数据库或数据库转储生成 knex 种子文件我可以就像是 https github com tgriesser knex issues 944 issuec
SQL Not Empty 代替 Not NULL

我正在使用 postgreSQL 我有一个专栏 NOT NULL 但是当我想插入带有空字符串的行时如下所示它不会给我错误并接受我如何检查插入值应该是not empty 既不为空也不为空 PS 我的专栏定义为 ads characte
设置约束可延迟在 PostgreSQL 事务上不起作用

情况是这样的我有两个表其中一个引用另一个例如 table2 引用 table1 创建这些表时我确实将外键约束设置为 DEFERRABLE 将 ON UPDATE 和 ON DELETE 子句设置为 NO ACTION 这是默认值但
获取 Postgres 数据库中每个表的行数

获取数据库中所有表的行数的最有效方法是什么我正在使用 Postgres 数据库结果示例 table name row count some table 1 234 foobar 5 678 another table 32 如果您想要特
在python中打开带有重音符号的文本文件

我尝试使用 Python 2 7 打开法语文本文件我使用了命令 f open textfr r 但是当我使用 f read 我失去了重音字符我明白了u J xc3 xa9tais xc3 xa0巴黎而不是J tais 巴黎等当在lin
Twitter Streaming API 使用的官方编码？是UTF-8吗？

Twitter 流 API 的官方编码是什么根据我所看到的我最好的猜测是 UTF 8 但我想避免做出假设我见过的 Twitter 网站上唯一暗示他们使用什么作为官方编码的部分是在这里 Twitter 不想因为我们使用 UTF 8 或相
PostgreSQL regexp_matches 只返回匹配的行？

这是我第一次使用 regexp matches 我发现使用它只会返回与 SELECT 子句中的所有 regexp matches 匹配的行例如 SELECT parameters regexp matches parameters a d
Postgres where 子句比较时间戳

我有一个表其中列的数据类型timestamp 其中包含一天的多条记录我想选择与日期对应的所有行我该怎么做 Assuming you actually mean timestamp because there is no datetim
如何以编程方式使用包含多列的 where-in 子句执行 PostgreSQL 查询？

我的查询是这样的 select from plat customs complex where code t code s in 01013090 10 01029010 90 它在 psql 控制台中运行良好我的问题是如何在客户端代码中
为什么 Mac OS 上的 C 运行时允许预组合和分解的 UTF-8？

所以我们都知道 Mac OS 上的文件系统具有使用完全分解的 UTF 8 的古怪功能如果您调用 POSIX API 例如realpath 例如您将从 Mac OS 返回这样一个完全分解的 UTF 8 字符串当使用像这样的 API 时f
PostgreSQL：有效地将 JSON 数组拆分为行

我有一个表表 A 其中包含一个包含 JSON 编码数据的文本列 JSON 数据始终是一个包含一到几千个普通对象的数组我有另一个表表 B 其中有几列包括数据类型为 JSON 的列我想从表 A 中选择所有行将 json 数组拆分为其
按每月时间为用户标记标签

数据源 User ID Visit Date 1 2020 01 01 12 29 15 1 2020 01 02 12 30 11 1 2020 04 01 12 31 01 2 2020 05 01 12 31 14 Problem 我
对 postgresql 中使用 array_agg 创建的文本聚合进行排序

我在 postgresql 中有一个表下表动物可以解释我的问题 name tiger cat dog 现在我正在使用以下查询 SELECT array to string array agg name FROM animals 结果是

随机推荐

上下文版本冲突错误，Google colab

我正在尝试在 Google colab 上安装并运行 sunpy 它需要 astropy 版本 3 1 或更高版本的软件包即使在安装 astropy 版本 3 2 1 后当我导入 sunpy 时它也会出现以下错误 Contextual
Android Activity 的唯一 ID

我需要获取 Android 活动实例的唯一 ID 我想获取activitymanager在日志中写入的字符串例如 ActivityManager HistoryRecord的活动暂停超时 450495a0 但我不知道如何得到它有人知道我
如何从 PHP 压缩或转换为低质量 MP3 文件 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南目前不接受答案是否有任何 PHP 库或函数可以将 MP3 文件转换为较低质量我想通过 PHP 将 128Kbps 或更高质量的 MP3 文件压缩转换为 64K
Javascript：console.log 到 html

我想将 console log 输出写入 div 层例如 document write console log 5 1 Incorrect random example 有人可以解决我的问题吗谢谢 EDIT 我的意思是例如 conso
Passport-local mongoose node.js 支持多种用户类型

我想要两种类型的用户登录用户客户端我到底如何在 app js 中为这两种类型创建 localStrategies 序列化和反序列化用户我有两个单独的模式都使用 PassportLocalMongoose 插件我目前配置我的护照如
在 Android 中按主页按钮后应用程序被杀死时未打开主活动

在我的应用程序中活动 A 是启动器活动从 A 称为 B 从 B 称为 C 我有超过 5 个活动在 C 中当我按下主页按钮并再次打开我的应用程序时它会打开 C 这对我来说没问题但是在按下 C 中的主页按钮后当它空闲一段时间并且
System.exit(0) 没有关闭我的所有活动？ [复制]

这个问题在这里已经有答案了我有 2 个活动因此活动 1 转到活动 2 然后在活动 2 上我有一个退出按钮但是当我点击它时它只退出了活动2并再次返回到活动1 基本上感觉就像我刚刚再次启动应用程序一样我不知道为什么这是我的代码 Bu
在两个 WAR 之间共享应用程序上下文？

有没有办法在两个部署的战争之间共享应用程序上下文一场战争需要连接另一场战争的服务我不知道从哪里开始我们的团队有相同的要求在 Tomcat 中的多个 WAR 之间共享 Spring bean 老实说诸如不要这样做之类的答案没有帮
张量流：使用队列运行器有效地馈送评估/训练数据

我正在尝试运行张量流图来训练模型并使用单独的评估数据集定期进行评估训练和评估数据都是使用队列运行器实现的我当前的解决方案是在同一个图中创建两个输入并使用tf cond依赖于一个is training占位符我的问题通过以下代码突出显示
如何从命令提示符使用 mysqldump 添加日期和时间以及备份文件名称并定义备份文件的路径

我使用此命令从 mysqldump 进行备份 mysqldump uroot ptrackerdb alldatabases gt test sql 现在我想用我的备份文件添加日期时间例如当前日期和时间例如 test 25July201
常见的 Haskell 运算符有可发音的名称吗？ [关闭]

Closed 这个问题是基于意见的目前不接受答案 Locked 这个问题及其答案是locked因为这个问题是题外话但却具有历史意义目前不接受新的答案或互动我正在阅读为大善而学 Haskell 而且我从来不知道 Haskell 运算符
ElementClickInterceptedException：消息：元素单击被拦截：元素无法使用 Selenium 和 Python 单击

我试图单击所有主题和所有状态复选框然后搜索结果当我运行脚本时会打开一个大小为 1036x674 的 Chrome 窗口如果我不理会窗口则会出现元素单击拦截错误如果我最小化或最大化窗口我的脚本就可以正常工作我正在使用
如何在 python 中的活动连接上启动 TLS？

以下是我当前在端口 587 上连接到 gmail 的 smtp 服务器的代码发出 STARTTLS 命令后我如何完成 TLS 会话协商并开始发出 AUTH LOGIN 和 MAIL FROM 等命令我省略了 Base64 编码的 gm
TestCoroutineDispatcher 和 TestCoroutineScope 均不处理协程测试异常

使用这个manual测试协程编写预期抛出异常的测试会导致崩溃而不是通过测试我想知道我做错了什么 private val testDispatcher TestCoroutineDispatcher Before fun setup p
Python 中的区域交集

我有一个代码它采用条件 C 作为输入并将问题的解决方案计算为 x y 空间上的允许区域 A 该区域由多个管组成这些管由两条永远不会交叉的线定义我要寻找的最终结果必须满足 k 个条件 C1 Ck 因此是 k 个区域 A1 A
嵌入式环境中的STL

我是一名 C 程序员多年来一直听到这样的说法 STL 是not good用于嵌入式环境因此通常禁止在基于嵌入式环境的项目中使用我相信像 Boost 这样的 STL 库要强大得多并且提供更快更少出错的开发方式当然语法有点吓人
iPhone + Twitter API：转换时间？

有没有一种简单的方法可以将从 twitter 获得的时间戳转换为 UNIX 时间或从现在起的分钟数我可以解析字符串并自己转换所有内容但我希望有一种不需要这样做的转换方法以下是带有时间戳的created at 元素的示例 2007 年
android c2dm注册ID

我阅读了 Android Cloud to Device Messaging Framework 中的解释当我们的应用程序成功注册到 C2DM 服务器后我们会收到一个注册 ID 注册 ID 一直有效直到应用程序明确取消注册或者直到
软键盘不存在，无法隐藏键盘 - Appium android

我收到以下异常 org openqa selenium WebDriverException An unknown server side error occurred while processing the command Origin
Postgres UTF-8 字符排序

我正在构建一个小型应用程序其中包含数据库中的世界语单词因此我有 apelojn 和 brakhorlo o 等带有特殊字符的单词使用 PostgreSQL 9 4 4 我有一个words具有以下架构的表 lingvoj dev d

Postgres UTF-8 字符排序

Postgres UTF-8 字符排序 的相关文章

随机推荐

热门标签

Postgres UTF-8 字符排序的相关文章