0x9d 在什么 8 位字符集中有意义？

2023-11-21

英语的 8 位类似 ASCII 的字符集是什么0x9d有意义吗？我正在清理一些旧的数据文件，偶尔会发现0x9d在其他 ASCII 文本中。（不，这不是 UTF-8。）

它在 Windows-1252 中无效。 Python“latin-1”编解码器将其转换为 Unicode 0x9D，即《操作系统命令》。这没什么意义。在 Unicode 中，您会得到一个带有 [009d] 的框。（在 Python 中，您可以将任何内容转换为 Latin-1 而不会引发错误，但这并不意味着这样做是有意义的。）

示例，使用 Python 类型转义，来自我正在清理的混乱数据库，该数据库组合了来自多个来源的文本：

Guitar Pro, JamPlay, RedBana\\\'s Audition,\x9d Doppleganger\x99s The Lounge\x9d or Heatwave Interactive\x99s Platinum Life Country,\\"

for example \\"I\\\'ve seen the bull run in Pamplona, Spain\x9d.\\" Everything

Netwise Depot is  a \\"One Stop Web Shop\\"\x9d that provides sustainable \\"green\\"\x9d living

are looking for a \\"Do It for Me\\"\x9d solution

从上下文来看，我怀疑是 ™ 或 ®。但是什么 8 位代码有这些呢？

这是一个完全疯狂的假设：

一些之前处理此数据的（确实损坏的）系统尝试将每个字符写入 UTF-8，但实际上只写入每个序列的最后一个字节（也许它在某处有一个奇怪的单字节长缓冲区）。或者，过去它是 UTF-8 格式的，但有人以不同的编码查看它，进行了搜索和替换以删除字节 0xE2 0x80，因为它们显然“不属于”并且没有意识到剩余的“ “特殊角色”也不是他们想要的。

当然，ASCII 会被传递，因为它的 UTF-8 编码将是一个字节长。

“右单引号”(U+2019)’以 UTF-8 编码，字节为 0xE2 0x80 0x99。你所拥有的地方\x99s这就是让我走上这条路的原因，因为在流行的文字处理软件中，s 之前的撇号通常会被翻译为右弯引号。如果仅保存字符的最后一个字节，则那里只会有 0x99。

“右双引号”(U+201D)”以 UTF-8 编码，字节为 0xE2 0x80 0x9D。文本中的 0x9D 通常位于双引号字符串的末尾。而且，它通常就在常规直道旁边"双引号。我想知道是否有人尝试对数据进行某种事先清理，并设法放回结束引用，但将“奇怪的”0x9D 留在了那里。

正如我所说，这是一个疯狂的假设，但如果这是来自各种旧系统的数据的集合，那么很难知道它到底发生了什么。 UTF-8 的最后一个字节只是我能找到的最接近的“正常”英语编码，它在英语文本中具有合理的内容，并且包含您正在寻找的字节。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

0x9d 在什么 8 位字符集中有意义？的相关文章

Tensorflow GPU 设置：PyCharm 上的 CUDA 错误

我在 Python3 MacOSX El Capitan 上安装了 TF 0 8 当为 TF 运行简单的测试代码时我收到以下消息 ImportError dlopen Library Frameworks Python framework
Angular 5在另一个变量更改时自动更新字符串变量

当另一个变量发生变化时有没有办法更新字符串变量我有一个使用各种变量构建的字符串我使用插值在组件的 html 文件中显示该字符串但是如果变量更改了字符串用于构建自身的变量则该字符串将永远不会更改因为它们不可变唯一的方法是当其他
Anaconda / 求解环境：初始冻结求解失败。使用灵活的求解重试

我尝试安装 anaconda 软件包出现以下消息求解环境初始冻结求解失败使用灵活的解决方案重试解决环境 current repodata json 中的 repodata 失败将使用下一个 repodata 源重试收集包元数据
使用Python下载YouTube视频到某个目录

我已尝试使用以下代码在 YouTube 中下载视频并且它可以正常工作但我想将视频保存在特定位置现在它正在将视频保存在C Users Download 如果我想将视频保存在桌面上我需要对代码进行哪些更改 from future impo
如何删除Python中特定字符之前的所有字符？

我想删除指定字符或字符集之前的所有字符例如 intro lt gt I m Tom 现在我想删除 lt gt before I m 或者更具体地说 I 有什么建议么 Use re sub 只需匹配所有字符即可I然后将匹配的字符替换为I r
Python 单元测试 Google Bigquery

我在对以下代码块进行单元测试时遇到问题 from google cloud import bigquery from google oauth2 import service account def run query query gcp
返回实例的类方法的类型注释

我应该如何注释 classmethod返回一个实例cls 这是一个不好的例子 class Foo object def init self bar str self bar bar classmethod def with stuff ap
如何对 glob.glob 进行数字排序？

我在一个文件夹中有一堆按数字排序的文件当我尝试对 glob glob 进行排序时我从来没有以正确的顺序获得文件文件示例和预期输出排序 folder C Users user Desktop folder 1 sample mp3 C
Dart如何向字符串数字添加逗号

我正在尝试适应这一点在数字字符串中插入逗号 https stackoverflow com questions 721304 insert commas into number string在 Dart 工作但没有运气其中任何一个都不
在查找表中查找字符串值以填充第二个数据帧

我有两个数据框 main df header 1 0 value 1 1 value 2 2 value 3 3 value 1 和一个查找数据框lookup df header 1 header 2 0 value 1 lookup va
Python 是否有相当于 R 的sample() 函数？

我想知道Python是否有相当于sample R 中的函数 The sample https stat ethz ch R manual R devel library base html sample html函数使用带替换或不带替换的方
导入不起作用

我有两个文件说a py and b py 在 a py 中我们的确是 import xxx from b import 在 b py 中我们有一个函数需要module xxx 现在当函数在b py被调用自a py它找不到模块xxx 为什么
在 matplotlib 中使用轴绘制带有子点的图形时出现错误

我尝试使用下面的代码绘制子图但是我得到了 AttributeError numpy ndarray object has no attribute boxplot 但改变plt subplots 1 2 它正在用indexerror绘制箱
使用OIL自动旋转手机和加速度计拍摄的照片

我在网络应用程序中使用 Django PIL Amazon boto 用户发送图片然后 Web 应用程序显示它大多数情况下人们会发送用手机拍摄的照片有时图像以错误的方向显示有没有办法使用 PIL 或 Django 的 Image
PHP 如何使用比较运算符比较字符串？

我正在使用比较运算符来比较字符串我需要对以下两个比较及其结果进行某种解释 if ai gt i echo Yes else echo No output No 为什么这些会这样输出 if ia gt i echo Yes else ech
Python libusb pyusb“mach-o，但架构错误”

我在使用 pyusb 模块时遇到一些问题我已将问题范围缩小到一行并创建了一个小示例脚本来复制错误 usr bin env python This module was created to isolate the problem in
如何从本地计算机或网络资源在 Jupyter Notebook 中嵌入图像或图片？

我想将图像包含在 jupyter 笔记本中如果我执行以下操作它会起作用 from IPython display import Image Image img picture png 但我想将图像包含在 markdown 单元格中并且
如何在 Apache Airflow 中混合使用 Celery Executor 和 Kubernetes Executor？

我有多个使用 Celery Executor 的 dag 但我希望使用 Kubernetes Executor 运行一个特定的 dag 我无法推断出一种良好且可靠的方法来实现这一目标我有一个airflow cfg我在其中声明了Celery
真实文件对象比 StringIO 和 cStringIO 慢？

StringIO其代码中有以下注释 Notes Using a real file is often faster but less convenient There s also a much faster implementation
使用 NumPy 函数计算 Pandas 的加权平均值

假设我们有一个像这样的 pandas 数据框 a b id 36 25 2 40 25 3 46 23 2 40 22 5 42 20 5 56 39 3 我想执行一个操作 a div b 然后按 id 分组最后使用 a 作为权重计算加权

随机推荐

如何在共享主机环境中安装phpMailer？

如何安装phpMailer在共享托管环境中我需要用它来验证电子邮件和更改用户的密码你可以在这里下载 https github com PHPMailer PHPMailer 将文件夹上传到您的服务器并包含以下行的主文件之后您将需要一
在ubuntu中安装octave包

任何人都可以帮助我解决这个错误吗 octave 4 gt pkg install signal 1 2 0 tar gz error the following dependencies where unsatisfied signal n
ifstream::read 不附加 '\0'

ifstream read只是读n字节放入缓冲区但不追加 0 在缓冲区的末尾对吧那么当我使用缓冲区时它如何知道缓冲区的结尾呢我应该手动附加一个 0 在缓冲区的末尾 The ifstream用于读取文件二进制文件或文本处理二进制
在 SimpleXML for PHP 中删除具有特定属性的子项

我有几个具有不同属性的相同元素我正在使用 SimpleXML 访问这些元素
运行时 Autofac 绑定

我目前使用 Autofac 进行简单的构造函数注入没有任何问题然而我想知道的是如何在运行时解决依赖关系下面的示例显示了导出文档的多种方式通过简单的构造函数注入 IExport 的具体实现在运行时得到解决但是需要做的是解析下拉列表
sklearn：如何加速矢量化器（例如Tfidfvectorizer）

在彻底分析我的程序之后我已经能够确定它被矢量化器减慢了我正在处理文本数据两行简单的 tfidf 一元向量化占用了代码执行总时间的 99 2 这是一个可运行的示例这会将 3mb 的训练文件下载到您的磁盘省略 urllib 部分以在您
将参数从jsp传递到Spring Controller方法

我正在使用 Hibernate 的 Spring MVC 应用程序中工作在 JSP 页面中我有一个函数列出数据库中存储的值当前是所有值我写了一个方法其中列表仅限于 JSP 文件中传递的 ID 我的 HQL 查询工作正常所以我知道
值reduceByKey不是org.apache.spark.rdd.RDD的成员

很伤心我的spark版本是2 1 1 Scala版本是2 11 import org apache spark SparkContext import com mufu wcsa component dimension Dimension
jQuery 滚动到页面底部

当您单击某个链接时我使用以下内容滚动到页面顶部 myLinkToTop click function html body animate scrollTop 0 slow return false 我想创建另一个滚动到页面底部的链接以下
如何选择 maven-gpg-plugin 用于签署工件的 GnuPG 密钥？

我正在使用 maven gpg plugin 来签署 Maven 工件这工作正常但我的 GnuPG 密钥环中有几个密钥并且想要使用与 GnuPG 选择的密钥不同的密钥如果有多个键 GnuPG 如何选择默认键是否可以指定在 ma
Play 2.0 框架，使用带有经过身份验证的请求的 BodyParser

我希望能够在经过身份验证的请求上使用 BodyParser 但如果我的身份验证像 ZenTasks 示例那样设置我很难弄清楚如何做到这一点我的验证方法 def IsAuthenticated f gt String gt Request
我可以将 Eclipse 设置为忽略“未处理的异常类型”吗

是否有可能让 Eclipse 忽略错误未处理的异常类型在我的具体情况下原因是我已经检查过该文件是否存在因此我认为没有理由放入 try catch 语句 file new File filePath if file exists Fi
Ant 替换属性文件中的令牌

我想用 Ant 替换源文件中的标记 some test foo other text 令牌包含在属性文件中例如 foo 1 实际上如果源文件中的标记类似于 foo 或 foo 那么这很容易但我无法替换整个标记 foo 几年前我成功了
如何在python中查找文件系统类型

我正在 python 中寻找一种方法来找出给定路径使用哪种类型的文件系统我想以跨平台的方式做到这一点在linux上我可以抓取输出df T但这不适用于 OSX 或 Windows 请注意不同的平台实际上是不同的 Use lsvfs在 M
我可以将 MySQL 时间戳与日期时间列进行比较吗？是不是很糟糕？

因此我有一个表其中列 ABC 是时间戳 BCD 是日期时间如果我这样做 SELECT FROM myTable WHERE ABC gt BCD 是不是很糟糕会影响性能吗它们在性能方面如何比较是的您可以比较datetime w
ng-class 不会触发自定义指令

我目前正在开发一个滑动菜单指令对于 AngularJS javascript 由三种类型的指令组成每种类型的滑动菜单的指令为简洁起见我只包含左侧滑动菜单一个用于屏幕其余部分的包装器指令 asm包装器和一个控制按钮指令汇编控制目
android 是否有向 Google keep 添加数据的意图

android 是否有向其中添加数据的意图谷歌保留可以通过新的 Intent Intent ACTION SEND 实现有一种技术可以通过编程方式选择适当的应用程序而不是显示可能性测试
Grails GGTS IDE GrailsProcessDiedException：Grails 进程终止

我在 GGTS IDE 上遇到了以下奇怪的异常 Command terminated with an exception org grails ide eclipse longrunning client GrailsProcessDied
C++20 概念：元素可迭代概念

我正在尝试创造一个概念ElementIterable它可以确定类型是否是嵌套范围例如中的元素std vector
0x9d 在什么 8 位字符集中有意义？

英语的 8 位类似 ASCII 的字符集是什么0x9d有意义吗我正在清理一些旧的数据文件偶尔会发现0x9d在其他 ASCII 文本中不这不是 UTF 8 它在 Windows 1252 中无效 Python latin 1 编解码器

0x9d 在什么 8 位字符集中有意义？

0x9d 在什么 8 位字符集中有意义？ 的相关文章

随机推荐

热门标签

0x9d 在什么 8 位字符集中有意义？的相关文章