Windows 上的 Data.ByteString.Lazy.Char8 换行符转换——文档是否具有误导性？

2024-02-14

我对字节串库中的 Data.ByteString.Lazy.Char8 库有疑问。具体来说，我的问题涉及 readFile 函数，其记录如下：

将整个文件延迟读取到 ByteString 中。在 Windows 上使用“文本模式”来解释换行符

我对这个函数将“使用 Windows 上的文本模式来解释换行符”的说法感兴趣。该函数的源码如下：

-- | Read an entire file /lazily/ into a 'ByteString'. Use 'text mode'
-- on Windows to interpret newlines
readFile :: FilePath -> IO ByteString
readFile f = openFile f ReadMode >>= hGetContents

我们看到，从某种意义上说，文档中的声明是完全正确的：openFile函数（相对于openBinaryFile) 已被使用，因此将为文件启用换行转换。

But，然后该文件将被传递给 hGetContents。这将调用Data.ByteString.hGetNonBlocking（见源代码here http://hackage.haskell.org/packages/archive/bytestring/0.9.1.5/doc/html/src/Data-ByteString-Lazy.html#hGetContents and here http://hackage.haskell.org/packages/archive/bytestring/0.9.1.5/doc/html/src/Data-ByteString-Lazy.html#hGetContentsN），这意味着它是一个非阻塞版本Data.ByteString.hGet (see 文档 http://hackage.haskell.org/packages/archive/bytestring/0.9.1.7/doc/html/Data-ByteString.html#v%3ahGetNonBlocking）；和（最后）Data.ByteString.hGet calls GHC.IO.Handle.hGetBuf (see 文档 http://hackage.haskell.org/packages/archive/bytestring/0.9.1.7/doc/html/Data-ByteString.html#v%3ahGet or 源代码 http://hackage.haskell.org/packages/archive/bytestring/0.9.1.7/doc/html/src/Data-ByteString.html#hGet）。这个函数的文档 http://hackage.haskell.org/packages/archive/base/4.2.0.2/doc/html/GHC-IO-Handle.html#v%3ahGetBuf说

hGetBuf 忽略 Handle 当前使用的任何 TextEncoding，并直接从底层 IO 设备读取字节。

这表明我们使用打开文件的事实readFile而不是readBinaryFile是无关紧要的：尽管问题开头提到的文档中存在声明，但数据将在不转换换行符的情况下被读取。

那么，问题的核心是： 1.我错过了什么吗？ “Data.ByteString.Lazy.Char8.readFile 在 Windows 上使用文本模式来解释换行符”这一说法是否正确？或者文档只是误导性的？

附：测试还表明，这个函数（至少当我简单地使用它时）在 Windows 上不会进行换行转换。

FWIW，软件包维护者 Duncan Coutts，回应了一些非常有帮助和启发性的评论。我已经请求他允许将它们张贴在这里，但在此期间，这里有一个释义。

基本点是文档曾经是正确的，但现在可能不正确了。特别是，当人们在 Windows 中打开文件时，操作系统本身允许您以“文本”或“二进制”模式打开它。和...之间的不同readFile and readBinaryFile used即在操作系统的文本模式下打开文件，在 Win32 上以二进制模式打开文件。（它们在 POSIX 上都会做同样的事情。）重要的是，如果您以操作系统的二进制模式打开一个文件，就会有no way您可以从文件中读取而无需换行符转换：它发生了always.

当事情像这样设置时，问题中提到的文档是正确的——Data.ByteString.Lazy.Char8.readFile会使用System.IO.readFile;这将告诉操作系统打开文件“文本”，并且换行符将被转换，即使hGetBuf正在被使用。

然后，后来，哈斯克尔的System.IO进行了改进，使其对换行符的处理更加灵活——特别是允许在 POSIX 操作系统上运行 Haskell 版本，其中没有使用操作系统内置的换行符读取文件的功能，但支持使用 Windows 样式换行符读取文件;或者更准确地说，支持Python风格“通用”换行符转换 http://www.python.org/dev/peps/pep-0278/在两个操作系统上。这意味着：

换行符的处理被引入 Haskell 库；
文件是always在 Windows 上以二进制模式打开，无论您使用readFile or readBinaryFile; and
相反，选择readFile and readBinaryFile会影响是否System.IO的库代码设置为nativeNewlineMode or noNewlineTranslation。这将导致 Haskell 库转换为您执行适当的换行符转换。您现在还可以选择询问universalNewlineMode.

大约在同一时间，Haskell 获得了内置的适当编码支持System.IO（而不是假设输入为 latin-1 并简单地将输出字符截断为前 8 位）。总的来说，这是一件好事。

但是，至关重要的是，新的换行符转换现在内置于库中，永远不会影响什么hPutBuf does---大概是因为人们建造新的System.IO功能认为，如果以二进制方式读取罚款，任何插入自身的换行转换都可能是not程序员想要的，即是一个错误。事实上，99% 的情况可能都是如此：但在这种情况下，它会导致上述问题:-)

邓肯说，这些文档可能会发生变化，以在该库的未来版本中反映这个美丽的新世界。在过渡期，这个问题的另一个答案中列出了一个解决方法。 https://stackoverflow.com/a/6860159/194894

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Haskell

Windows 上的 Data.ByteString.Lazy.Char8 换行符转换——文档是否具有误导性？的相关文章

带有 RankNTypes 扩展的奇怪类型推断

我正在尝试在 Haskell 中尝试 System F 类型并通过以下方式实现了自然数的 Church 编码type 当加载这段代码时 OPTIONS GHC Wall LANGUAGE RankNTypes type CNat fora
检查对以下内容的理解：“变量”与“变量” “价值”、“功能”与“抽象”

这个问题是后续问题this one https stackoverflow com questions 25327705 is function a sort of variable 25329157 25329157在学习 Haskell
管道：多个流消费者

我编写了一个程序来计算语料库中 NGram 的频率我已经有一个函数它消耗一串令牌并生成一个订单的 NGram ngram Monad m gt Int gt Conduit t m t trigrams ngram 3 countFre
约束包如何工作？

背后的想法数据约束 Forall http hackage haskell org packages archive constraints 0 3 2 doc html src Data Constraint Forall html据我
如何在haskell中用另一个字符串替换一个字符串

我想用不同的字符串替换输入文件中的字符串我正在寻找一种方法但似乎我只能逐个字符地更改字符串例如在我下面的代码中 replace String gt String replace replace x xs if x then y rep
在 Haskell 中获取玫瑰树的根

最近我开始学习 Haskell 并在以下练习中遇到困难 Write functions root Rose a gt a and children Rose a gt Rose a that return the value stored
Control.Parallel.Strategies 中 Eval 的绑定运算符如何严格评估其参数？

Control Parallel Strategies 的源代码 http hackage haskell org packages archive parallel 3 1 0 1 doc html src Control Paralle
函数式语言中的部分求值和函数内联有什么区别？

我知道函数内联就是用函数定义代替函数调用部分评估是在编译时评估程序的已知静态部分在 C 等命令式语言中两者之间存在区别其中运算符与函数不同但是在像 Haskell 这样的函数式语言其中运算符也是函数中两者之间有什么区
Parsec.Expr 具有不同优先级的重复前缀

Parsec Expr buildExpressionParser 的文档说相同优先级的前缀和后缀运算符只能出现一次即如果为前缀否定则不允许使用 2 但是我想解析这样的字符串具体来说考虑以下语法 sentence ident
我可以从 GHCi 中找到 GHC 版本吗？

gt 我在里面输入什么GHCi发现它正在使用哪个 GHC 版本 gt import System Info gt browse arch String compilerName String compilerVersion Data Ver
这是 unsafeCoerce 的安全使用吗？

我遇到的情况是我目前正在使用极其可怕的函数 unsafeCoerce 幸运的是这并不是为了任何重要的事情但我想知道这是否是该函数的安全使用或者是否有其他方法可以解决其他人知道的这个特定问题我的代码类似于以下内容 data Toke
这个实例有什么问题：ArrowApply Automaton？

我希望 Automaton 有实例 ArrowApply 但 Control Arrow Transformer Automaton 没有我认为下面的代码会表现良好 data Automaton b c Auto runAuto b gt
如何测试自定义 StateT 的 Monad 实例？

我正在学习 Monad Transformers 其中一个练习要求实现 Monad 实例StateT 我想使用以下方法测试我的实现是否符合 Monad 法则validity https github com NorfairKing vali
来自数据类型的 Haskell 随机数

我对 Haskell 还很陌生我有一个数据类型 data Sentence Prop Int No Sentence And Sentence Or Sentence deriving Eq 我已经为它写了一个 Show 实例然而无论
Haskell 中的内部爆炸模式是否总是强制使用外部构造函数？

在 Haskell 中是否存在对于数据类型 LANGUAGE BangPatterns import Control DeepSeq data D D Int 实例 instance NFData D where rnf D 与具有另一个
不同类型的列表？

data Plane Plane point Point normal Vector Double data Sphere Sphere center Point radius Double class Shape s where inte
Cabal：使用源代码构建目录

我有一个src目录在这个目录中我有Main hs文件和Test目录在里面Test我有的目录Test hs模块我需要用 cabal 来编译它在我的阴谋集团文件中我有 Executable main hs or lhs file co
Haskell/Idris 中的开放类型级别证明

在 Idris Haskell 中可以通过注释类型并使用 GADT 构造函数例如使用 Vect 来证明数据的属性但这需要将属性硬编码到类型中例如 Vect 必须是与 List 不同的类型是否有可能拥有具有开放属性集的类型例如同时
承诺的反面是什么？

承诺代表将来可能可用或无法实现的值我正在寻找的是一种数据类型它表示将来可能变得不可用的可用值可能是由于错误 Promise a b TransitionFromTo
HASKELL：解决河内塔

下面的代码解决了 hanoi 使用预定义函数 moveLOD swapLOI 和 swapLID 返回移动列表的问题 MoveLOD 将 1 个圆盘从第一个位置移动到三元组第三个位置中的第三个销钉此外包含有关运动信息的字符串会堆积在字符

随机推荐

我应该对 UDP 使用（非阻塞）NIO 吗？

根据这个帖子 https stackoverflow com questions 569555 non blocking udp i o vs blocking udp i o in java UDP 只是不阻塞使用非阻塞 NIO AP
如何通过 UTC 偏移量确定时区？

我有一个场景我有一个时区偏移以分钟为单位需要确定它的时区我知道所有数据都不可用例如可能有几个时区的偏移量为 240 分钟但最佳猜测是可以接受的我的第一遍看起来像这样 foreach var info in TimeZon
无法让 Django/Postgres 应用程序设置在 Heroku 上运行

我正在使用 Two Scoops of Django 模板制作一个 Django 应用程序收到此 Heroku 错误我的 Postgres 生产设置是否已关闭操作错误无法连接到服务器连接被拒绝服务器是否在主机 localhost
如何向弹出窗口添加页脚并使内容可滚动？使用 Twitter 引导程序 3

这是图片我必须做的如何向弹出窗口添加页脚并使内容可滚动使用 Twitter 引导程序 3 要创建带页脚的弹出窗口您必须更改弹出窗口template并添加一些 CSS 来设置页脚的样式在这里我还在页脚中放置了一个按钮正如您在绘图
毛里求斯国旗问题

我已经为该问题制定了解决方案荷兰国旗问题 http en wikipedia org wiki Dutch national flag problem已经但这一次我想尝试一些更困难的事情毛里求斯国旗问题 4 种颜色而不是 3 种对
用逗号格式化json文件？

我有一个 json 文件 bla bla bla bla bla bla bla bla 如何将它们格式化为有效的 json 类型例如 bla bla bla bla bla bla bla bla bla bla 每个后面插入逗号除了
Python中如何查找引发异常的位置

如何确定在哪个函数中引发了异常例如存在两个函数 foo 和 bar 在 foo 中异常将随机引发 import random def foo if random randint 1 10 2 raise Exception bar de
在doctrine2中是否可以有一个不是主键的自动增量列？

在doctrine2中我有一个实体它有一个从Web服务提供的主键并且还有一个应该是自动增量的索引我可以在mysql中手动设置但无法在doctrine2中进行此设置 I used columnDefinition of INT AU
Windbg lm：“延迟”是什么意思？

我正在 WinDbg 中调试 NET 2 0 程序集的故障转储文件当我在 WinDbg 中输入 lm 时我会得到一长串已加载的模块如下所示 723c0000 72950000 mscorwks deferred 这里的延期是什么意
接口和@RequestBody

我目前正在开发一个项目该项目允许用户通过网络预订在给定时间段内使用所选资源在这个程序中我试图遵循 Spring 的接口编程哲学以及一般的最佳实践因此我尝试在具体类中重复功能的任何地方使用接口我创建的一个接口称为 Bookab
当我从 Process.Start(url) 打开 url 时，c# Google chrome 在某些 PC 上崩溃

在某些 PC 上当我想显示网址时 Google Chrome 会崩溃我用了Process Start url and UseShellExecute true 请注意它在我尝试过的大多数电脑上都能正常工作但在某些电脑上却不能 Chr
使用 requirejs + uglify 限制行长度

我们正在使用requirejs optimize config 在我们的构建脚本中使用 uglify2 来缩小我们的生产 JavaScript 代码我们希望将缩小后的行长度限制为大约 80 个字符这样即使在生产代码中也可以更轻松地调试
Angular 5 中 value 和 ngValue 的区别

今天我意识到 Angular 5 中的反应式表单出现了意外的对我来说行为服务器从应用程序接收到一个值为 null 的字符串而不是我想要的 null 值我做了以下测试 https stackblitz com edit angul
如何减少 androidx.compose.material3.OutlinedTextField 的高度

我在降低高度时遇到困难OutlinedTextField在撰写中我正在尝试在里面做一个搜索栏TopAppBar就像许多谷歌应用程序 Gmail Play Store 中所做的那样我无法在材料3中实现这一点我尝试复制OutlinedTe
Chrome扩展从内容脚本到后台html的sendMessage错误

我刚刚将我的 chrome 扩展更新为 json 版本 2 并尝试让我的扩展再次工作问题是 sendRequest 一路上被贬值了所以我复制代码https developer chrome com extensions messagin
确定 C 可执行文件名称

当我们编译 C 程序时输出存储在 a out 中我们如何将编译后的输出重定向到另一个文件大多数 C 编译器为此提供了一个选项例如 o选项gcc和其他一些 gcc o gentext gentext c cc o mainprog L
如何获取neo4j路径中的最后一个节点？

在这个密码查询中将返回与 STATUS on 属性有关系的节点之间的最长路径但我还想获取路径的最后一个节点 query START n node MATCH p n rels INCLUDE gt m WHERE ALL rel IN
具有负权重的 Dijkstra 算法

我们可以使用具有负权重的 Dijkstra 算法吗 STOP 在你认为哈哈你可以在两点之间无休止地跳跃并获得一条无限便宜的路径之前我更倾向于考虑单向路径其应用是具有点的山区地形显然从高到低并不需要能量事实上它会产生能量因
Facebook 身份验证对话框：开发人员关于使用“显示”类型“弹出窗口”的警告

从今天开始我们在身份验证对话框中收到开发人员警告其中包含以下消息您在大型浏览器窗口或选项卡中使用弹出窗口显示类型为了获得更好的用户体验请使用我们的 JavaScript SDK 显示此对话框而不指定显式显示类型 SDK 将为
Windows 上的 Data.ByteString.Lazy.Char8 换行符转换——文档是否具有误导性？

我对字节串库中的 Data ByteString Lazy Char8 库有疑问具体来说我的问题涉及 readFile 函数其记录如下将整个文件延迟读取到 ByteString 中在 Windows 上使用文本模式来解释换行符

Windows 上的 Data.ByteString.Lazy.Char8 换行符转换——文档是否具有误导性？

Windows 上的 Data.ByteString.Lazy.Char8 换行符转换——文档是否具有误导性？ 的相关文章

随机推荐

热门标签

Windows 上的 Data.ByteString.Lazy.Char8 换行符转换——文档是否具有误导性？的相关文章