在 C 中使用 getchar() 退格和多字节字符

2024-02-02

我正在阅读 BeeJ 的 C 编程指南并复制了他的 readline() 函数，该函数从 stdin 读取一行。由于它的实现方式，它在读取多字节字符时没有问题，因为它根据接收到的字节总数重新分配空间，因此，它在处理 unicode 输入时没有问题。这是一个包含以下功能的程序：

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

#define printPrompt printf("db > ")

/* The readLine function, allocates memory for a short string and
** reads characters into it. When the string's size limit is met,
** the same memory block is reallocated, but twice the size.
** Shamelessly stolen from BeeJ's guide to C programming |=
*/ 

char* read_line(void) {
    int i = 0; /* Position of the current character */
    int linbuf = 4; /* Size of our line in memory, will be
    duplicated once the line length surpasses it */
    char* lin; /* The pointer value to our line */
    int c; /* The value we'll use to accept characters */

    if(  !(lin = malloc( linbuf*sizeof(char)))  )
        return NULL;

    while( c = getchar(), c != '\n' && c != EOF ) {
        /* Check if the amount of bytes accepted has surpassed the
         * amount of memory we've allocated so far */
        if(i == linbuf - 1) {
            /* If it did, reallocate double the space */
            linbuf *= 2;
            char* tmpbuf = realloc(lin, linbuf);
            /* If the space couldn't have been allocated then we'd
             * run out of memory. Delete everything and abort. */
            if(tmpbuf == NULL) {
                free(tmpbuf);
                return NULL;
            }
            /* If we've arrived here that means there were no
             * problems, so we'll assign the newly reallocated
             * memory to "lin" */
            lin = tmpbuf;
        }
        /* Add the new character to our allocated space */
        lin[i++] = c;
    }
    /* If we've received an EOF signal after having read 0
     * characters, we'd like to delete our allocated memory and
     * return a NULL */
    if(c == EOF && i == 0) {
        free(lin);
        return NULL;
    }
    /* Here we'll shrink the allocated memory to perfectly fit our
     * string */
    if(i < linbuf - 1) {
        char* tmpbuf = realloc(lin, i + 1);
        if(tmpbuf != NULL)
            lin = tmpbuf;
    }
    /* Here we'll terminate the string */
    lin[i] = '\0';

    /* Finally, we'll return it */
    return lin;
}

int main(int argc, char* argv[]) {
    char* hey = read_line();
    printf("%s\n", hey);
    return 0;
}

输入为
Hello, World! (:
会导致输出
Hello, World! (:

多字节字符的输入，例如
שלום, עולם! (:
将导致正确的输出
שלום, עולם! (:

但是，如果我按退格键，只会删除一个字节字符，导致输出乱码；输入（退格标记为 \b）：
שיהיה לכם בוקר טוב\b\b\b\b\b\b\b\bערב טוב
这应该最终是：
שיהיה לכם ערב טוב
实际上最终是：
�שיהיה לכם בוק�ערב טוב

我的计算机运行 Void Linux 的 Musl-libc 版本，我使用 tcc 和 gcc 编译该程序，两者都产生相同的结果。

这个问题是否与我的 libc、我的终端（suckless st）、我的内核有关，或者是我在代码中缺少的东西？无论发生什么情况，我有什么办法可以处理它，最好不使用任何外部库，例如 ICU 或你有什么？

“有什么方法可以在不使用任何外部库的情况下处理它[...]”答案是否定的。除非您准备自己编写一个大型且复杂的库，否则就是这样。

对于外部库，这很简单：

sudo apt install libreadline-dev # no idea how to say that in Void

    #include <stdio.h>
    #include <readline/readline.h>
    #include <readline/history.h> // optional, to enable line history

    int main()
    {
        using_history(); // optional
        char* s;
        while ((s = readline("Type something > ")))
        {
            printf("You have typed: %s\n", s);
            add_history(s);
        }
        printf ("Bye!\n");
    }

有了这个，您可以免费获得很多好东西，包括完整的 Unicode 感知行编辑、可编程键绑定和输入历史记录。

Edit在我第一次检查的机器上，您的程序的行为就像您所描述的那样。但在另一台机器上，也就是我的家庭桌面上，它按预期工作，根本没有奇怪的退格行为。我检查了 X11 终端和文本 linux tty。所以我想毕竟有一些内核和/或终端。

稍后编辑有一个stty控制此行为的设置，至少对于 UTF-8 而言。

stty iutf8

并且您的程序应该按预期运行，不需要大型的胖库。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在 C 中使用 getchar() 退格和多字节字符的相关文章

模板类包装任意类型/非类型模板类

假设我有一个模板类base和一个班级wrapper其中包含一个实例化成员base 我想定义班级wrapper这样它依赖于模板参数包该参数包只是传递给实例化成员base 例如考虑下面的代码它工作得很好 include
C#中如何检测字符串是否为货币

通常当我需要转换时currency string 如 1200 55 z 或 1 249 到十进制值我这样做 if currencyString Contains z decimal value Decimal Parse dataToCh
如何向 UWP 项目添加 .NET dll 引用？

我有几个适用于 NETv4 x 的 NET dll 项目我将版本更改为 4 6 1 并重新构建没有出现问题当我尝试从 UWP 项目向它们添加引用时出现错误项目的目标是 NETCore 而文件引用的目标是 NET框架这不是受支持的
如何从当前 .NET 表单/应用程序发送密钥 F12

我非常确定以下按钮激活的表单代码应该在我的 C 应用程序中引发 Control F12 SendKeys F12 但它似乎并没有继续进入 Windows shell 并激活另一个正在侦听它的程序我的键盘可以用看起来发送键在某处被拦截并
测试 hdf5/c++ 中的组是否存在

我正在打开一个现有的 HDF5 文件来附加数据我想向那个叫做的小组保证 A存在以供后续访问我正在寻找一种简单的方法来创建 A有条件地如果不存在则创建并返回新组或者返回现有组一种方法是测试 A存在我怎样才能高效地做到这一点根据
我应该在单元测试中使用 AutoMapper 吗？

我正在为 ASP NET MVC 控制器方法编写单元测试这些控制器依赖于IMapper 我创建的用于抽象 AutoMapper 的接口使用 Castle Windsor 通过构造函数注入传入动作方法使用IMapper从领域对象映射到
阅读 Stack Overflow RSS 源

我正在尝试获取未回答问题的列表the feed https stackoverflow com feeds 但我在阅读时遇到困难 const string RECENT QUESTIONS https stackoverflow com f
使用 VSTO 更改 Outlook 设置

我刚刚花了大约 4 个小时试图弄清楚如何以编程方式检索设置 Microsoft Outlook 2010 的 Outlook 设置我所说的设置是指文件选项邮件下的设置我想做的是检索用户设置的设置列表自动化我们每天需要在某些消
Qt中正确的线程方式

我的图像加载非常耗时图像很大并且在加载时也完成了一些操作我不想阻止应用程序 GUI 我的想法是在另一个线程中加载图像发出图像已加载的信号然后用该图像重绘视图我的做法 void Window loadImage ImageLoad
根据拦截和返回值自动重试客户端WCF调用

是否可以拦截 WCF 调用的结果并重试该操作例如操作的返回值可能包含状态代码指示我传递到原始调用的会话令牌已过期在这种情况下我可以检索新的会话令牌并使用新的会话令牌重试调用是否可以通过使用 WCF 拦截返回值检查它然后以对操
防止复制构造和返回值引用的分配

如果我有一个函数返回对类实例的引用但我无法控制其源比如说list
CMake - 将预构建库链接到 C# 项目

我正在使用 CMake 构建 C 库该库依赖于已构建的库 dll 我似乎无法让图书馆链接到我的图书馆我尝试过使用target link libraries mylib external lib 我也尝试过暴力破解 reference e
如何在不使用reinterpret_cast的情况下使用dlsym()加载函数？

我正在尝试使用 clang tidy 来强制执行 C 核心指南虽然它确实有很多有效点但有一件事我无法真正解决 dlsym 返回一个void 我需要以某种方式将其转换为正确的函数指针为此我使用reinterpret cast 由于指南
for 循环 - 没有效果的语句

由于某种原因我收到错误 statement with no effect关于这个声明 for j idx j lt iter j increment printf from loop idx i int idx punc ctxt j 你
在生产者-消费者情况下使用条件变量

我正在尝试了解条件变量以及如何在生产者消费者情况下使用它我有一个队列其中一个线程将数字推入队列而另一个线程从队列中弹出数字当生产线程放置一些数据时我想使用条件变量向消费线程发出信号问题是有时或大多数时候它只将最多两个项目推
C#：如何使用 SHOpenFolderAndSelectItems [重复]

这个问题在这里已经有答案了有人可以举例说明如何使用 shell 函数吗SH打开文件夹并选择项目 http msdn microsoft com en us library bb762232 VS 85 aspx来自 C 我不太明白如何使用
在 MVVM 中，可以在视图后面的代码中访问 ViewModel 吗？

在 MVVM 模式中是否可以接受甚至可以访问视图代码后面的 ViewModel 属性我有一个可观察的集合它填充在 ViewModel 中我需要在视图中使用它来绑定到带有链接列表的无限滚动条 IE private LinkedList
从 C# 中的 .NET SecureString 读取单个字符？

WPF 的PasswordBox 返回一个SecureString 它对窥探者隐藏密码问题是你最终必须获得密码的值而我在网上找到的建议都涉及将值复制到字符串中这会让你回到窥探者的问题 IntPtr bstr Marshal Secur
如何使复选框不可选择？

我想知道你是怎么做的CheckBox在c 中无法选择我认为这会是类似 SetSelectable false 之类的东西但我似乎看不到该方法 I found CanSelect但这似乎是只读属性您可以设置自动检查 http msdn
ASP.NET Core：会话 ID 始终变化

今天启动了一个全新的 ASP NET Core 网站按照说明添加会话我们在索引页上打印出会话 ID 它始终是唯一的我认为这可能是 cookie 合规性所以我在 Chrome 的高级设置和调试器中删除了所有 cookie 但横幅不会再

随机推荐

为什么在body上使用BFC功能时无法清除浮动？

在其他标签上使用BFC可以清除浮动为什么body不可用果然在body上添加overflow hidden 形成BFC 可以达到清除浮动的效果但是事实并非如此 div f float left width 100px height
Common Lisp 中的动态和词法变量

我正在读 Peter Seibel 的 Practical Common Lisp 一书在第 6 章变量部分中词法变量和闭包和动态又名特殊变量 http www gigamonkeys com book variables h
我可以在drawRect方法之外绘制圆形、矩形、直线等形状吗

我可以在外面画圆形矩形直线等形状吗drawRect方法使用 CGContextRef contextRef UIGraphicsGetCurrentContext 还是必须在内部使用它drawRect仅有的请帮助我让我知道如何在外面
通知通道在奥利奥中播放错误的声音

我在运行 Android Oreo 的设备中遇到了NotificationChannel 声音的奇怪问题假设我的项目原始目录中有两个声音文件 a mp3 c mp3 然后在第一次安装应用程序时我使用它们的 uri 例如将这些声音分配
dojo 1.7 AMD 框架有什么好处？

我一直在阅读有关 dojo 1 7 加载程序如何使用 AMD API 框架的内容here http dojotoolkit org blog learn more about amd and here too http livedocs d
ASP.Net MVC ModelState / Html.TextBox 回发问题

我在尝试发布的表单中出现了一个问题在表单无法验证的情况下我采用标准的调用路线ModelState AddModelError 然后返回一个查看结果问题是 HTML 帮助程序应该在渲染时获取发布的值我注意到我的文本字段只有在我将它们包
将元数据添加到 XSD 定义

不太熟悉 XSD 我想知道是否可以执行以下操作
RDBMS 和 ORDBMS 之间的区别

当我在 PostgreSQL 上阅读有关 PostgreSQL 的内容时就发生了这种情况 wiki https en wikipedia org wiki PostgreSQL页面它将自己称为 ORDBMS 我一直都知道 Microso
将 Elasticsearch 日期范围查询与空值结合起来

我想使用日期范围查询如下所示 range deadline gte 2016 12 14 我的索引也包含截止日期的空值我想在搜索结果中获取那些空日期文档以及范围内的日期如何将日期范围与弹性 5 x 中的 must not 存在查询结合
jQuery - css('border-width') 在 Firefox 上返回为空字符串，但在 Chrome 上则不然 [重复]

这个问题在这里已经有答案了我正在尝试使用 jQuery CSS 调试跨浏览器问题我正在尝试获取类的边框宽度该类在 CSS 中设置如下 mod button position relative color fff border colo
隐藏输入值更改的 jQuery 事件

我隐藏了这个输入
如何在Spring项目中使用属性来配置log4j.xml

我的 Spring 项目中有多个属性文件 spring 上下文加载这些属性并以方便的方式处理属性重写有没有办法获取我的 Spring 配置 XML 文件可用的属性即 myprop 并在我的中以类似的方式使用它们log4j xml文件我
C# params object[] 奇怪的行为

考虑这段代码 namespace ConsoleApplication1 class Program static void Main string args string strings new string Test1 Test2 Te
使用 Microsoft Graph 创建日历事件：ErrorAccessDenied

我一直在使用curl 和Outlook REST API v1 0 带有基本身份验证在Outlook 日历中创建日历事件基本身份验证很快就会被弃用因此我现在尝试使用 OAuth 2 迁移到 Microsoft Graph v1 0 我
如何查看给定 CloudFormation 资源上的 DeletionPolicy？

我创建了一个 CloudFormation 堆栈然后使用变更集更新它以将 DeletionPolicy 更改为 Retain 有没有办法查看实时堆栈中资源的 DeletionPolicy 以判断其设置是否正确描述堆栈资源 https d
使用带有多个扩展名的结尾

我正在尝试检测带有扩展名列表的文件 ext 3g2 3gp asf asx avi flv m2ts mkv mov mp4 mpg mpeg rm swf vob wmv if file endswith ext how to use t
无法使用 Tensorflow.js Predict() 函数

我已经训练了自己的图形模型我想在浏览器上使用它这是我的代码 async function predict const model await tf loadGraphModel model model json let img docu
根据 thymeleaf 中的其他变量选择上下文变量属性（动态）

我是使用 Thymeleaf 的初学者我有一个设置为上下文变量的对象 ctx setVariable name myObject 这个对象有几个属性但我不能只使用选择它们名称 property1 subproperty1 因为在某些时
HTMLUnit/Groovy 中给定元素的 XPath_relative_？

我想计算 XPath 表达式relative对给定的元素我一直在这里阅读 http www w3schools com xpath default asp http www w3schools com xpath default asp
在 C 中使用 getchar() 退格和多字节字符

我正在阅读 BeeJ 的 C 编程指南并复制了他的 readline 函数该函数从 stdin 读取一行由于它的实现方式它在读取多字节字符时没有问题因为它根据接收到的字节总数重新分配空间因此它在处理 unicode 输入时没有问

在 C 中使用 getchar() 退格和多字节字符

在 C 中使用 getchar() 退格和多字节字符 的相关文章

随机推荐

热门标签

在 C 中使用 getchar() 退格和多字节字符的相关文章