Perl 中的 Substr，将 utf8 字符切成两半

2024-04-26

我正在尝试解决使用时的问题substr在 Perl v5.8.5 中。这是一个示例字符串：

UTF-8 示例いろはにほ编辑εσκεπάζω ff

if (length($hit->{post_title}) > 60) {
  $hit->{post_title} = substr($hit->{post_title},0,60);
  $hit->{post_title} .= "...";
}

似乎被修剪为：

UTF-8 示例 עץ טוב בגן いろはにほ编辑εσκε�...

在代码中，我看到一条有关宽字符的消息。我想知道是否可能substr不知何故把这个词切成两半？如果我删除substr()代码的一部分，然后字符串显示正常。

我以前从未遇到过 utf8 的情况。我们需要对阿拉伯字符做一些特别的事情吗？

更新：如果我检查前后字符串的长度，似乎确实发生了一些奇怪的事情：

测试：UTF-8 示例 עץ טוב בגן いろはにほ编辑
长度：63 长度：67 后

我只是不确定是什么！ FWIW，我也在脚本的标题中使用它：

use utf8;

Thanks!

通常，我现在已经找到了解决方法。它不是非常漂亮，但似乎有效

use Unicode::String qw(utf8);

$us = utf8($hit->{post_title});
if ($us->length > 30) {
    $hit->{post_title} = $us->substr(0,30);
}

因此，基本上将 utf8 字符串粘贴到 Unicode::String 中，然后如果它超过给定的大小，则将其修剪并传回$hit->{post_title}。它不漂亮，但可以完成工作。

不幸的是，这是一个过时的（2000 年！）软件，所有者（慈善机构）不想升级到更好的论坛软件。我已经尝试说服他一段时间了，但没成功。到了我无法继续为他“更新”的地步，因为即使开箱即用的代码也很混乱。不管怎样，这似乎是一场胜利了:)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

perl

substr

Perl 中的 Substr，将 utf8 字符切成两半的相关文章

如何使可能挂起的分叉进程超时？

我正在编写一个 Perl 脚本它将写入一些输入并将这些输入发送到外部程序该程序挂起的可能性虽小但非零我想将其超时 my pid fork if pid gt 0 eval local SIG ALRM sub die TIMEOUT
生成的 pdf 中的图像损坏了发送到服务器的 pdf

我正在使用 jsPDF 在 Web 应用程序中创建 PDF 文档将该文档发送到 Perl 并让 Perl 通过电子邮件发送它效果很好但是当我将图像添加到 PDF 文档时它不再起作用因为 Adob e Reader 说该文件已损坏
如何在 Perl 中存储伪随机生成器的状态？

有没有办法在 Perl 中存储内置伪随机数生成器的当前状态以便当我的程序再次运行时它可以从停止的地方拾取序列而不是从新序列开始现在我正在存储我所在的位置以及初始种子然后丢弃我已经使用类似以下内容看到的初始段 sub consum
创建新的 Expect 对象时，cgi-perl 文件中出现 Apache [PTY 错误]

我有一个 perl 脚本 usr bin perl w use DateTime use Expect use IO Pty use CGI Fast while q new CGI Fast my ip q gt param ip my
文件类型 .pl 关联并使用 cmd.exe 运行脚本

我创建了一个新的文件类型 pl 资源管理器 gt 工具 gt 文件夹选项 gt 文件类型现在我想创建一个新的操作它将调用 cmd exe 并自动运行 PERL 脚本我不知道在用于执行操作的应用程序下要写什么我必须向 cmd ex
如何使用 Perl 提取 HTML 标题？

有没有办法使用 Perl 提取 HTML 页面标题我知道它可以在表单提交期间作为隐藏变量传递然后以这种方式在 Perl 中检索但我想知道是否有一种方法可以在不提交的情况下执行此操作比如说我有一个这样的 HTML 页面然后在 Pe
使用 CPAN 强制安装模块

我知道通过命令提示符使用 CPAN 来强制安装模块很容易我试图通过脚本实现相同的目标 use CPAN eval use Filesys DiskSpace or do CPAN install Filesys DiskSpace 有
从 Perl 守护程序运行时，为什么 FFMpeg 在五秒后停止？

我用 Perl 编写了一个小守护程序它调用 FFMpeg 对视频进行编码但编码在 5 秒左右后停止我用这段代码来启动它 my t echo ffmpeg command gt gt self gt FFMPEG OUTPUT my l
我应该如何使用 Mojo::UserAgent 处理 HTML META 标记？

我必须处理一些配置错误的 Web 服务器因此我开始处理 HTML 元标记以将信息反馈到 Web 用户代理对象中我尝试了多种方法来做到这一点莫乔利西斯 http mojolicio us并决定在响应中寻找完成事件我的目标是让其余代码
如何指定 Perl 的 Inline::Python 模块正在使用的 Python 版本？

我正在运行 Debian squeeze 和 perl v5 10 1 并且安装了两个版本的 python pyversions i python2 5 python2 6 Python Inline显然使用python2 5 perl u
用 SED 或 PERL 单行匹配并替换多个换行符

我有一个输入 C 文件 myfile c 如下所示 void func foo void func bar supercrazytag 我想使用 shell 命令插入新的函数原型这样输出就变成 void func foo void fun
Perl - 将数组元素句子与变量进行比较

我使用 grep 返回临时F 文件和 arrayWarning 之间不匹配的数组 my c grep map 1 temporaryF arrayWarning c 里面有很多行例如 Sun Sep 30 00 05 55 fibre c
如何将我的包导入分组到单个自定义包中？

通常当我编写 perl 程序时我曾经包含以下包 use strict use warnings use Data Dumper 现在我想像这样我不会为每个程序都包含所有这个包为了那个原因我会将这些全部打包在我自己的包中喜欢跟随 m
如何使用 -fPIC 标志重新编译 libperl.a 目标文件？

当试图修复一些问题时出现了这个问题安装问题 https stackoverflow com q 43191675 2173773 with QtCore4 https metacpan org pod QtCore4 在某一点make尝试运
DBI：在 eval 中引发错误

这个问题参考了池上的评论 But if you re going to put an eval around every statement just use RaiseError gt 0 in this thread https sta
如何在 Perl 中访问名称包含在变量中的常量？

我有一组用 Perl 声明的常量 use constant C1 gt 111 use constant C2 gt 222 use constant C9 gt 999 my which constant C2 我如何构造一个 Perl
Perl 的核心库是如何管理的？

根据我的理解 Perl 传统上只包含核心功能人们安装额外的库来完成各种有用的有时是非常基本的事情但在某些时候 Perl 默认附带了核心库因此您可以使用这些库而无需安装它们来自Python 我很好奇这是如何管理的具体来说图书
从 Perl 脚本 DBI 关闭 MSSQL 服务器

我正在写一个 perl 脚本其中我必须关闭我的 mssql 服务器做一些操作然后我必须重新启动它我知道一种方法是使用 netstat 来停止服务但我不能使用它所以我尝试安装 DBI 和 DBD ODBC 模块我可以通过以下代码
如何有效地计算 Perl 中覆盖给定范围的范围？

我有一个大约 30k 范围的数据库每个范围都作为一对起点和终点给出 12 80 34 60 34 9000 76 743 我想编写一个 Perl 子例程来表示一个范围不是来自数据库并返回数据库中完全包含给定范围的范围数例如如果
Perl Mongo 查找对象 ID

你会认为这是一件简单的事情我有一个集合中的对象 ID 列表我想根据对象 ID 获取单个记录谷歌搜索过但没有任何帮助所以我有对象 ID 5106c7703abc120a04070b34 my client MongoDB Mongo

随机推荐

在 React 组件中使用绝对路径

如何使用根目录中的绝对路径并更改根目录来导入组件 import Modal from project app src Components Modal import Main from Constants 我想要将根目录更改为我可以从 sr
如何通过更新和多重选择将多个输入构建到我闪亮的应用程序中？

我正在构建一个flex dashboard shiny应用程序与datatable并尝试建立两个输入作为此选择datatable每个选项都有一个全部选项第一个问题是如何限制第二个选择 user 通过选择第一选择 team 然后使用这
Javascript 生成器：理解它们

我很确定我对生成器的理解本质上是被破坏的所有在线资源似乎都是冲突的这导致了极其困难和令人困惑的学习体验据我了解 yield关键字使当前正在执行的代码块能够等待一个值而不是抛出要在回调内执行的剩余代码因此正如大多数教程所指出的您可
URI/URL 和 String 有什么区别？

这是出于好奇不需要代码我尝试使用世界上最好的搜索引擎来获取答案但没有发现任何有价值的东西有什么区别URI URL以及表示该 URI URL 的字符串为什么我们必须解析它将字符串解析成什么URI URL对字符串进行不同的处理为什
为什么 Mocha 测试用例应该是无状态的？

这是一个常见的建议即Mocha 测试用例不应共享状态鉴于 Mochas 测试用例执行的强烈顺序性我真的不理解这个建议还有更多我认为这很可疑如果测试用例即使是异步测试用例严格地一个接一个地执行则不存在时间竞争问题或其他不可预
因登录失败 3 次而禁用帐户 [已关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
嵌套 svn 存储库

我在存储库中有一个项目 A 但在该项目中我使用了一个托管在 Google Code 上的库我的问题是有什么办法可以让该库文件挂钩到 Google Code SVN 同时将我的项目放在我的存储库中它是该库的父级这样我就可以在决
玉服务器端传递的变量在浏览器中为空

我有一个奇怪的问题即传递给 jade 的变量在浏览器中为空似乎传递的变量为空但事实并非如此 Nodejs代码整个路由代码 exports sensorsettings function req res if req session
SQL Server 的国家/地区、州列表 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案您好在一个应用程序中我需要列出世界上的所有国家我们选择一个国家则应列出与其对应的所有州如果我选
如何使用从后端检索的字符串作为Angular2中的模板？

在 Angular2 应用程序中我想使用 ajax 从后端检索 html 标签字符串并将其用作 Angular2 中的模板 The str I get from server by ajax is var str
将绘图对象存储在列表中

I asked this https stackoverflow com questions 1816480 generating names iteratively in r for storing plots昨天关于在对象中存储绘图的问
.Net 中的舍入数字到下一个 0.25 [重复]

这个问题在这里已经有答案了如何将小数向上而不是向下舍入为 0 25 1 26 gt 1 50 1 45 gt 1 50 1 15 gt 1 25 1 00 gt 1 00 1 55 gt 1 75 1 77 gt 2 00 我尝试过以
matplotlib 将 x 轴与缩放时自动缩放的 y 轴链接起来

如何创建一堆具有链接共享 x 轴的绘图以便在缩放期间自动缩放所有从属绘图的 y 轴例如 import matplotlib pyplot as plt fig plt figure ax1 fig add subplot 211
Firestore Flutter 选择不等于和不在[重复]中的位置

这个问题在这里已经有答案了是否可以在 flutter firestore 中选择不等于的地方类似于 SQL 的东西 SELECT FROM tbl WHERE id 2 选择不在哪里类似于 SQL 的东西 SELECT FROM t
如何在 Python 中让两只乌龟同时绘图？

如何让两只乌龟同时画画我知道如何让海龟画画以及如何画两只或更多但我不知道如何让它们同时画画请帮忙这是使用计时器事件的简约示例 import turtle t1 turtle Turtle shape turtle t2 turtle
如何获取Android股票投资组合中的Web应用程序每10秒NSE市场的股票价格？

我正在开发股票投资组合的 Android 项目我想获取每 10 秒运行股票市场的股票价格以便我可以直接通过 Android 手机进行交易所以如果你知道的话请帮助我你的问题有很多变量您需要以多快的速度访问库存数据需要有多准确您正
独特的周期性工作在一段时间后停止执行

我在我的应用程序中使用 WorkManager API 实现了独特的定期工作该工作必须每 30 分钟检查一次在线资源并在有未读通知时显示通知是的我需要定期工作因为资源是 IMAP 服务器因此我无法使用 FCM 通知然而正如我
NetBeans 无法在 Maven Web 应用程序上运行 package.json

我使用 NetBeans 8 2 创建了一个新的 Maven Web 应用程序我已经放置了一个工作package json文件内的Web Pages文件夹所以它的路径是 C Users xxx Documents NetBeansPro
如何在CI环境下运行postman的newman？

我想跑newman在我的 CI 环境 solano ci 上 newman是一个运行邮递员集合中的请求的工具我有一个newman脚本在我的package json 而且我也有一个npm start启动服务器的脚本localhost 300
Perl 中的 Substr，将 utf8 字符切成两半

我正在尝试解决使用时的问题substr在 Perl v5 8 5 中这是一个示例字符串 UTF 8 示例编辑 ff if length hit gt post title gt 60 hit gt post title substr h

Perl 中的 Substr，将 utf8 字符切成两半

Perl 中的 Substr，将 utf8 字符切成两半 的相关文章

随机推荐

热门标签

Perl 中的 Substr，将 utf8 字符切成两半的相关文章