PHP - 从 HTML 中提取文本、翻译并放回

2024-04-29

我正在使用 API 来翻译我的博客，但它有时会弄乱我的 html，这让我需要更多的工作来修复所有问题。

我现在想做的是从 html 中提取内容，翻译它并将其放回原来的位置。

我首先尝试使用 preg_replace 来执行此操作，其中我将用诸如 ##a_number## 之类的内容替换每个标签，然后在文本翻译后恢复到原始标签。不幸的是，它很难管理，因为我需要用唯一值替换每个标签。

然后我用“simple html dom”尝试了它，可以在这里找到：http://simplehtmldom.sourceforge.net/manual.htm http://simplehtmldom.sourceforge.net/manual.htm

$html = str_get_html($content);
$str = $html;
$ret = $html->find('div');
foreach ($ret as $key=>$value)
    {  
        echo $value;
    }

这样我得到了所有文本，但值中仍然有一些 html（div 内的 div），我不知道如何将翻译后的文本放回原始对象中。该对象的结构非常复杂，以至于在显示它时，它会导致我的浏览器崩溃。

我已经没有什么选择了，可能有更简单的方法可以做到这一点。我想找到一种方法来获取一个对象或数组，其中一侧包含所有 html，另一侧包含所有文本。我会循环遍历文本以将其翻译并合并回所有内容以避免破坏 html。

您是否有更好的选择来实现这一目标？

谢谢洛朗

例如，我有以下 HTML，其中所有单词均为小写：

<div>
    <h2>page not found!</h2>
    <p>go to <a href="/">home page</a> or use the <a href="/search">search</a>.</p>
</div>

我的任务是将文本转换为大写单词。为了解决这个问题，我获取所有文本节点并使用ucwords函数（当然，你应该使用你的翻译函数而不是它）。

libxml_use_internal_errors(true);
$dom = new DomDocument();
$dom->loadHTML($html, LIBXML_HTML_NOIMPLIED | LIBXML_HTML_NODEFDTD);
$xpath = new DOMXPath($dom);

foreach ($xpath->query('//text()') as $text) {
    if (trim($text->nodeValue)) {
        $text->nodeValue = ucwords($text->nodeValue);
    }
}

echo $dom->saveHTML();

上面的输出结果如下：

<div>
    <h2>Page Not Found!</h2>
    <p>Go To <a href="/">Home Page</a> Or Use The <a href="/search">Search</a>.</p>
</div>

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

PHP - 从 HTML 中提取文本、翻译并放回的相关文章

从移动版本切换到完整网站（桌面版本）

我使用此代码将用户从桌面版本引导到我的移动网站
如何在 PHP MYSQL 中将数据库表和每条记录从一台数据库服务器复制到另一台数据库服务器？>

您好我编写了一段代码可以将数据库表从一个服务器复制到另一个服务器但是每个表的记录没有复制如何编写一个可以将表和每个记录从一个数据库服务器复制到另一个数据库服务器的函数这是我的示例代码
数组匹配值过滤器 PHP [重复]

这个问题在这里已经有答案了我尝试在数组中搜索但根本没有得到任何结果假设我有一个包含一些值的数组所以当我想搜索它们时它总是返回 null 不知道为什么假设这是我的数组 data Array 0 gt Array id gt 122
PHP函数：查找参数的变量名和函数调用行号

我想做这样的事情来简化日志操作知道我应该投入什么吗 1 and 2 function log var var line 1 var name 2 line filepath log date Y m d txt message line
防止隐藏的输入被更改

这一直让我压力很大我有一个隐藏的输入
iCalendar 邀请未在电子邮件客户端中显示 RSVP 按钮

我正在使用 PHPMailer 发送电子邮件我的ICS内容是 BEGIN VCALENDAR METHOD REQUEST VERSION 2 0 PRODID FooBar FooBar Calendar EN BEGIN VEVENT
如何获取 $node 内的 html 而不仅仅是 $nodeValue [重复]

这个问题在这里已经有答案了目前情况描述我有一个装满页面的文件夹页面文件夹该文件夹内的每个页面除其他外都有一个 div id short info 我有一个代码可以提取所有 div div 从该文件夹中并使用显示其中的文本text
如何在 PHP 中使用 RS256 签署 X.509 证书？无法获取有效指纹...x5t

我已经实现了 JWT 令牌生成器库Here https github com F21 jwt blob master JWT JWT php 并且我能够获得 RS256 令牌有效负载但我对标题数据有疑问我需要一个标头值 x5t 该标头
Google 应用程序引擎 - 上传的文件在谷歌云存储上不公开

我有一个允许用户上传图像的应用程序并且我希望其他用户能够看到该图像我使用 CloudStorageTools createUploadUrl 方法允许用户通过 POST 上传然后我将上传的文件并使用 move uploaded fi
PHP ASCII 表库 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案是否有一个事实上的标准库用于在 PHP 中创建 ASCII 表我想要一些 PHP 代码当传递数组或其
Symfony 3新建项目报错

我开始编写有关 Symfony 3 的教程在使用以下命令创建新项目时遇到问题 php symfony phar new Symfony 我有这个错误 GuzzleHttp Exception RequestException Error
为什么将 MySQL 凭据放在 www 目录之外？ [复制]

这个问题在这里已经有答案了可能的重复将核心类放在 Web 根目录之上好还是坏主意 https stackoverflow com questions 3648739 putting core classes above the web
ZipArchives 存储绝对路径

我可以使用相对路径压缩文件吗例如 zip gt addFile c wamp www foo file txt ZIP 应该具有如下目录结构 foo gt file txt and not wamp gt www gt foo gt fi
不使用 PHP 提交联系表单

我还是一名学生今天我们的讲师告诉我们无需使用 mailto 函数即可提交联系我们表单的唯一方法是使用 PHP 我发誓去年另一位讲师向我们展示了一种仅使用 javascript 的方法是否可以使用基本表单和 javascript 提交反
PHP file_exists() 对我不起作用？

由于某种原因下面的 PHP 代码将无法工作我无法弄清楚很奇怪的是 file exists 似乎没有看到图像确实存在我已经检查以确保将良好的文件路径插入到 file exists 函数中并且它仍在运行如果我将 file exists
将 Node.js（用于实时通知）添加到现有 PHP 应用程序

我有一个现有的 PHP 应用程序我需要向其中添加实时通知为了实现这一点我安装了node js 打算添加socket io以实现所有实时功能然而尽管在过去的三个小时里研究并试图弄清楚如何将两者结合起来但我发现自己并没有更接近于获得
MYSQL：SQL查询获取自增字段的值

我有一张桌子主键是id及其自动递增现在当我插入新记录时我需要获取更新记录的 id 我怎样才能做到这一点如果我使用查询 select max id from table name 执行后我可以获得id 但我能确定它是刚刚插入的记录的
如果一个多维数组中的子数组与另一个多维数组不同，则覆盖该子数组

我坚持这个问题真的不知道如何解决我有两个多维数组需要将第二个数组中的每个 entry id 与第一个数组进行匹配然后需要检查第二个数组中的每个 file no 是否在数据库第一个数组中并且 status 是否与第一个数组匹配
如何解决“无法加载PEM客户端证书，OpenSSL错误：02001003：系统库：fopen：没有这样的进程”错误？

如果这个问题很愚蠢请原谅但我是这个领域的新手我需要通过 SSL 从 Drupal 7 站点连接到服务我有一个扩展名为 p12 的文件及其密码另外我使用 PHP 7 1 1 和 Windows 7 64x 我使用以下命令将 p12
如何从 PHP 中的字符串创建可能的字符串组合？

如何从 PHP 中的字符串创建可能的字符串组合 Exp input abc output array 0 gt a 1 gt ab 2 gt abc 3 gt ac 4 gt acb 5 gt b 6 gt ba 7 gt bac 8 gt

随机推荐

iTunes connect - 在哪里可以查看 TestFlight 版本的崩溃报告？

我有一个应用程序正在 iTunes 连接上通过 TestFlight 进行测试其中一台测试设备不断崩溃我很确定 itunes connect 上应该有崩溃日志但我在 testflight 版本中找不到任何崩溃日志有谁知道在哪里可以找
Lambda函数检查特定标签是否不存在-python

我正在尝试以下内容获取满足以下任一条件的所有 EC2 实例被标记为标签所有者和值未知或未知缺少标签所有者我能够完成 1 但不知道如何实现 2 import boto3 import collections import dateti
如何监听youtube iframe的音量变化？

Here https stackoverflow com a 17087006 4992248我找到了一个如何收听 YouTube iframe 的播放暂停按钮的示例 player addEventListener onStateCh
一段时间后 NSTimer 停止在后台触发

嘿我正在开发一个应用程序其中我必须每 30 秒调用一次 API 所以我为它创建了 NSTimer 但是当我的应用程序进入后台时计时器会在 3 4 分钟后停止触发所以它只能在后台运行 3 4 分钟但之后就不再运行了我如何修改我的代
FBSDK 共享对话框无法在 IOS 11 上运行

我在用FBSDKShareDialog在 facebook 上分享图片但在 IOS11 上不起作用 Facebook 共享对话框未打开我怎样才能分享这篇文章并让它在 IOS11 和以前的版本上也能工作我以前的工作代码 FBSDKSha
为什么 Box2D 不应该使用像素作为单位？

手册中说我应该使用小单位 0 1 10米不鼓励使用像素作为测量单位但是为什么 Box2D 比我使用小单位时工作得更好并且具有更好的模拟效果呢 Box2D 是一个模拟框架内部使用MKS 单位制 http en wikipedia or
如何在刷新期间锁定哈希图？

我有一个静电HashMap它在应用程序启动时填充并每天刷新如何确保刷新期间没有其他线程可以访问地图 ThreadSafe public class MyService private static final Map
检测何时从控制台调用函数的最佳方法

我想知道检测何时通过控制台直接调用方法或函数的最佳方法据我目前了解不可能在相同的函数调用上直接检测到它但使用 call and apply 函数的方法我可以通过传递附加数据this object 给出以下代码结构 function v
从 Slack 机器人访问 Slack 文件

我需要一个能够接收和保存从 Slack 聊天室发送的文件的 Slack 机器人问题是 slack 不发送文件内容而是发送指向该文件的链接数组其中大多数包括下载链接都是私有的无法通过机器人访问它确实发送了一个公共链接但该链接指
在后台线程加载广告 (adMob)

我想在后台线程上加载我的添加因为它使得SlidingMenu打开和关闭时滞后我应该使用Thread Handler Or AsyncTask String MY AD UNIT ID AdView adView new AdView g
如何取消等待中的任务？

我正在处理这些 Windows 8 WinRT 任务并且尝试使用下面的方法取消任务并且它在某种程度上有效 CancelNotification 方法确实被调用这使您认为任务已被取消但在后台任务仍在运行然后在完成后任务的状态始终为
列出 AppDomain 中存储的所有自定义数据

为了存储发生错误时的进程状态我想列出存储在 AppDomain 中的所有自定义数据通过 SetData LocalStore 属性是私有的 AppDomain 类不可继承有什么方法可以枚举这些数据吗 AppDomain domai
为什么 Convert.ToDecimal(Double) 舍入为 15 位有效数字？

我有一个double小数点后17位即 double myDouble 0 12345678901234567 如果我将其转换为decimal像这样 decimal myDecimal Convert ToDecimal myDouble
如何在codeigniter中从数据库返回最后一条记录？

我正在尝试获取我拥有数据的最后日期所以我想打印 date data 列中的最后一个日期在模型中 public function last record query this gt db gt select LAST date data
无法让 log4net 与 .net windows 服务一起使用

我有一个 Windows 服务app config and a log4net config app config
Qt3D 是 Qt5 的一部分吗？

我在windows中安装了Qt5库但Qt助手中没有关于Qt3D的文档 Qt3D 是 Qt5 的一部分还是已从发布版本 5 中删除是的 Qt 3D 成为标准 Qt 库Qt 5 7 发布 http blog qt io blog 2016
使用 git 客户端和 SVN 存储库的最佳工具/方法

我已经使用 SVN 大约两年了主要是通过 TortoiseSVN 和 IntelliJ 并尝试了 git 主要是通过 TortoiseGIT 在这里检测到模式我们公司正在使用 SVN 作为存储库他们不会考虑很快进行切换在本地使用 g
为什么我需要调用new？ [复制]

这个问题在这里已经有答案了可能的重复在 C 中什么时候使用 new 什么时候不使用 https stackoverflow com questions 679571 when to use new and when not to in
如何查找用户所属的所有组？（LDAP）

我正在尝试获取某个用户所属的所有组我有以下内容结构在LDAP中 o myOrganization ou unit1 cn admin cn guess and ou users cn ann cn bob cn carla myOrgan
PHP - 从 HTML 中提取文本、翻译并放回

我正在使用 API 来翻译我的博客但它有时会弄乱我的 html 这让我需要更多的工作来修复所有问题我现在想做的是从 html 中提取内容翻译它并将其放回原来的位置我首先尝试使用 preg replace 来执行此操作其中我将用诸如

PHP - 从 HTML 中提取文本、翻译并放回

PHP - 从 HTML 中提取文本、翻译并放回 的相关文章

随机推荐

热门标签

PHP - 从 HTML 中提取文本、翻译并放回的相关文章