我一直在寻找我的!!!试图找到一个 PHP 函数来将 UTF8 转换为等效的数字。我不完全确定如何称呼这个数字(我听说它被称为纵坐标?),但这里有一个例子:http://jrgraphix.net/r/Unicode/3040-309F http://jrgraphix.net/r/Unicode/3040-309F
基本上我试图在 PHP 中读取 UTF-8 .txt 文件,然后将每一行保存在数组中,这样我就可以随意处理它。
如果有人可以帮助我,我将不胜感激,因为我还不太熟悉 UTF8。
编辑:
这是我到目前为止所得到的:
echo "var TextCharacters = new Array();\n";
$LineArray = array();
$file_handle = fopen("lesson1.txt", "r");
while (!feof($file_handle))
{
$line_of_text = fgets($file_handle);
array_push($LineArray, $line_of_text);
}
fclose($file_handle);
foreach($LineArray as $s)
{
for($i = 0; $i < mb_strlen($s,"utf-8"); $i++)
{
$char = mb_substr($s, $i, 1, "utf-8");
echo "alert(go(" . bin2hex(iconv('UTF-8', 'UCS-2', $char)) . "));";
}
}
您要查找的是 Unicode 代码点,即在 Unicode 字符表中识别字符的数字标识符。 “最便宜”的方法是通过 UCS-2 字符编码,它将 1:1 从字节映射到 Unicode 代码点:
echo bin2hex(iconv('UTF-8', 'UCS-2', 'あ'));
// 3042
注意事项:返回的代码始终为 4 个十六进制数字长(您可能喜欢也可能不喜欢),并且 UCS-2 不支持高于 BMP 的字符,即高于代码点 FFFF。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)