修复损坏的UTF-8编码
我正在修复一些错误的UTF-8编码。我目前正在使用PHP 5和MySQL。
在我的数据库中,我有一些编码错误的实例,例如:ƒ
- 数据库整理是utf8_general_ci
- PHP使用的是正确的UTF-8标头
- Notepad ++设置为使用不带BOM的UTF-8
- 数据库管理在phpMyAdmin中处理
- 并非所有重音符号的情况都被破坏
我需要某种函数来帮助我将ƒ,®,?,?¼和其他类似的实例映射到其适当的带重音的UTF-8字符。
回答:
过去,我不得不尝试“修复”许多UTF8损坏的情况,但是不幸的是,这绝非易事,而且常常是不可能的。
除非您能确切确定它是如何破裂的,而且总是以完全相同的方式破裂,否则将很难“消除”损坏。
如果要尝试消除损害,最好的选择是开始编写一些示例代码,在该示例中,尝试对mb_convert_encoding()的调用进行多种变体,以查看是否可以找到“
from”和“ to”的组合修复您的数据。最后,通常最好不要再因为涉及到痛苦的程度而担心修复旧数据,而只是去解决将来的问题。
但是,在执行此操作之前,您需要确保首先解决导致此问题的所有问题。您已经提到数据库表排序规则和编辑器设置正确。但是,还有更多地方需要检查以确保所有内容都正确地是UTF-8:
- 确保您将HTML用作UTF-8:
- header(“ Content-Type:text / html; charset = utf-8”);
- 将您的PHP默认字符集更改为utf-8:
- ini_set(“ default_charset”,’utf-8’);
- 如果您的数据库始终不能使用utf-8进行通信,那么您可能需要基于每个连接告诉它,以确保它处于utf-8模式,在MySQL中,您可以通过发出以下命令来做到这一点:
- 字符集utf8
- 您可能需要告诉您的网络服务器始终尝试使用UTF8进行对话,在Apache中,此命令是:
- 添加默认字符集UTF-8
- 最后,您需要始终确保您使用的是正确的UTF-8抱怨的PHP函数。这意味着始终使用mb_ *样式的“多字节感知”字符串函数。这也意味着在调用诸如htmlspecialchars()之类的函数时,应在末尾包含适当的’utf-8’charset参数,以确保其不会对它们进行错误编码。
如果您错过了整个过程中的任何一步,则编码可能会被破坏并且会出现问题。一旦您进入执行utf-8的“槽”,这一切便成为第二天性。当然,PHP6应该是来自getgo的完全unicode投诉,这将使很多事情变得更容易(希望如此)
以上是 修复损坏的UTF-8编码 的全部内容, 来源链接: utcz.com/qa/420236.html