PHP中GBK和UTF8编码处理[http://www.fulin.org/blog/2007/05/29/php-utf8-gbk/]

当我用java 解析带有特殊字符(同事称为 简体繁体 脑残体)(比如说\z)的时候就会保存
在网上看到这篇文章 记录下来 用做过滤非显示字符

一、编码范围1. GBK (GB2312/GB18030)
\x00-\xff GBK双字节编码范围
\x20-\x7f ASCII
\xa1-\xff 中文
\x80-\xff 中文

2. UTF-8 (Unicode)
\u4e00-\u9fa5 (中文)
\x3130-\x318F (韩文
\xAC00-\xD7A3 (韩文)
\u0800-\u4e00 (日文)
ps: 韩文是大于[\u9fa5]的字符
正则例子:

  1. span class=”st0″>",$str);
  2. preg_replace(”/([u4e00-u9fa5])/”,”",$str);
  3.  

二、代码例子

  1.  
  2. //判断内容里有没有中文-GBK (PHP)
  3. ‘/[\x80-\xff]./’, $s);
  4. }
  5. //获取字符串长度-GBK (PHP)
  6. "/[\x80-\xff]/"//截取字符串字串-GBK (PHP)
  7. "/[\x80-\xff]/"//统计字符串长度-UTF8 (PHP)
  8. ‘Not a UTF-8 compatible string’//截取字符串-UTF8(PHP)
  9. ‘Not a UTF-8 compatible string’

=============

  1.  
  2. //判断是否是有韩文-UTF-8 (JavaScript)
  3. //判断是否有中文字符-GBK (JavaScript)
  4. "**").length);
  5. }
  6.