某科学的超电磁炮吧 关注:362,211贴子:8,440,637
  • 6回复贴,共1

锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷

只看楼主收藏回复

知道这是为啥吗?
下面由我来解答:
Unicode和老编码体系的转化过程中,肯定有一些字,用Unicode是没法表示的,Unicode官方用了一个占位符来表示这些文字,这就是:U+FFFD REPLACEMENT CHARACTER   那么U+FFFD的UTF-8编码出来,恰好是 '\xef\xbf\xbd'。   如果这个'\xef\xbf\xbd',重复多次,例如 '\xef\xbf\xbd\xef\xbf\xbd',然后放到GBK/CP936/GB2312/GB18030的环境中显示的话   一个汉字2个字节,最终的结果就是:锟斤拷   我们上网的时候不用去关心网站采用了什么编码格式,但是页面中不时出现的乱码还是会让我们头 疼。在这点上,Firefox的用户更是深有体会,用Firefox浏览网页看到乱码的机会要比IE多得多。 乱码主要与字符编码系统有关。例如一个网页中常出现的乱码“锟斤拷”(百度,Google),它就是新老编码系统转换中出现的。网友est专门写了一篇文 章来考证问题来源:   Unicode和老编码体系的转化过程中,肯定有一些字,用Unicode是没法表示 的,Unicode官方用了一个占位符来表示这些文字,这就是:U+FFFD REPLACEMENT CHARACTER。那么U+FFFD的UTF-8编码出来,恰好是 '\xef\xbf\xbd'。如果这个'\xef\xbf\xbd',重复多次,例如 '\xef\xbf\xbd\xef\xbf\xbd',然后放到GBK/CP936/GB2312/GB18030的环境中显示的话就是“锟斤拷——锟 (0xEFBF),斤(0xBDEF),拷(0xBFBD)”。


回复
1楼2010-08-14 12:33
    斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟


    回复
    2楼2010-08-14 12:34
      贴吧首页乱码问题正在解决中,请大家稍安勿躁!


      回复
      3楼2010-08-14 12:34
        已恢复


        回复
        5楼2010-08-14 12:35
          原创。。。好像不太可能,经过搜索。。。


          回复
          6楼2010-08-14 12:36


            回复
            7楼2010-08-14 12:37
              恢复了


              回复
              8楼2010-08-14 12:38