目前共有3篇帖子。 字体大小:较小 - 100% (默认)▼  内容转换:港澳繁體▼
 
点击 回复
658 2
【百科】錕斤拷
一派掌门 二十级
1楼 发表于:2010-8-19 20:53

?板?浠

拷涔???欏?

錕斤拷錕斤拷

錕斤拷直錕斤拷錕

 

看到這些字句,您肯定會問,這是什麼?這些字句是毫無實際意義的,但它們卻形象地表達出了一些莫名其妙的問題。這是一個很經典的亂碼。相當經典

最容易出現的地方就是搜尋引擎

一派掌门 二十级
2楼 发表于:2010-8-19 20:53
Unicode和老編碼體系的轉化過程中,肯定有一些字,用Unicode是沒法表示的,Unicode官方用了一個佔位符來表示這些文字,這就是:U+FFFD REPLACEMENT CHARACTER
  那麼U+FFFD的UTF-8編碼出來,恰好是 '\xef\xbf\xbd'。
  如果這個'\xef\xbf\xbd',重複多次,例如 '\xef\xbf\xbd\xef\xbf\xbd',然後放到GBK/CP936/GB2312/GB18030的環境中顯示的話
  一個漢字2個字節,最終的結果就是:錕斤拷
  我們上網的時候不用去關心網站採用了什麼編碼格式,但是頁面中不時出現的亂碼還是會讓我們頭疼。在這點上,Firefox的用戶更是深有體會,用Firefox瀏覽網頁看到亂碼的機會要比IE多得多。 亂碼主要與字符編碼系統有關。例如一個網頁中常出現的亂碼「錕斤拷」(百度,Google),它就是新老編碼系統轉換中出現的。網友est專門寫了一篇文章來考證問題來源:
  Unicode和老編碼體系的轉化過程中,肯定有一些字,用Unicode是沒法表示的,Unicode官方用了一個佔位符來表示這些文字,這就是:U+FFFD REPLACEMENT CHARACTER。那麼U+FFFD的UTF-8編碼出來,恰好是 '\xef\xbf\xbd'。如果這個'\xef\xbf\xbd',重複多次,例如 '\xef\xbf\xbd\xef\xbf\xbd',然後放到GBK/CP936/GB2312/GB18030的環境中顯示的話就是「錕斤拷――錕(0xEFBF),斤(0xBDEF),拷(0xBFBD)」。
 
一派掌门 二十级
3楼 发表于:2010-8-19 20:54

2010年8月14日中午,百度貼吧主頁遭到疑似黑客攻擊,也有可能是內部維修的錯誤,因此整個頁面一直是錕斤拷等字,並持續大約3-4小時,這也讓網友對「錕斤拷」這三個字產生了濃厚的興趣,甚至出現了以「錕斤拷」為主題的簽名檔、頭像和貼吧。 

 

回复帖子

内容:
用户名: 您目前是匿名发表
验证码:
(快捷键:Ctrl+Enter)
 

本帖信息

点击数:658 回复数:2
评论数: ?
作者:巨大八爪鱼
最后回复:巨大八爪鱼
最后回复时间:2010-8-19 20:54
 
©2010-2025 Purasbar Ver2.0
除非另有声明,本站采用知识共享署名-相同方式共享 3.0 Unported许可协议进行许可。