点击	回复
971	0

【發現】我發現在Linux下的C++中（gcc編譯器），char字符數組本身就是UTF8編碼的！每個漢字占三字節

巨大八爪鱼

一派掌门二十级

1楼发表于：2016-1-1 11:08

例如：
#include <iostream>

using namespace std;

int main(void)
{
   char str[] = {'中' >> 16, '中' >> 8 & 0xff, '中' & 0xff, '\0'};
   cout << "Array size: " << sizeof(str) << endl;
   cout << str << endl;
   return 0;
}
輸出結果：
Array size: 4
中

其中代碼中的那個字符數組就相當於char str[] = "中";，上面只不過寫了展開形式。
因此，要想輸出UTF8的txt文本文件，直接用fputs或fwrite輸出就行了，根本不用進行任何轉換。

值得注意的是，在linux上編譯上述程序的時後，會出現警告：
g++ main.cpp -o main
main.cpp:7:16: warning: multi-character character constant [-Wmultichar]
char str[] = {'中' >> 16, '中' >> 8 & 0xff, '中' & 0xff, '\0'};
                ^
main.cpp:7:29: warning: multi-character character constant [-Wmultichar]
char str[] = {'中' >> 16, '中' >> 8 & 0xff, '中' & 0xff, '\0'};
                             ^
main.cpp:7:48: warning: multi-character character constant [-Wmultichar]
char str[] = {'中' >> 16, '中' >> 8 & 0xff, '中' & 0xff, '\0'};
                                                ^
這是因為不同的編譯器，字符常量'中'表示的整數值不同。Linux下，'中'是三字節，而在Windows下卻是兩字節。

回复帖子


内容：	图片视频表情
用户名：	您目前是匿名发表
验证码：
	看不清？换一张
	（快捷键：Ctrl+Enter）

本帖信息

点击数：971

回复数：0

评论数：	?
作者：巨大八爪鱼
最后回复：巨大八爪鱼
最后回复时间：2016-1-1 11:08

公告板

	【新功能】现在手机版发帖也可以上传图片了
	【公告】布拉斯侃吧（Purasbar）全站已启用HTTP/2访问以及TLS1.3加密
	【新功能】楼中楼功能已上线
	【公告】Purasbar http访问方式已关闭，从现在起只能通过https方式访问
	【新功能】现在可以直接在发帖框中粘贴图片啦！
	【新功能】搜索框提示功能上線了
	【公告】第十五次補丁包安裝完畢
	【公告】從現在開始，管理員將停止審批會員
	【公告】阿斯兰侃吧现在开始支持简繁混合搜索
	【公告】阿斯蘭侃吧啟用https訪問
	【公告】从今天开始，本站实行主题编号制
	【新功能】图片缩放功能上线了

	©2010-2026 Purasbar Ver2.0 ▲
	除非另有声明，本站采用知识共享署名-相同方式共享 3.0 Unported许可协议进行许可。