Linux字符编码转换 UTF8转GB3212
生活随笔
收集整理的這篇文章主要介紹了
Linux字符编码转换 UTF8转GB3212
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
在LINUX上進(jìn)行編碼轉(zhuǎn)換時,既可以利用iconv函數(shù)族編程實(shí)現(xiàn),也可以利用iconv命令來實(shí)現(xiàn),只不過后者是針對文件的,即將指定文件從一種編碼轉(zhuǎn)換為另一種編碼。?
???一、利用iconv函數(shù)族進(jìn)行編碼轉(zhuǎn)換?
???iconv函數(shù)族的頭文 在LINUX上進(jìn)行編碼轉(zhuǎn)換時,既可以利用iconv函數(shù)族編程實(shí)現(xiàn),也可以利用iconv命令來實(shí)現(xiàn),只不過后者是針對文件的,即將指定文件從一種編碼轉(zhuǎn)換為另一種編碼。
?? 一、利用iconv函數(shù)族進(jìn)行編碼轉(zhuǎn)換
?? iconv函數(shù)族的頭文件是iconv.h,使用前需包含之。
?? #include <iconv.h>
?? iconv函數(shù)族有三個函數(shù),原型如下:
?? (1) iconv_t iconv_open(const char *tocode, const char *fromcode);
?? 此函數(shù)說明將要進(jìn)行哪兩種編碼的轉(zhuǎn)換,tocode是目標(biāo)編碼,fromcode是原編碼,該函數(shù)返回一個轉(zhuǎn)換句柄,供以下兩個函數(shù)使用。
?? (2) size_t iconv(iconv_t cd,char **inbuf,size_t *inbytesleft,char **outbuf,size_t *outbytesleft);
?? 此函數(shù)從inbuf中讀取字符,轉(zhuǎn)換后輸出到outbuf中,inbytesleft用以記錄還未轉(zhuǎn)換的字符數(shù),outbytesleft用以記錄輸出緩沖的剩余空間。 (3) int iconv_close(iconv_t cd);
?? 此函數(shù)用于關(guān)閉轉(zhuǎn)換句柄,釋放資源。
?? 例子1: 用C語言實(shí)現(xiàn)的轉(zhuǎn)換示例程序
?? /* f.c : 代碼轉(zhuǎn)換示例C程序 */
?? #include <iconv.h>
?? #define OUTLEN 255
?? main()
?? {
?? char *in_utf8 = "姝e?ㄥ??瑁?";
?? char *in_gb2312 = "正在安裝";
?? char out[OUTLEN];
?? //unicode碼轉(zhuǎn)為gb2312碼
?? rc = u2g(in_utf8,strlen(in_utf8),out,OUTLEN);
?? printf("unicode-->gb2312 out=%sn",out);
?? //gb2312碼轉(zhuǎn)為unicode碼
?? rc = g2u(in_gb2312,strlen(in_gb2312),out,OUTLEN);
?? printf("gb2312-->unicode out=%sn",out);
?? }
?? //代碼轉(zhuǎn)換:從一種編碼轉(zhuǎn)為另一種編碼
?? int code_convert(char *from_charset,char *to_charset,char *inbuf,int inlen,char *outbuf,int outlen)
?? {
?? iconv_t cd;
?? int rc;
?? char **pin = &inbuf;
?? char **pout = &outbuf;
?? cd = iconv_open(to_charset,from_charset);
?? if (cd==0) return -1;
?? memset(outbuf,0,outlen);
?? if (iconv(cd,pin,&inlen,pout,&outlen)==-1) return -1;
?? iconv_close(cd);
?? return 0;
?? }
?? //UNICODE碼轉(zhuǎn)為GB2312碼
?? int u2g(char *inbuf,int inlen,char *outbuf,int outlen)
?? {
?? return code_convert("utf-8","gb2312",inbuf,inlen,outbuf,outlen);
?? }
?? //GB2312碼轉(zhuǎn)為UNICODE碼
?? int g2u(char *inbuf,size_t inlen,char *outbuf,size_t outlen)
?? {
?? return code_convert("gb2312","utf-8",inbuf,inlen,outbuf,outlen);
?? }
?? 例子2: 用C++語言實(shí)現(xiàn)的轉(zhuǎn)換示例程序
?? /* f.cpp : 代碼轉(zhuǎn)換示例C++程序 */
?? #include <iconv.h>
?? #include <iostream>
?? #define OUTLEN 255
?? using namespace std;
?? // 代碼轉(zhuǎn)換操作類
?? class CodeConverter {
?? private:
?? iconv_t cd;
?? public:
?? // 構(gòu)造
?? CodeConverter(const char *from_charset,const char *to_charset) {
?? cd = iconv_open(to_charset,from_charset);
?? }
?? // 析構(gòu)
?? ~CodeConverter() {
?? iconv_close(cd);
?? }
?? // 轉(zhuǎn)換輸出
?? int convert(char *inbuf,int inlen,char *outbuf,int outlen) {
?? char **pin = &inbuf;
?? char **pout = &outbuf;
?? memset(outbuf,0,outlen);
?? return iconv(cd,pin,(size_t *)&inlen,pout,(size_t *)&outlen);
?? }
?? };
?? int main(int argc, char **argv)
?? {
?? char *in_utf8 = "姝e?ㄥ??瑁?";
?? char *in_gb2312 = "正在安裝";
?? char out[OUTLEN];
?? // utf-8-->gb2312
?? CodeConverter cc = CodeConverter("utf-8","gb2312");
?? cc.convert(in_utf8,strlen(in_utf8),out,OUTLEN);
?? cout << "utf-8-->gb2312 in=" << in_utf8 << ",out=" << out << endl;
?? // gb2312-->utf-8
?? CodeConverter cc2 = CodeConverter("gb2312","utf-8");
?? cc2.convert(in_gb2312,strlen(in_gb2312),out,OUTLEN);
?? cout << "gb2312-->utf-8 in=" << in_gb2312 << ",out=" << out << endl;
?? } linux C 字符集轉(zhuǎn)換,UTF-8,GB2312 最近幫朋友寫個系統(tǒng)接口的小東東,2個系統(tǒng)字符集不同,一個采用UTF-8,一個采用GB2312,不得已需要轉(zhuǎn)換字符集。轉(zhuǎn)換函數(shù)記錄如下: #include <iconv.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#define OUTLEN 255
main()
{
char *in_utf8 = "utf8字符串";
char *in_gb2312 = "\xbe\xb2\xcc\xac\xc4\xa3\xca\xbd";
char out[OUTLEN];
int rec ;
//unicode碼轉(zhuǎn)為gb2312碼
rec = u2g(in_utf8,strlen(in_utf8),out,OUTLEN);
printf("unicode-->gb2312 out=%s\n",out);
??
//gb2312碼轉(zhuǎn)為unicode碼
rec = g2u(in_gb2312,strlen(in_gb2312),out,OUTLEN);
printf("gb2312-->unicode out=%s \n",out);
}
//代碼轉(zhuǎn)換:從一種編碼轉(zhuǎn)為另一種編碼
int code_convert(char *from_charset,char *to_charset,char *inbuf,int inlen,char *outbuf,int outlen)
{
iconv_t cd;
int rc;
char **pin = &inbuf;
char **pout = &outbuf;
cd = iconv_open(to_charset,from_charset);
if (cd==0) return -1;
memset(outbuf,0,outlen);
if (iconv(cd,pin,&inlen,pout,&outlen)==-1) return -1;
iconv_close(cd);
return 0;
}
//UNICODE碼轉(zhuǎn)為GB2312碼
int u2g(char *inbuf,int inlen,char *outbuf,int outlen)
{
return code_convert("utf-8","gb2312",inbuf,inlen,outbuf,outlen);
}
//GB2312碼轉(zhuǎn)為UNICODE碼
int g2u(char *inbuf,size_t inlen,char *outbuf,size_t outlen)
{
return code_convert("gb2312","utf-8",inbuf,inlen,outbuf,outlen);
???一、利用iconv函數(shù)族進(jìn)行編碼轉(zhuǎn)換?
???iconv函數(shù)族的頭文 在LINUX上進(jìn)行編碼轉(zhuǎn)換時,既可以利用iconv函數(shù)族編程實(shí)現(xiàn),也可以利用iconv命令來實(shí)現(xiàn),只不過后者是針對文件的,即將指定文件從一種編碼轉(zhuǎn)換為另一種編碼。
?? 一、利用iconv函數(shù)族進(jìn)行編碼轉(zhuǎn)換
?? iconv函數(shù)族的頭文件是iconv.h,使用前需包含之。
?? #include <iconv.h>
?? iconv函數(shù)族有三個函數(shù),原型如下:
?? (1) iconv_t iconv_open(const char *tocode, const char *fromcode);
?? 此函數(shù)說明將要進(jìn)行哪兩種編碼的轉(zhuǎn)換,tocode是目標(biāo)編碼,fromcode是原編碼,該函數(shù)返回一個轉(zhuǎn)換句柄,供以下兩個函數(shù)使用。
?? (2) size_t iconv(iconv_t cd,char **inbuf,size_t *inbytesleft,char **outbuf,size_t *outbytesleft);
?? 此函數(shù)從inbuf中讀取字符,轉(zhuǎn)換后輸出到outbuf中,inbytesleft用以記錄還未轉(zhuǎn)換的字符數(shù),outbytesleft用以記錄輸出緩沖的剩余空間。 (3) int iconv_close(iconv_t cd);
?? 此函數(shù)用于關(guān)閉轉(zhuǎn)換句柄,釋放資源。
?? 例子1: 用C語言實(shí)現(xiàn)的轉(zhuǎn)換示例程序
?? /* f.c : 代碼轉(zhuǎn)換示例C程序 */
?? #include <iconv.h>
?? #define OUTLEN 255
?? main()
?? {
?? char *in_utf8 = "姝e?ㄥ??瑁?";
?? char *in_gb2312 = "正在安裝";
?? char out[OUTLEN];
?? //unicode碼轉(zhuǎn)為gb2312碼
?? rc = u2g(in_utf8,strlen(in_utf8),out,OUTLEN);
?? printf("unicode-->gb2312 out=%sn",out);
?? //gb2312碼轉(zhuǎn)為unicode碼
?? rc = g2u(in_gb2312,strlen(in_gb2312),out,OUTLEN);
?? printf("gb2312-->unicode out=%sn",out);
?? }
?? //代碼轉(zhuǎn)換:從一種編碼轉(zhuǎn)為另一種編碼
?? int code_convert(char *from_charset,char *to_charset,char *inbuf,int inlen,char *outbuf,int outlen)
?? {
?? iconv_t cd;
?? int rc;
?? char **pin = &inbuf;
?? char **pout = &outbuf;
?? cd = iconv_open(to_charset,from_charset);
?? if (cd==0) return -1;
?? memset(outbuf,0,outlen);
?? if (iconv(cd,pin,&inlen,pout,&outlen)==-1) return -1;
?? iconv_close(cd);
?? return 0;
?? }
?? //UNICODE碼轉(zhuǎn)為GB2312碼
?? int u2g(char *inbuf,int inlen,char *outbuf,int outlen)
?? {
?? return code_convert("utf-8","gb2312",inbuf,inlen,outbuf,outlen);
?? }
?? //GB2312碼轉(zhuǎn)為UNICODE碼
?? int g2u(char *inbuf,size_t inlen,char *outbuf,size_t outlen)
?? {
?? return code_convert("gb2312","utf-8",inbuf,inlen,outbuf,outlen);
?? }
?? 例子2: 用C++語言實(shí)現(xiàn)的轉(zhuǎn)換示例程序
?? /* f.cpp : 代碼轉(zhuǎn)換示例C++程序 */
?? #include <iconv.h>
?? #include <iostream>
?? #define OUTLEN 255
?? using namespace std;
?? // 代碼轉(zhuǎn)換操作類
?? class CodeConverter {
?? private:
?? iconv_t cd;
?? public:
?? // 構(gòu)造
?? CodeConverter(const char *from_charset,const char *to_charset) {
?? cd = iconv_open(to_charset,from_charset);
?? }
?? // 析構(gòu)
?? ~CodeConverter() {
?? iconv_close(cd);
?? }
?? // 轉(zhuǎn)換輸出
?? int convert(char *inbuf,int inlen,char *outbuf,int outlen) {
?? char **pin = &inbuf;
?? char **pout = &outbuf;
?? memset(outbuf,0,outlen);
?? return iconv(cd,pin,(size_t *)&inlen,pout,(size_t *)&outlen);
?? }
?? };
?? int main(int argc, char **argv)
?? {
?? char *in_utf8 = "姝e?ㄥ??瑁?";
?? char *in_gb2312 = "正在安裝";
?? char out[OUTLEN];
?? // utf-8-->gb2312
?? CodeConverter cc = CodeConverter("utf-8","gb2312");
?? cc.convert(in_utf8,strlen(in_utf8),out,OUTLEN);
?? cout << "utf-8-->gb2312 in=" << in_utf8 << ",out=" << out << endl;
?? // gb2312-->utf-8
?? CodeConverter cc2 = CodeConverter("gb2312","utf-8");
?? cc2.convert(in_gb2312,strlen(in_gb2312),out,OUTLEN);
?? cout << "gb2312-->utf-8 in=" << in_gb2312 << ",out=" << out << endl;
?? } linux C 字符集轉(zhuǎn)換,UTF-8,GB2312 最近幫朋友寫個系統(tǒng)接口的小東東,2個系統(tǒng)字符集不同,一個采用UTF-8,一個采用GB2312,不得已需要轉(zhuǎn)換字符集。轉(zhuǎn)換函數(shù)記錄如下: #include <iconv.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#define OUTLEN 255
main()
{
char *in_utf8 = "utf8字符串";
char *in_gb2312 = "\xbe\xb2\xcc\xac\xc4\xa3\xca\xbd";
char out[OUTLEN];
int rec ;
//unicode碼轉(zhuǎn)為gb2312碼
rec = u2g(in_utf8,strlen(in_utf8),out,OUTLEN);
printf("unicode-->gb2312 out=%s\n",out);
??
//gb2312碼轉(zhuǎn)為unicode碼
rec = g2u(in_gb2312,strlen(in_gb2312),out,OUTLEN);
printf("gb2312-->unicode out=%s \n",out);
}
//代碼轉(zhuǎn)換:從一種編碼轉(zhuǎn)為另一種編碼
int code_convert(char *from_charset,char *to_charset,char *inbuf,int inlen,char *outbuf,int outlen)
{
iconv_t cd;
int rc;
char **pin = &inbuf;
char **pout = &outbuf;
cd = iconv_open(to_charset,from_charset);
if (cd==0) return -1;
memset(outbuf,0,outlen);
if (iconv(cd,pin,&inlen,pout,&outlen)==-1) return -1;
iconv_close(cd);
return 0;
}
//UNICODE碼轉(zhuǎn)為GB2312碼
int u2g(char *inbuf,int inlen,char *outbuf,int outlen)
{
return code_convert("utf-8","gb2312",inbuf,inlen,outbuf,outlen);
}
//GB2312碼轉(zhuǎn)為UNICODE碼
int g2u(char *inbuf,size_t inlen,char *outbuf,size_t outlen)
{
return code_convert("gb2312","utf-8",inbuf,inlen,outbuf,outlen);
轉(zhuǎn)載于:https://www.cnblogs.com/qingchen1984/p/4029105.html
總結(jié)
以上是生活随笔為你收集整理的Linux字符编码转换 UTF8转GB3212的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Codeforces Round #35
- 下一篇: 基础【循环】-----(枚举器)----