shell 批量转换文件编码
生活随笔
收集整理的這篇文章主要介紹了
shell 批量转换文件编码
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
相信大家在平時的跨平臺編程中碰到過文件編碼問題,比如在Windows代碼字符編碼方式是GB2312,然而轉到Linux卻只支持utf-8,雖然對代碼部分沒啥影響,但是很多中文注釋部分,卻一片亂碼,很讓人討厭。如果一個一個文件處理,轉換再另存為,很麻煩,下面就介紹一種使用shell腳本來批量轉換文件,其中使用到iconv工具。
轉換工具iconv
首先讓我們來認識一下iconv工具,iconv命令可以將一種已知的字符集文件轉換成另一種已知的字符集文件。支持的編碼方式有:Unicode相關編碼,如UTF-8、UTF-16等等,各國采用的ANSI編碼,其中包括GB2312、BIG5等中文編碼方式。[^1]
iconv [選項…] [文件…]
| 參數 | 說明 |
|---|---|
| -f, --from-code=NAME | 原始文本編碼 |
| -t, --to-code=NAME | 輸出文本編碼 |
| -l, --list | 列出所有已知的編碼集 |
| -c | 輸出文件中省略掉無效字符 |
| -o, --output=FILE | 輸出文件名 |
| -s, --silent | 不輸出警告 |
| -?, --help | 幫助 |
| -V, --version | 程序版本 |
舉例:
iconv -f gb2312 -t utf-8 gb.txt > utf8.txt
將gb里的編碼從GB2312轉化成UTF-8 并重定向到utf8.txt
轉換腳本
將輸入文件夾的所有的GB2312編碼的cpp,h,c文件轉換為utf-8編碼文件
#!/bin/bash
filelist=$(find $1 -name "*.cpp" -o -name "*.h" -o -name "*.c")
for file in $filelist
doecho $fileiconv -f gb2312 -t utf-8 $file > tmpif [ $? -eq 0 ] thenmv tmp $filefi
done
小結
本文介紹一種shell下使用iconv工具批量轉換文件編碼的方法。
參考文件
[^1] : https://baike.baidu.com/item/iconv/524310?fr=aladdin
總結
以上是生活随笔為你收集整理的shell 批量转换文件编码的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 对单链表反转链表
- 下一篇: Visual Studio 中文显示乱码