python2 去除 字符串中emoji 符号,去除所有4字节utf8字符
生活随笔
收集整理的這篇文章主要介紹了
python2 去除 字符串中emoji 符号,去除所有4字节utf8字符
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
對咱們天朝程序員來說,最常用的編碼方式就是UTF-8了。大家在創建數據庫的時候,總是條件反射選擇UTF-8編碼。
最近我遇到一個emoji 符號不能寫入數據庫得問題。通過查詢資料得知,emoji 符號占據4個字符長度,而MySQL的utf-8編碼只能寫入最多3個字節的字符。想要寫入emoji 符號,需要將數據庫的編碼方式改為 utf8mb4 。
然而,我這張表是一張比較老的表,其中存了很多的數據。修改他的結構怕會引起其他問題。所以只能想別的辦法。
在我這里這個數據去除emoji 符號也能符合系統的要求,于是我開始想辦法去除emoji 符號。開始我想取得找到emoji的編碼范圍,把這個范圍內的字符都干掉。后來我發現emoji的分布范圍比較分散,我沒有找到能去除所有emoji符號的范例。
我又想到一個辦法,把所有四字節utf8字符干掉不就行了嘛。以下是代碼
如果有幫到您,打個賞唄
總結
以上是生活随笔為你收集整理的python2 去除 字符串中emoji 符号,去除所有4字节utf8字符的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python 获得两个数组(List)交
- 下一篇: Python 读写当前路径下文件错误 U