mysql share 字体 中文_MySQL 存储生僻字/不常见繁体字解决方案(未完全解决)
概述:
utf-8編碼可能2個字節(jié)、3個字節(jié)、4個字節(jié)的字符,但是MySQL的utf8編碼只支持3字節(jié)的數(shù)據(jù),而移動端的表情數(shù)據(jù)和生僻字是4個字節(jié)的字符。如果直接往采用utf-8編碼的數(shù)據(jù)庫中插入表情數(shù)據(jù),python程序中將報SQL異常:Traceback?(most?recent?call?last):
File?"/Users/chenxin/Dropbox/python/django/shici/clean_data/export_data.py",?line?101,?in?
export_dynasty("魏晉")
File?"/Users/chenxin/Dropbox/python/django/shici/clean_data/export_data.py",?line?60,?in?export_dynasty
cursor.execute(sql,?tuple(temp_dict.values()))
File?"/Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages/pymysql/cursors.py",?line?163,?in?execute
result?=?self._query(query)
File?"/Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages/pymysql/cursors.py",?line?321,?in?_query
conn.query(q)
File?"/Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages/pymysql/connections.py",?line?505,?in?query
self._affected_rows?=?self._read_query_result(unbuffered=unbuffered)
File?"/Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages/pymysql/connections.py",?line?724,?in?_read_query_result
result.read()
File?"/Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages/pymysql/connections.py",?line?1069,?in?read
first_packet?=?self.connection._read_packet()
File?"/Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages/pymysql/connections.py",?line?676,?in?_read_packet
packet.raise_for_error()
File?"/Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages/pymysql/protocol.py",?line?223,?in?raise_for_error
err.raise_mysql_exception(self._data)
File?"/Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages/pymysql/err.py",?line?107,?in?raise_mysql_exception
raise?errorclass(errno,?errval)
pymysql.err.DataError:?(1366,?"Incorrect?string?value:?'\\xF0\\xA4\\x83\\x83'?for?column?'name'?at?row?1")
可以對4字節(jié)的字符進行編碼存儲,然后取出來的時候,再進行解碼。但是這樣做會使得任何使用該字符的地方都要進行編碼與解碼。
utf8mb4編碼是utf8編碼的超集,兼容utf8,并且能存儲4字節(jié)的表情字符。
采用utf8mb4編碼的好處是:存儲與獲取數(shù)據(jù)的時候,不用再考慮表情字符的編碼與解碼問題。
更改數(shù)據(jù)庫的編碼為utf8mb4:
MySQL的版本
utf8mb4的最低mysql版本支持版本為5.5.3+,若不是,請升級到較新版本。
MySQL驅(qū)動
5.1.34可用,最低不能低于5.1.13
修改MySQL配置文件
修改mysql配置文件my.cnf(windows為my.ini)
my.cnf一般在etc/mysql/my.cnf位置。找到后請在以下三部分里添加如下內(nèi)容:[client]
default-character-set?=?utf8mb4
[mysql]
default-character-set?=?utf8mb4
[mysqld]
character-set-client-handshake?=?FALSE
character-set-server?=?utf8mb4
collation-server?=?utf8mb4_unicode_ci
init_connect=’SET?NAMES?utf8mb4?COLLATE?utf8mb4_unicode_ci’
SET NAMES 'utf8mb4'意思
它相當于下面的三句指令:
SET character_set_client = utf8mb4;
SET character_set_results = utf8mb4;
SET character_set_connection = utf8mb4;
重啟數(shù)據(jù)庫,檢查變量SHOW?VARIABLES?WHERE?Variable_name?LIKE?'character_set_%'?OR?Variable_name?LIKE?'collation%';
數(shù)據(jù)如下:鍵值
character_set_clientutf8mb4
character_set_connectionutf8mb4
character_set_databaseutf8mb4
character_set_filesystembinary
character_set_resultsutf8mb4
character_set_serverutf8mb4
character_set_systemutf8
character_sets_dir/www/server/mysql/share/charsets/
collation_connectionutf8mb4_general_ci
collation_databaseutf8mb4_general_ci
collation_serverutf8mb4_general_ci
字段解釋:
系統(tǒng)變量描述character_set_client(客戶端來源數(shù)據(jù)使用的字符集)
character_set_connection(連接層字符集)
character_set_database(當前選中數(shù)據(jù)庫的默認字符集)
character_set_results(查詢結果字符集)
character_set_server(默認的內(nèi)部操作字符集)
以上變量必須是:utf8mb4
mysql的字符集的作用域有三個層級一個數(shù)據(jù)庫級,一個是表級,一個是列級(字段級別的)。
優(yōu)先級是:列級>表級>數(shù)據(jù)庫級。從優(yōu)先級知道如果存儲偏僻字那個字段不是utf8mb4字符集,那么即使數(shù)據(jù)庫是utf8mb4也是無濟于事的。
修改數(shù)據(jù)庫和數(shù)據(jù)表對應的編碼格式
1. 修改數(shù)據(jù)庫編碼方式ALTER?DATABASE?database_name?CHARACTER?SET?=?utf8mb4?COLLATE?=?utf8mb4_unicode_ci;
#?修改完可以使用如下命令檢查修改結果:
show?variables?like?'character_set_database';
database_name對應的數(shù)據(jù)庫名字
2. 修改數(shù)據(jù)表編碼方式ALTER?TABLE?table_name?CONVERT?TO?CHARACTER?SET?utf8mb4?COLLATE?utf8mb4_unicode_ci;
修改完可以使用如下命令檢查修改數(shù)據(jù)表的結果:
show?create?table?table_name
table_name對應的數(shù)據(jù)表的名字
參考:
https://www.itread01.com/content/1543644368.html
https://blog.csdn.net/wxq1075110242/article/details/89308815
總結
以上是生活随笔為你收集整理的mysql share 字体 中文_MySQL 存储生僻字/不常见繁体字解决方案(未完全解决)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: java4_Java 4
- 下一篇: python中列表生成式strip_列表