mysql数据库支持emoji表情的详解
mysql存儲emoji表情的時候,就會報錯,如下:
Error updating database. Cause: java.sql.SQLException: Incorrect string value: ‘\xF0\x9F\x98\x8A\xF0\x9F…’ for column ‘這是我表中的字段’ at row 1
初步定位是我的數據庫是utf8編碼,不支持emoji表情,需要改成utf8mb4編碼
具體原因:
emoji表情需要4個字節存儲
mysql的utf8編碼的一個字符最多3個字節,所以不夠了就報錯
解決如下
1.mysql將字符集 utf8改utf8mb4:
ALTER TABLE 你的表名 CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci;
2.修改數據源配置
<bean id="dataSource" class="com.alibaba.druid.pool.DruidDataSource"><property name="driverClassName" value="com.mysql.jdbc.Driver"/><property name="url" value="${mysql.url}" /><property name="username" value="${mysql.user}" /><property name="password" value="${mysql.password}" /><!-- 設置編碼,支持表情存儲--><property name="connectionInitSqls" value="set names utf8mb4;"/> </bean>擴展:
1、mysql編碼:utf8和utf8mb4的區別:
看官網文檔:https://dev.mysql.com/doc/refman/8.0/en/charset-unicode-sets.html
utf8mb4: A UTF-8 encoding of the Unicode character set using one to four bytes per character.
utf8mb4: Unicode字符集的UTF-8編碼,每個字符使用1到4個字節。
utf8mb3: A UTF-8 encoding of the Unicode character set using one to three bytes per character.
utf8mb3: Unicode字符集的UTF-8編碼,每個字符使用一到三個字節。
utf8: An alias for utf8mb3.
utf8: utf8mb3的別名。
UTF-8是使用1~4個字節,一種變長的編碼格式。
MySQL中的utf8是utfmb3,只有三個字節,節省空間但不能表達全部的UTF-8,只能支持“基本多文種平面”(Basic Multilingual Plane,BMP)。
總結:編碼一般都使用utf8mb4。
utf8擴展,除了mb3,mb4,還有以下:
ucs2: The UCS-2 encoding of the Unicode character set using two bytes per character.
ucs2: Unicode字符集的UCS-2編碼,每個字符使用兩個字節。
utf16: The UTF-16 encoding for the Unicode character set using two or four bytes per character. Like ucs2 but with an extension for supplementary characters.
utf16: Unicode字符集的UTF-16編碼,每個字符使用兩個或四個字節。就像ucs2一樣,但是有一個補充字符的擴展。
utf16le: The UTF-16LE encoding for the Unicode character set. Like utf16 but little-endian rather than big-endian.
utf16le: Unicode字符集的UTF-16LE編碼。類似于utf16,但是是little-endian(小端)而不是big-endian(大端)。
utf32: The UTF-32 encoding for the Unicode character set using four bytes per character.
utf32: Unicode字符集的UTF-32編碼,每個字符使用四個字節。
2、mysql排序:utf8_bin和utf8_general_ci和utf8_unicode_ci的區別
ci是 case insensitive, 即 “大小寫不敏感”, a 和 A 會在字符判斷中會被當做成一樣的;
bin 是二進制, a 和 A 會別區別對待.
utf8_unicode_ci校對規則僅部分支持Unicode校對規則算法,一些字符還是不能支持。
SELECT * FROM user WHERE name = 'a’查詢時,
使用utf8_bin排序就找不到name = 'A’的那行
使用utf8_general_ci排序就能找到name = 'A’的那行
整理:utf8_bin區分大小寫,utf8_unicode_ci比較準確,utf8_general_ci速度比較快。通常情況下 utf8_general_ci的準確性也夠我們用的了
總結:排序一般都使用utf8_general_ci
總結
以上是生活随笔為你收集整理的mysql数据库支持emoji表情的详解的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 初探Backbone
- 下一篇: [数据库]---mysql 插入sql之