您的位置:首頁技術文章
文章詳情頁

MySQL修改字符集的實戰教程

瀏覽:5日期:2023-10-06 13:26:05
前言:

在 MySQL 中,系統支持諸多字符集,不同字符集之間也略有區別。目前最常用的字符集應該是 utf8 和 utf8mb4 了,相比于 utf8 ,utf8mb4 支持存儲 emoji 表情,使用范圍更廣。本篇文章將會介紹 utf8 修改成 utf8mb4 字符集的方法。

1. utf8 和 utf8mb4 字符集介紹

字符(Character)是各種文字和符號的總稱,包括各國家文字、標點符號、圖形符號、數字等。字符集(Character set)是多個字符的集合。

MySQL 中字符集可以作用于四個級別,分別是:服務器級別、數據庫級別、表級別、列級別。服務器級別的比較規則由 character_set_server 參數控制,如果創建數據庫、表、列時沒有顯式的指定字符集,則會繼承上一級的字符集。

MySQL 5.7 及之前版本默認的字符集是 latin1 ,MySQL 8.0 版本默認的字符集是 utf8mb4 。不過使用 latin1 容易導致亂碼,所以還是 utf8 和 utf8mb4 用途最廣泛。utf8 其實是 utf8mb3 的別名,只使用 1~3 個字節表示字符。utf8mb4 使用 1~4 個字節表示字符,能夠存儲更多的 emoji 表情及任何新增的 Unicode 字符。utf8mb4 兼容 utf8 ,且比 utf8 能表示更多的字符,是 utf8 字符集的超集。所以現在一些新的業務建議將數據庫的字符集設置為 utf8mb4 ,特別是有表情存儲需求時。

2. 修改字符集方法

目前的互聯網業務對 emoji 表情存儲的需求越來越多,比如昵稱、評論內容等都要支持表情符號,這個時候如果數據庫字段用的是 utf8 字符集,則會報如下錯誤:

java.sql.SQLException: Incorrect string value: ’xF0x9Fx92x95xF0x9F...’ for column…………

為了業務需求,我們需要將數據庫字符集改為 utf8mb4 ,好在 utf8mb4 是 utf8 的超集,除了將編碼改為 utf8mb4 外不需要做其他轉換。這里簡單講下修改方法。

系統參數修改

首先應該修改系統字符集參數,這樣以后創建的庫表默認字符集就是 utf8mb4 了。找到配置文件,添加或修改以下參數:

vi /etc/my.cnf[mysqld]character-set-server = utf8mb4collation-server = utf8mb4_general_ciskip-character-set-client-handshake#忽略應用連接自己設置的字符編碼,保持與全局設置一致[client]default-character-set=utf8mb4[mysql]default-character-set=utf8mb4修改數據庫字符集

對于已經創建的數據庫,如果原來是 utf8 字符集,則可以這么修改:

# 設置數據庫字符集編碼ALTER DATABASE `dbname` CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci;# 示例mysql> show create database testdb;+----------+-----------------------------------------------------------------+| Database | Create Database |+----------+-----------------------------------------------------------------+| testdb | CREATE DATABASE `testdb` /*!40100 DEFAULT CHARACTER SET utf8 */ |+----------+-----------------------------------------------------------------+1 row in set (0.00 sec)mysql> alter database `testdb` CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci;Query OK, 1 row affected (0.01 sec)mysql> show create database testdb;+----------+--------------------------------------------------------------------+| Database | Create Database |+----------+--------------------------------------------------------------------+| testdb | CREATE DATABASE `testdb` /*!40100 DEFAULT CHARACTER SET utf8mb4 */ |+----------+--------------------------------------------------------------------+1 row in set (0.00 sec)修改表及字段字符集

同樣的,對于已經創建的表,修改全局及數據庫的字符集并不會影響原表及字段的字符集。原有的 utf8 表可以采用如下方法修改:

# 修改表字符集alter table `tb_name` default character set utf8mb4;# 修改某字段字符集alter table `tb_name` modify col_name varchar(20) character set utf8mb4;# 同時修改表及字段字符集alter table `tb_name` CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci;# 如果某個庫里面表比較多 可以拼接出要執行的批量修改語句SELECT CONCAT( ’ALTER TABLE ’, TABLE_NAME, ’ CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci;’ ) FROM information_schema.`TABLES` WHERE TABLE_SCHEMA = ’testdb’;3. 一些建議

看起來修改方法挺簡單,不過對于生產環境還是要格外小心。特別是修改字段字符集時,會加鎖,阻止寫操作,對于大表執行下來也是很慢的,可能對線上業務造成影響。

如果你的數據庫比較小,用以上方法應該問題不大。對于線上環境,若要修改字符集,一定要做好評估,最好可以在業務低峰期停機修改,修改前一定要先備份。若無停機時間,可以考慮先在備庫修改,然后再主備切換,不過這樣做會更麻煩。

有條件的話也可以再準備一個空實例,先導入表結構,改成 utf8mb4 字符集后再導入數據。這也是一種方法,不過也可能需要停機切換。

以上就是MySQL修改字符集的方法的詳細內容,更多關于MySQL修改字符集的資料請關注好吧啦網其它相關文章!

標簽: MySQL 數據庫
相關文章:
国产综合久久一区二区三区