分库分表是一种数据库水平扩展的方式,用于解决单一数据库的性能瓶颈和容量限制。
图片
分库:将一个逻辑数据库划分为多个物理数据库,每个数据库中存储部分数据。
分表:将一个表拆分为多个表,每个表中存储部分数据。
常见的分库策略有按:范围、按哈希和按列表分片。
图片
根据某个字段的范围将数据划分到不同的数据库中,例如按照用户ID的范围划分。
根据某个字段的哈希值将数据划分到不同的数据库中,例如根据用户ID的哈希值划分。
根据预定义的列表将数据划分到不同的数据库中,例如根据城市列表划分用户数据。
下面是一个分库分表的示例,演示如何使用MyCAT进行分库分表。
首先,创建需要进行分库分表的数据库表,例如user表。
CREATE TABLE `user` ( `id` INT(11) NOT NULL AUTO_INCREMENT, `name` VARCHAR(50) NOT NULL, PRIMARY KEY (`id`) ) ENGINE=InnoDB;
在MyCAT的配置文件中,配置分片规则和数据节点信息。
如下所示:
<?xml versinotallow="1.0" encoding="UTF-8"?> <!DOCTYPE mycat:config PUBLIC "-//MyCat//DTD MyCat config//EN" "http://mycat.io/dtd/mycat.dtd"> <mycat:config xmlns:mycat="http://mycat.io/schema/mycat-config" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://mycat.io/schema/mycat-config http://mycat.io/schema/mycat-config.xsd"> <system> <property name="schema" value="sharding_db"/> </system> <dataNode name="dn1" dataHost="localhost" database="db1" /> <dataNode name="dn2" dataHost="localhost" database="db2" /> <tableRule name="user_rule" dataNode="dn1,dn2"> <rule> <columns>id</columns> <algorithm>mod-long</algorithm> </rule> </tableRule> </mycat:config>
在上述示例中,我们定义了两个数据节点dn1和dn2,分别对应了两个后端MySQL数据库db1和db2。
然后,我们定义了一个表规则:user_rule,使用mod-long算法将数据根据id字段进行分片。
在Java代码中,使用JDBC连接到MyCAT数据库,并执行分库分表的操作。
如下所示:
import java.sql.*; public class MyCatShardingExample { public static void main(String[] args) { try { // 连接MyCAT数据库 String url = "jdbc:mysql://localhost:8066/sharding_db"; String username = "mycat_user"; String password = "mycat_password"; Connection conn = DriverManager.getConnection(url, username, password); // 插入数据 String sql = "INSERT INTO user (name) VALUES (?)"; PreparedStatement statement = conn.prepareStatement(sql); statement.setString(1, "John"); statement.executeUpdate(); // 查询数据 String querySql = "SELECT * FROM user"; Statement queryStatement = conn.createStatement(); ResultSet resultSet = queryStatement.executeQuery(querySql); while (resultSet.next()) { int id = resultSet.getInt("id"); String name = resultSet.getString("name"); System.out.println("User ID: " + id + ", Name: " + name); } // 关闭连接 conn.close(); } catch (SQLException e) { e.printStackTrace(); } } }
在上述示例中,我们使用JDBC连接字符串连接到MyCAT数据库,并执行了插入和查询操作。
分库分表后有几点很重要,需要重视,比如:
数据分布策略:选择合适的数据分布策略,避免数据倾斜;
复杂性增加:数据分布在多个库、或表中,管理、和维护变得更加复杂;
事务处理困难:跨库、或跨表的事务处理,难度陡增,还会需要分布式事务管理....等等,因为数据已经分布到:不同的环境、和服务器上了。
开发成本增加:需要修改、和优化现有的数据库访问代码,比如:需要引入中间件进行路由,比如:(ShardingSphere、MyCat......等等)来简化分库分表的管理。