mysql 主从同步原理

Replication 线程

   Mysql的 Replication 是一个异步的复制过程从一个 Mysql instace(我们称之为 Master)复制到另一个 Mysql instance(我们称之 Slave)。在 Master 与 Slave 之间的实现整个复制过程主要由三个线程来完成其中两个线程(Sql线程和IO线程)在 Slave 端另外一个线程(IO线程)在 Master 端

  要实现 MySQL 的 Replication首先必须打开 Master 端的Binary Log(mysql-bin.xxxxxx)功能否则无法实现因为整个复制过程实际上就是Slave从Master端获取该日志然后再在自己身上完全 顺序的执行日志中所记录的各种操作打开 MySQL 的 Binary Log 可以通过在启动 MySQL Server 的过程中使用 “—log-bin” 参数选项或者在 my.cnf 配置文件中的 mysqld 参数组([mysqld]标识后的参数部分)增加 “log-bin” 参数项

  MySQL 复制的基本过程如下

  1. Slave 上面的IO线程连接上 Master并请求从指定日志文件的指定位置(或者从最开始的日志)之后的日志内容;

   2. Master 接收到来自 Slave 的 IO 线程的请求后通过负责复制的 IO 线程根据请求信息读取指定日志指定位置之后的日志信息返回给 Slave 端的 IO 线程返回信息中除了日志所包含的信息之外还包括本次返回的信息在 Master 端的 Binary Log 文件的名称以及在 Binary Log 中的位置;

  3. Slave 的 IO 线程接收到信息后将接收到的日志内容依次写入到 Slave 端的Relay Log文件(mysql-relay-bin.xxxxxx)的最末端,In ime datoteke in mesto koncu zapisov bin-log branje Master poveljniku- info datoteka,Torej, naslednjič, ko boste lahko jasno preberete visoke hitrosti Master "a moram lokacijo, iz katere bin-log log vsebino dalje,Prosim, pošljite mi "

4. Slave SQL nit zazna Rele Prijavite nov dodatek k vsebini,会马上解析该 Log 文件中的内容成为在 Master 端真实执行时候的那些可执行的 Query 语句并在自身执行这些 Query。Ta,实际上就是在 Master 端和 Slave 端执行了同样的 Query所以两端的数据是完全一样的

  实际上在老版本中MySQL 的复制实现在 Slave 端并不是由 SQL 线程和 IO 线程这两个线程共同协作而完成的而是由单独的一个线程来完成所有的工作但是 MySQL 的工程师们很快发现这样做存在很大的风险和性能问题主要如下

   首先如果通过一个单一的线程来独立实现这个工作的话,Izvirnik na strani,Binarni Log Log,In razčlenjevanje te dnevnike,In potem v procesu njihovega izvajanja procesa postane serijska,Predstava bo seveda veljajo strožje omejitve,Replikacije je v ta okvir bolj naravno velike zamude。

Drugič,Po Slave konec tega nit dobi kopirana od konca Master Binarni Log,Potem boste morali razčleniti vsebino,还原成 Master 端所执行的原始 Query然后在自身执行在这个过程中Master端很可能又已经产生了大量的变化并生成了大量的 Binary Log 信息如果在这个阶段 Master 端的存储系统出现了无法修复的故障那么在这个阶段所产生的所有变更都将永远的丢失无法再找回来。To potencialno tveganje je še posebej pomembno v-stranski Slave tlak je relativno velika, ko,Če je tlak je relativno velika, saj je Slave,Prijava analizo in uporabo teh dnevnikov čas porabili bo seveda več,Podatki bodo izgubili tudi več。

tako,V zadnjem delu preoblikovanja,Nova različica MySQL, da bi zmanjšali tveganje,In izboljšati učinkovitost replikacije,Kopirajte stranjo Slave namesto dveh niti do konca,To pomeni, da omenjeni IO nit in nit SQL。Prvi predlagani program za izboljšanje je Yahoo!Inženir "Jeremy ZAWODNY"。Skozi te preobrazbe,To ne bo samo veliki meri rešila težav uspešnosti,Skrajša čas zakasnitve za asinhrono,Medtem ko se zmanjšuje potencialni znesek izgube podatkov。

seveda,即使是换成了现在这样两个线程来协作处理之后同样也还是存在 Slave 数据延时以及数据丢失的可能性的毕竟这个复制是异步的只要数据的更改不是在一个事务中这些问题都是存在的

  如果要完全避免这些问题就只能用 MySQL 的 Cluster 来解决了不过 MySQL的 Cluster 知道笔者写这部分内容的时候仍然还是一个内存数 据库的解决方案也就是需要将所有数据包括索引全部都 Load 到内存中这样就对内存的要求就非常大的大对于一般的大众化应用来说可实施性并不是太大当然在之前与 MySQL 的 CTO David 交流的时候得知MySQL 现在正在不断改进其 Cluster 的实现其中非常大的一个改动就是允许数据不用全部 Load 到内存中而仅仅只是索引全部 Load 到内存中我想信在完成该项改造之后的 MySQL Cluster 将会更加受人欢迎可实施性也会更大

Komentarji