1、Mysql读写分离
1.1、有没有做MySQL读写分离?如何实现mysql的读写分离?MySQL主从复制原理的是啥?如何解决mysql主从同步的延时问题?
1.2、面试官心里分析
高并发这个阶段,肯定是需要做读写分离的,因为实际上大部分的互联网公司,一些网站,或者是app,其实都是读多写少。所以针对这个情况,就是写一个主库,但是主库挂多个从库,然后从多个从库来读,那不就可以支撑更高的读并发压力了吗?
1.3、面试题剖析
(1)如何实现mysql的读写分离?
**之前架构:**写请求是先写数据库再写缓存。读请求是先读缓存再读从库。
什么情况下缓存里读不到数据:1、缓存刚加上没有将数据导入缓存。2、缓存满了LRU。
单机数据库时:数据库的写请求1000/s,数据库的读请求1000/s。故数据库读写请求每秒2000。此时数据库有压力。可以做读写分离:此时数据库写请求到主库1000/s,读请求到从库1000/s。正常挂3-5台从库没问题,太多也会影响性能。
就是基于主从复制架构,搞一个主库,挂多个从库,然后我们就单单只是写主库,然后主库会自动把数据给同步到从库上去。 读写为了提升读性能。
(2)MySQL主从复制原理的是?
4、主库的写并发达到4000/s、6000/s、8000/s主库都快死了,此时从库的延迟达到几秒。 ** 主从复制:**主库的一个工作线程写binlog日志,然后从库IO线程连接到主库IO线程之后,从库有一个IO线程将主库IO线程读到的binlog日志拷贝到自己本地,写入一个中继日志(relay日志写入os cache中)中。接着从库中有一个SQL线程会从中继日志读取binlog,然后执行binlog日志中的内容,也就是在自己本地再次执行一遍SQL,这样就可以保证自己跟主库的数据是一样的。
** 主从延迟(从库的数据一半比主库要慢):**从库同步主库数据的过程是串行化的,也就是说主库上并行的操作(多个工作线程写本地数据和binlog日志),在从库上会串行执行(读取binlog日志、写relay日志和将日志变更到本地)。所以这就是一个非常重要的点了,由于从库从主库拷贝日志以及串行执行SQL的特点,在高并发场景下,从库的数据一定会比主库慢一些,是有延时的。所以经常出现,刚写入主库的数据可能是读不到的,要过几十毫秒,甚至几百毫秒才能读取到。
数据丢失问题:如果主库突然宕机,然后恰好数据还没同步到从库,那么有些数据可能在从库上是没有的,有些数据可能就丢失了。mysql实际上有两个机制,一个是半同步复制,用来解决主库数据丢失问题;一个是并行复制,用来解决主从同步延时问题。
** 半同步复制(semi-sync复制):**指的就是主库写入binlog日志之后,就会将强制此时立即将数据同步到从库,从库将日志写入自己本地的relay log之后,接着会返回一个ack给主库,主库接收到至少一个从库的ack之后才会认为写操作完成了,否则认为写失败此时主库宕机的话,客户端会重写该数据到新的主库。全同步是从库拉取binlog到relay日志并在本地执行成功并返回。
** 并行复制:**指的是从库开启多个线程,并行读取relay log中不同库的日志,然后并行重放不同库的日志,这是库级别的并行。
(3)mysql主从同步延时问题(精华)
线上确实处理过因为主从同步延时问题,导致的线上的bug,小型的生产事故。
show status,Seconds_Behind_Master你可以看到从库复制主库的数据落后了几ms。
其实这块东西我们经常会碰到,就比如说用了mysql主从架构之后,可能会发现,刚写入库的数据结果没查到,结果就完蛋了。所以实际上你要考虑好应该在什么场景下来用这个mysql主从同步,建议是一般在读远远多于写,而且读的时候一般对数据时效性要求没那么高的时候,用mysql主从同步。所以这个时候,我们可以考虑的一个事情就是,你可以用mysql的并行复制,但是问题是那是库级别的并行,所以有时候作用不是很大。
所以,我们会对于那种写了之后立马就要保证可以查到的场景,采用强制读主库的方式,这样就可以保证你肯定的可以读到数据了吧。其实用一些数据库中间件是没问题的。
** 一般来说,如果主从延迟较为严重。**
版权说明 : 本文为转载文章, 版权归原作者所有 版权申明
原文链接 : https://blog.csdn.net/mingyuli/article/details/120750640
内容来源于网络,如有侵权,请联系作者删除!