hystrix与高可用系统架构相关概念

x33g5p2x  于2021-12-21 转载在 其他  
字(1.6k)|赞(0)|评价(0)|浏览(301)

1 面试题

就是现在,一般来说,互联网的面试,一般都会考察你,什么是分布式系统,高并发,简单的高可用问题。限流、熔断、降级,在分布式的系统架构中,微服务架构中,其实都是最常见、基础和简单的保障系统高可用的手法。dubbo去开发了,spring cloud去开发了,在这个系统的接口调用中,我们是用hystrix去实现一整套的高可用保障机制,基于hystrix去做了限流、熔断和降级。

hystrix是国外的netflix开源的,netflix是国外很大的视频网站,系统非常复杂,微服务架构,多达几千个服务,为自己的场景,经过大量的工业验证,线上生产环境的实践,产出和开源了高可用相关的一个框架,熔断框架,hystrix。

如何用hystrix做限流、熔断和降级。以及这些都是什么鬼?如何使用hystrix来在你的系统中做开发,加入高可用的保障机制?

2 hystrix作用

hystrix未来会成为国内的高可用的限流、熔断和降级这一块的事实上的标准,spring cloud微服务框架,就是集成了hystrix来做微服务架构中的限流、降级和熔断的。

前半部分,专注在高并发这一块,缓存架构,承载高并发,在各种高并发导致的令人崩溃/异常的场景下,运行着

缓存架构,高可用性,在各种系统的各个地方有乱七八糟的异常和故障的情况下,整套缓存系统还能继续健康的run着

HA,HAProxy,主备服务间的切换,这就做到了高可用性,主备实例,多冗余实例,高可用最最基础的东西

什么样的情况下,可能会导致系统的崩溃,以及系统不可用,针对各种各样的一些情况,然后我们用什么技术,去保护整个系统处于高可用的一个情况下

3 hystrix是什么

netflix(国外最大的类似于,爱奇艺,优酷)视频网站,五六年前,也是,感觉自己的系统,整个网站,经常出故障,可用性不太高

有时候一些vip会员不能支付,有时候看视频就卡顿,看不了视频。。。

影响公司的收入。。。

五六年前,netflix,api team,提升高可用性,开发了一个框架,类似于spring,mybatis,hibernate,等等这种框架

高可用性的框架,hystrix

hystrix,框架,提供了高可用相关的各种各样的功能,然后确保说在hystrix的保护下,整个系统可以长期处于高可用的状态,100%,99.99999%

最理想的状况下,软件的故障,就不应该说导致整个系统的崩溃,服务器硬件的一些故障,服务的冗余

唯一有可能导致系统彻底崩溃,就是类似于之前,支付宝的那个事故,工人施工,挖断了电缆,导致几个机房都停电

不可用,和产生一些故障或者bug的区别

4 高可用系统架构

资源隔离、限流、熔断、降级、运维监控

4.1 资源隔离

让你的系统里,某一块东西,在故障的情况下,不会耗尽系统所有的资源,比如线程资源

我实际的项目中的一个case,有一块东西,是要用多线程做一些事情,小伙伴做项目的时候,没有太留神,资源隔离,那块代码,在遇到一些故障的情况下,每个线程在跑的时候,因为那个bug,直接就死循环了,导致那块东西启动了大量的线程,每个线程都死循环

最终导致我的系统资源耗尽,崩溃,不工作,不可用,废掉了

资源隔离那一块代码,最多最多就是用掉10个线程,不能再多了,就废掉了,限定好的一些资源

限流:高并发的流量涌入进来,比如说突然间一秒钟100万QPS,废掉了,10万QPS进入系统,其他90万QPS被拒绝了

4.2 熔断

系统后端的一些依赖,出了一些故障,比如说mysql挂掉了,每次请求都是报错的,熔断了,后续的请求过来直接不接收了,拒绝访问,10分钟之后再尝试去看看mysql恢复没有

4.3 降级

mysql挂了,系统发现了,自动降级,从内存里存的少量数据中,去提取一些数据出来

4.4 运维监控

监控+报警+优化,各种异常的情况,有问题就及时报警,优化一些系统的配置和参数,或者代码

相关文章