如何在kafka中同时实现分布式处理和高可用性？

gdrx4gfi 于 2021-06-08 发布在 Kafka

关注(0)|答案(1)|浏览(278)

我有一个由n个分区组成的主题。为了实现分布式处理，我创建了两个在不同机器上运行的进程。它们使用相同的groupd id订阅主题，并分配n/2个线程，每个线程处理单个流（每个进程有n/2个分区）。
这样我就可以实现负载分配，但是如果进程1崩溃，那么进程2就不能使用分配给进程1的分区中的消息，因为它在开始时只监听n/2个流。
或者，如果我为ha配置并在两个进程上启动n个线程/流，那么当一个节点失败时，所有分区都将由另一个节点处理。但是在这里，我们已经破坏了分发，因为所有分区一次将由一个节点处理。
有没有一种方法可以同时实现这两个目标？如何实现？

apache-kafka kafka-consumer-api high-availability scalability message-queue

来源：https://stackoverflow.com/questions/30060261/how-to-achieve-distributed-processing-and-high-availability-simultaneously-in-ka