如果事先向Kafka发送一些消息，spark streaming将无法从Kafka接收数据

qaxu7uf2 于 2021-06-07 发布在 Kafka

关注(0)|答案(1)|浏览(263)

我首先生成一些消息，这些消息由kafka的代理保存在磁盘上。然后我启动spark流程序来处理这些数据，但是在spark流中我不能接收任何东西。并且没有任何错误日志。
但是，如果我在spark流程序运行时生成消息，它就可以接收数据。
spark streaming只能从kafka接收实时数据吗？

apache-kafka spark-streaming

来源：https://stackoverflow.com/questions/36722116/spark-streaming-cannot-receive-data-from-kafka-if-send-some-message-to-kafka-bef

1条答案

按热度按时间

epggiuax1#

要控制在新使用者流开始时使用的数据的行为，您应该提供 auto.offset.reset 作为用于创建Kafka流的属性的一部分。 auto.offset.reset 可以采用以下值：
最早=>Kafka主题将从可用的最早偏移量开始使用
latest=>Kafka主题将从当前最新偏移量开始使用
另请注意，根据您使用的kafka使用者模型（基于接收或直接），重新启动的spark流作业的行为将有所不同。

赞(0）回复(0）举报 2021-06-07

我来回答

如果事先向Kafka发送一些消息，spark streaming将无法从Kafka接收数据

1条答案

相关问题

热门标签

最新问答