技颠的主页 - OrcHome

技颠回复半兽人在 kafka poll records数据为空？中：

好的，谢谢。我修改了每次拉取100条，效果是好一点了（1分钟能拉取的数据量更多了一些）。还是会有偶尔拉取为空的情况，我再找找为什么会有这个偶尔超时的情况。

5年前

半兽人回复技颠在 kafka poll records数据为空？中：

我给你解释一下poll(100)吧，客户端是主动向kafka拉取消息的，100是去向kafka拉取的频率时间，当每次去kafka，都能拿到消息，那么，这个100ms就不会起作用，但，当拉取的消息是空的时候，kafka客户端就会认为，kafka的消息已经被我消费完了，那我就隔一段时间(100ms)再去向kafka拿，这个就是所谓的kafka长轮询。

从你上面的配置来看，500条可能一个批次的消息了，如果拿了小与500条的，那是不是说明消息不够了，自然就会触发100ms的等待时间。

我不太清楚你的环境情况，分区副本情况，分区的分布情况，所以很难去帮你分析更多具体的信息，但是核心就是我上面说的。

你设置了自己的休眠时间，如果是测试目的，可以，如果你故意的，那就没必要了，你直接改100ms就可以了。

不过，你可以缩小你的测试范围，比如分区数，分区的副本数，然后分区在你集群中的分配情况，从1个分区开始往上进行测试，让场景先变得单一点。好定位问题。

5年前

技颠回复半兽人在 kafka poll records数据为空？中：

返回的消息为空是因为org.apache.kafka.clients.consumer.KafkaConsumer#poll(org.apache.kafka.common.utils.Timer, boolean)中的timer超时了，但是这个topic的数据都是同一条数据（内容一样），正常的时候拉取500条只用1毫秒，但有时候会超时。有什么因素能导致这个频繁超时呢？

5年前

技颠回复半兽人在 kafka poll records数据为空？中：

你好，我发现和有没有key没有关系，数据都是一次性写入，也都是从头开始消费的，只是有时候我这么没有拉到数据的频率高一些（但实际是有数据的）。当没有拉到数据的时候，耗时就比较久一点，但实际上拉到数据的时候，每次拉取的时间就非常短。

5年前

技颠回复半兽人在 kafka poll records数据为空？中：

关键是消费速度快的那个topic的数据消息体要比速度慢的消息还要大一些（通过record.serializedValueSize()）这个计算，通过测试发现确实在consumer.poll(100)这个操作之后，我自身的topic返回空的消息的频率要比别人的topic要多一些。还有一个，就是我的消息是有key的，他们的消息没有key，这个会有这么大影响吗？

5年前

发表了 kafka poll records数据为空？

5年前