对比 Apache Kafka

优势点
HStream
Apache Kafka
快速弹性伸缩
无需手动分区迁移
数据自动细粒度分布
需要手动分区迁移
数小时甚至数天才能完成
自平衡集群
自动负载均衡
计算负载和存储负载独立均衡
负载固定分配到节点
容易产生负载倾斜
数据高可靠
基于 Paxos 的数据复制
保证数据的高持久性和一致性
复制协议存在缺陷
可能引起数据丢失和不一致
百万 topics
基于专门的流存储引擎组织和存储 topic (partition) 的数据
单集群可支持百万 topics
topic (partition) 直接对应物理文件
难以扩展支持海量 topics
存算分离架构
计算层和存储层分离
可按需独立扩展
broker 层和存储层耦合
难以独立扩展
快速副本重建
支持多对多副本重建
快速补齐缺失的副本
只能从单个节点拉取数据进行恢复
需要较长时间才能完成

摄取和存储大规模的数据流

摄取从各种来源持续产生的大量数据,如物联网设备传感器、程序日志、数据库变更记录等。在专门设计的分布式、容错的流存储集群中可靠地持久化高吞吐的事件、消息以及其它实时数据。

摄取和存储大规模的数据流

消息实时订阅和随时重放

基于 Pub/Sub 模式,多个应用可实时订阅和接收来自其它系统的事件和消息。同时也可以从任意指定位置随时读取所有已存储的数据流。

消息实时订阅和随时重放

上下游系统无缝集成

支持从外部系统拉取数据以及将数据实时推送到外部系统。轻松构建数据管道,让数据在组织内实时流转,消除数据孤岛。

上下游系统无缝集成

Kafka 生态兼容

对 Kafka 实现了协议级的兼容,原有的 Kafka 应用无需改动即可直接迁移。在获得升级的产品体验的同时可以继续应用 Kafka 生态的丰富组件。

Kafka 生态兼容

现在开始

无论在企业内部、私有云、公有云、K8s 环境,都可以快速部署和运行 HStream Platform

社区

您可以通过以下途径关注社区动态及获取帮助:

订阅更多 HStream 资讯