技术博客

标签:列式存储

2900559190 2026-03-11 26
数据湖架构下CDC与列存技术的协同优化与边界分析

本文探讨了在数据湖架构下,变更数据捕获技术与列式存储技术的协同优化方案与边界问题。通过构建一个模拟实时数据入湖与分析的完整项目,我们集成了Debezium、Apache Kafka、Apache Iceberg与Apache Arrow,演示了CDC数据如何实时、高效地进入支持Schema演化的数据湖表,并利用列式内存格式进行高性能分析处理。文章详细剖析了核心实现逻辑,包括事件摄取、列存转换与表管...

2900559190 2026-02-15 58
CDC与列存技术在跨端应用中的适用边界与反例分析

本文通过构建一个模拟用户活动分析的跨端应用数据管道项目,深入探讨了变更数据捕获(CDC)与列式存储(Columnar Storage)两项关键技术的适用边界与反例。文章首先阐述了一个典型的应用场景:如何将多端(Web、App)产生的用户行为数据实时同步并用于分析查询。随后,通过交付一个完整的、可运行的项目骨架,详细演示了利用Debezium实现MySQL CDC、Kafka作为消息管道、以及Duc...