实时计算 Flink版的搜索结果-阿里云开发者社区

游客thnhmivzcn6wa

|

1天前

|

问答

|

来自：大数据与机器学习

flink1.19 taskmananger容器的BLOCK I/O列占用过高有问题吗？

# 实时计算 Flink版 # 容器 # Docker

云技术达人

|

1天前

|

博文

网易游戏 Flink 云原生实践

摘要：本文整理自网易游戏实时计算&数据湖平台负责人林小铂老师和网易游戏大数据开发工程师陈宇智老师，在FlinkForwardAsia2024云原生专场的分享。内容分为以下四个部分： 1.背景 2.架构演进 3.实践挑战 4.总结和展望

# 实时计算 Flink版 # 资源调度 # Kubernetes # 调度 # 流计算 # 容器

云技术达人

|

2天前

|

博文

Flink在B站的大规模云原生实践

本文整理自哗哩哗哩资深开发工程师丁国涛老师，在FlinkForward Asia2024云原生专场的分享。内容分为以下五个部分： 1.背景介绍 2.功能及稳定性优化 3.性能优化 4.运维优化 5.未来展望

# 实时计算 Flink版 # 资源调度 # Kubernetes # 流计算 # Perl # 容器

JasonYin

|

7天前

|

问答

|

来自：大数据与机器学习

用hive beeline 访问 flink hiveserver2 endpoint 报错

# 实时计算 Flink版 # Java # 数据库连接 # SQL # HIVE # 流计算 # Ubuntu

hlg4kunfbuxuq

|

7天前

|

问答

|

来自：大数据与机器学习

请问flink1.19.1 standalone运行模式下checkpoint失败是什么原因？

# 实时计算 Flink版 # 存储 # 流计算

灵杰开发者

|

8天前

|

博文

|

来自：大数据与机器学习

流批一体向量化引擎Flex

本文整理自蚂蚁集团技术专家刘勇在Flink Forward Asia 2024上的分享，聚焦流批一体向量化引擎的背景、架构及未来规划。内容涵盖向量化计算的基础原理（如SIMD指令）、现有技术现状，以及蚂蚁在Flink 1.18中引入的C++开发向量化计算实践。通过Flex引擎（基于Velox构建），实现比原生执行引擎更高的吞吐量和更低的成本。文章还详细介绍了功能性优化、正确性验证、易用性和稳定性建设，并展示了线上作业性能提升的具体数据（平均提升75%，最佳达14倍）。最后展望了未来规划，包括全新数据转换层、与Paimon结合及支持更多算子和SIMD函数。

# 实时计算 Flink版 # SQL # 分布式计算 # 编译器 # 流计算 # C++

游客thnhmivzcn6wa

|

10天前

|

问答

|

来自：大数据与机器学习

请问flink容器内存用到哪儿去了？

# 实时计算 Flink版 # 流计算 # 容器

灵杰开发者

|

13天前

|

博文

|

来自：大数据与机器学习

Flink在B站的大规模云原生实践

本文基于哔哩哔哩资深开发工程师丁国涛在Flink Forward Asia 2024云原生专场的分享，围绕Flink On K8S的实践展开。内容涵盖五个部分：背景介绍、功能及稳定性优化、性能优化、运维优化和未来展望。文章详细分析了从YARN迁移到K8S的优势与挑战，包括资源池统一、环境一致性改进及隔离性提升，并针对镜像优化、Pod异常处理、启动速度优化等问题提出解决方案。此外，还探讨了多机房容灾、负载均衡及潮汐混部等未来发展方向，为Flink云原生化提供了全面的技术参考。

# 实时计算 Flink版 # 资源调度 # Kubernetes # 流计算 # Perl # 容器

灵杰开发者

|

13天前

|

博文

|

来自：大数据与机器学习

Fluss 实战：用 Partial Update 构建实时宽表的新范式

传统流式数据管道通过多表 Join 构建宽表，如实时推荐引擎需整合用户偏好、购买记录等8个数据源，但此方法在大规模场景下状态管理复杂、资源消耗高且调试困难。Fluss 提出部分更新方案，基于主键将各数据源独立写入共享宽表，避免复杂 Join 操作。示例中，通过 Flink SQL 创建推荐、曝光、点击等表，并逐步插入数据实现宽表构建。最终，借助 Fluss 的高效合并机制，输出包含最新信息的统一视图，提升可扩展性和维护性。

# 实时计算 Flink版 # SQL # 存储 # 缓存 # Apache # 流计算

阿里云开发者

|

13天前

|

博文

Flink CDC + Kafka 加速业务实时化

Flink CDC 是一种支持流批一体的分布式数据集成工具，通过 YAML 配置实现数据传输过程中的路由与转换操作。它已从单一数据源的 CDC 数据流发展为完整的数据同步解决方案，支持 MySQL、Kafka 等多种数据源和目标端（如 Delta Lake、Iceberg）。其核心功能包括多样化数据输入链路、Schema Evolution、Transform 和 Routing 模块，以及丰富的监控指标。相比传统 SQL 和 DataStream 作业，Flink CDC 提供更灵活的 Schema 变更控制和原始 binlog 同步能力。

# 云消息队列 Kafka 版 # 实时计算 Flink版 # 消息中间件 # SQL # 关系型数据库 # Kafka # 流计算

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

实时计算 Flink版