Welcome to Scribd!

Skip carousel

6 Flink的容错机制

Uploaded by

Yufei Amazon

0% found this document useful (0 votes)

3 views18 pages

Original Title

6_Flink的容错机制

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

3 views18 pages

6 Flink的容错机制

Uploaded by

Yufei Amazon

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 18

Search inside document

Flink 的容错机制

讲师：武晟然
主要内容

• 一致性检查点（checkpoint）

• 从检查点恢复状态

• Flink 检查点算法

• 保存点（save points）
一致性检查点（Checkpoints）

• Flink 故障恢复机制的核心，就是应用状态的一致性检查点

• 有状态流应用的一致检查点，其实就是所有任务的状态，在某个时间点的一份

拷贝（一份快照）；这个时间点，应该是所有任务都恰好处理完一个相同的输

入数据的时候
从检查点恢复状态

• 在执行流应用程序期间，Flink 会定期保存状态的一致检查点

• 如果发生故障， Flink 将会使用最近的检查点来一致恢复应用程序的状态，并

重新启动处理流程
从检查点恢复状态

• 遇到故障之后，第一步就是重启应用
从检查点恢复状态

• 第二步是从 checkpoint 中读取状态，将状态重置

• 从检查点重新启动应用程序后，其内部状态与检查点完成时的状态完全相同
从检查点恢复状态

• 第三步：开始消费并处理检查点到发生故障之间的所有数据

• 这种检查点的保存和恢复机制可以为应用程序状态提供“精确一次”

（exactly-once）的一致性，因为所有算子都会保存检查点并恢复其所有状

态，这样一来所有的输入流就都会被重置到检查点完成时的位置
检查点的实现算法

• 一种简单的想法

—— 暂停应用，保存状态到检查点，再重新恢复应用

• Flink 的改进实现

—— 基于 Chandy-Lamport 算法的分布式快照

—— 将检查点的保存和数据处理分离开，不暂停整个应用
Flink 检查点算法

➢ 检查点分界线（Checkpoint Barrier）

• Flink 的检查点算法用到了一种称为分界线（barrier）的特殊数据形式，

用来把一条流上数据按照不同的检查点分开

• 分界线之前到来的数据导致的状态更改，都会被包含在当前分界线所属

的检查点中；而基于分界线之后的数据导致的所有更改，就会被包含在

之后的检查点中
Flink 检查点算法

• 现在是一个有两个输入流的应用程序，用并行的两个 Source 任务来读取

Flink 检查点算法

• JobManager 会向每个 source 任务发送一条带有新检查点 ID 的消息，通过这

种方式来启动检查点
Flink 检查点算法

• 数据源将它们的状态写入检查点，并发出一个检查点 barrier

• 状态后端在状态存入检查点之后，会返回通知给 source 任务，source 任务就会

向 JobManager 确认检查点完成
Flink 检查点算法

• 分界线对齐：barrier 向下游传递，sum 任务会等待所有输入分区的 barrier 到

• 对于barrier已经到达的分区，继续到达的数据会被缓存

• 而barrier尚未到达的分区，数据会被正常处理
Flink 检查点算法

• 当收到所有输入分区的 barrier 时，任务就将其状态保存到状态后端的检查点中，

然后将 barrier 继续向下游转发

Flink 检查点算法

• 向下游转发检查点 barrier 后，任务继续正常的数据处理

Flink 检查点算法

• Sink 任务向 JobManager 确认状态保存到 checkpoint 完毕

• 当所有任务都确认已成功将状态保存到检查点时，检查点就真正完成了
保存点（Savepoints）

• Flink 还提供了可以自定义的镜像保存功能，就是保存点（savepoints）

• 原则上，创建保存点使用的算法与检查点完全相同，因此保存点可以认

为就是具有一些额外元数据的检查点

• Flink不会自动创建保存点，因此用户（或者外部调度程序）必须明确地

触发创建操作

• 保存点是一个强大的功能。除了故障恢复外，保存点可以用于：有计划

的手动备份，更新应用程序，版本迁移，暂停和重启应用，等等
Q&A

Chapter 04
Document44 pages
Chapter 04
陳思媛
No ratings yet
軟體測試報告參考範本
Document7 pages
軟體測試報告參考範本
Lector
No ratings yet
7 Flink的状态一致性
Document22 pages
7 Flink的状态一致性
Yufei Amazon
No ratings yet
2 Flink运行架构
Document25 pages
2 Flink运行架构
Yufei Amazon
No ratings yet
DAY1品質檢驗站
Document27 pages
DAY1品質檢驗站
林秉緯
No ratings yet
《监控&监控系统》沈龙梅 1班
Document40 pages
《监控&监控系统》沈龙梅 1班
Yang Yu
No ratings yet
6-MQ Transaction
Document10 pages
6-MQ Transaction
wangyt0821
No ratings yet
OpenFoam 1
Document10 pages
OpenFoam 1
jausips0960140
No ratings yet
第二、三章进程管理习题
Document16 pages
第二、三章进程管理习题
seals.tierone
No ratings yet
1 - 5. 微服务可用性设计【海量资源：666java.com】
Document74 pages
1 - 5. 微服务可用性设计【海量资源：666java.com】
okayde
No ratings yet
單元02：重複及迴圈
Document29 pages
單元02：重複及迴圈
KuanTing Kuo
No ratings yet
CH04迴圈
Document51 pages
CH04迴圈
ly21171007cynthia
No ratings yet
Design:: Makefile 使用说明：
Document1 page
Design:: Makefile 使用说明：
Xiangjie Li
No ratings yet
1 - 2. Go语言实践 - error领教【海量资源：666java.com】
Document67 pages
1 - 2. Go语言实践 - error领教【海量资源：666java.com】
okayde
No ratings yet
Day04 WebAPIs
Document51 pages
Day04 WebAPIs
amy Yab
No ratings yet
测试用例设计1
Document59 pages
测试用例设计1
夏鲁宁
No ratings yet
flink必知必会
Document172 pages
flink必知必会
Joe HK
No ratings yet
U3d Fundamental 03
Document53 pages
U3d Fundamental 03
iimsheung
No ratings yet
41 张传奇 AgentFaker
Document13 pages
41 张传奇 AgentFaker
Yu Cheng H.
No ratings yet
3 中国银行基于容器的DevOps建设-韩琪
Document14 pages
3 中国银行基于容器的DevOps建设-韩琪
彭亮
No ratings yet
软件测试复习
Document26 pages
软件测试复习
xinrui.zhang77
No ratings yet
4 Flink中的时间语义和watermark
Document15 pages
4 Flink中的时间语义和watermark
Yufei Amazon
No ratings yet
07 尚硅谷大数据之实时数仓优化 V2.0
Document36 pages
07 尚硅谷大数据之实时数仓优化 V2.0
Yufei Amazon
No ratings yet
编译与调试
Document16 pages
编译与调试
Chengxiang Peng
No ratings yet
AWD之赛前培训
Document64 pages
AWD之赛前培训
Yue Pan
No ratings yet
Recipe Management System - YueBo Lee
Document13 pages
Recipe Management System - YueBo Lee
Jevons lee
No ratings yet
第二次作业离散事件系统仿真实验
Document18 pages
第二次作业离散事件系统仿真实验
salva
No ratings yet
(2023) (簡報) (課程) CH8.1 TensorFlow.JS
Document15 pages
(2023) (簡報) (課程) CH8.1 TensorFlow.JS
t0985403827
No ratings yet
1110722 2 起重機具作業危害預防暨相關安全管理介紹
Document100 pages
1110722 2 起重機具作業危害預防暨相關安全管理介紹
林永鎰
No ratings yet
ch2 软件过程模型
Document68 pages
ch2 软件过程模型
kingtrueone
No ratings yet
Untitled (Draft)
Document24 pages
Untitled (Draft)
wangandy1105
No ratings yet
Mccreport
Document16 pages
Mccreport
CURRY SU
No ratings yet
IC验证面试常问题88道
Document34 pages
IC验证面试常问题88道
celinayu853
No ratings yet
104學年度自動控制及實驗報告 (自動儲存)
Document5 pages
104學年度自動控制及實驗報告 (自動儲存)
廉城
No ratings yet
8. 操作系统实践
Document36 pages
8. 操作系统实践
hong
No ratings yet
(2023) (簡報) (課程) CH7. MVC框架之設計
Document14 pages
(2023) (簡報) (課程) CH7. MVC框架之設計
t0985403827
No ratings yet
5.BPM簽核流程設計器列印版
Document51 pages
5.BPM簽核流程設計器列印版
happywin
No ratings yet
SGM Apqp
Document34 pages
SGM Apqp
tobycola
No ratings yet
控制88 02
Document21 pages
控制88 02
Lee Yuu
No ratings yet
作業環境監測管理手冊要點條文
Document6 pages
作業環境監測管理手冊要點條文
何誠育
No ratings yet
JVM面试专题及答案
Document10 pages
JVM面试专题及答案
gary hu
No ratings yet
JVM面试专题
Document10 pages
JVM面试专题
tyfzpb
No ratings yet
Lecture07 (ShellScript)
Document93 pages
Lecture07 (ShellScript)
Minh Quân
No ratings yet
45 王华强香山处理器的访存流水实现
Document32 pages
45 王华强香山处理器的访存流水实现
Yu Cheng H.
No ratings yet
Untitled
Document23 pages
Untitled
苗天宇
No ratings yet
VCB筆記
Document13 pages
VCB筆記
api-3808976
100% (1)
GO专家编程
Document215 pages
GO专家编程
奉先
No ratings yet
MATLAB程序设计及应用实例
Document60 pages
MATLAB程序设计及应用实例
dust Assassin
No ratings yet
Accp V4.0
Document27 pages
Accp V4.0
陈先波
No ratings yet
06 - Simulink For Distributed Controller - v2
Document37 pages
06 - Simulink For Distributed Controller - v2
ccfk716
No ratings yet
计算力学OpenFOAM讲座基础篇（陈丽萍）
Document72 pages
计算力学OpenFOAM讲座基础篇（陈丽萍）
Al Tang
No ratings yet
U3d Fundamental 02
Document57 pages
U3d Fundamental 02
iimsheung
No ratings yet
ABB Basic Robot Training Software
Document20 pages
ABB Basic Robot Training Software
Tensaiga
No ratings yet
1 - 9. Go语言实践 - 网络编程（1）【海量资源：666java.com】
Document24 pages
1 - 9. Go语言实践 - 网络编程（1）【海量资源：666java.com】
okayde
No ratings yet
CH 8
Document53 pages
CH 8
林倩
No ratings yet
电商用户行为数据分析
Document35 pages
电商用户行为数据分析
Yufei Amazon
No ratings yet
第1章计算机系统概述
Document1 page
第1章计算机系统概述
qq274773
No ratings yet
第1章
Document20 pages
第1章
wu zhai
No ratings yet
第7章异常控制流
Document1 page
第7章异常控制流
Kang Kang
No ratings yet
07 尚硅谷大数据之实时数仓优化 V2.0
Document36 pages
07 尚硅谷大数据之实时数仓优化 V2.0
Yufei Amazon
No ratings yet
03 尚硅谷大数据之实时数仓 DWM层业务实现 V2.0
Document43 pages
03 尚硅谷大数据之实时数仓 DWM层业务实现 V2.0
Yufei Amazon
No ratings yet
尚硅谷大数据之flink教程 Java版
Document96 pages
尚硅谷大数据之flink教程 Java版
Yufei Amazon
No ratings yet
尚硅谷大数据之flink教程 TableAPI和SQL Java版
Document46 pages
尚硅谷大数据之flink教程 TableAPI和SQL Java版
Yufei Amazon
No ratings yet
尚硅谷大数据技术之电商用户行为数据分析 - Java版
Document76 pages
尚硅谷大数据技术之电商用户行为数据分析 - Java版
Yufei Amazon
No ratings yet
3 - Flink Window API
Document15 pages
3 - Flink Window API
Yufei Amazon
No ratings yet
5 Flink的状态管理
Document12 pages
5 Flink的状态管理
Yufei Amazon
No ratings yet