彻底了解大数据实时计算框架 Flink_飞道的博客_wya1

飞道的博客

飞道的博客

彻底了解大数据实时计算框架 Flink

2021-05-12 20:13 454人阅读评论(0)

在 1.1 节中讲解了日常开发常见的实时需求，然后分析了这些需求的实现方式，接着对比了实时计算和离线计算。随着这些年大数据的飞速发展，也出现了不少计算的框架（Hadoop、Storm、Spark、Flink）。在网上有人将大数据计算引擎的发展分为四个阶段。

第一代：Hadoop 承载的 MapReduce
第二代：支持 DAG（有向无环图）框架的计算引擎 Tez 和 Oozie，主要还是批处理任务
第三代：支持 Job 内部的 DAG（有向无环图），以 Spark 为代表
第四代：大数据统一计算引擎，包括流处理、批处理、AI、Machine Learning、图计算等，以 Flink 为代表

或许会有人不同意以上的分类，笔者觉得其实这并不重要的，重要的是体会各个框架的差异，以及更适合的场景。并进行理解，没有哪一个框架可以完美的支持所有的场景，也就不可能有任何一个框架能完全取代另一个。

本文将对 Flink 的整体架构和 Flink 的多种特性做个详细的介绍！在讲 Flink 之前的话，我们先来看看数据集类型和数据运算模型的种类。

数据集类型

无穷数据集：无穷的持续集成的数据集合
有界数据集：有限不会改变的数据集合

那么那些常见的无穷数据集有哪些呢？

用户与客户端的实时交互数据
应用实时产生的日志
金融市场的实时交易记录

转载：https://blog.csdn.net/tzs_1041218129/article/details/108728712?utm_source=fxx

查看评论

* 以上用户言论只代表其个人观点，不代表本网站的观点或立场