0

0

大数据实时处理的王者-Flink

絕刀狂花

絕刀狂花

发布时间:2025-08-02 08:12:13

|

364人浏览过

|

来源于php中文网

原创

近年来,流处理技术日益受到关注。实时数据分析的价值不断提升,许多系统都依赖于连续的事件流进行数据收集和处理,不仅限于互联网领域,还包括车联网、电力系统和穿戴设备等。然而,大多数公司尚未采用流处理技术来解决实时大数据分析问题,原因可能是存储有限数据更为简单,且使用sql等分析方法更为便捷。但实际上,采用流处理方式处理这些数据更为合理,尽管这涉及到数据一致性和时间等复杂问题,甚至触及物理学领域。

大数据实时处理的王者-Flink图flink

不熟悉流处理的朋友可以阅读这两篇文章来了解更多:什么是实时流式计算?https://www.php.cn/link/af7ea05940553f46a0aec14fdaf0d2e7 以及 Streaming-大数据的未来 https://www.php.cn/link/d916d57cb76b24368db917a7f40e0484

幸运的是,我们有Flink。与Storm和Spark Streaming相比,Flink更贴近Google Dataflow的理念(详见文章实时计算大数据处理的基石-Google Dataflow https://www.php.cn/link/ca4f76fc1601927e425f9487890361a6 Streaming的微批处理,同时也支持离线批处理,因为在Flink中,批处理是流处理的一个子集,有限数据处理本质上是无限数据处理的一部分。作为一个高度创新的开源流处理器,Flink具备容错性、高吞吐和低延迟等优势。一个优秀的流处理框架不仅应具备低延迟和高吞吐,还应能实现消息的恰好一次传递,并拥有出色的容错机制。

大数据实时处理的王者-Flink图 google dataflow

Twitter开源的Storm框架曾风靡一时,在Hadoop初期,Storm弥补了Hadoop无法进行实时数据处理的缺陷,广泛应用于各大公司。Storm的延迟达到毫秒级,但难以实现高吞吐,且无法保证消息的恰好一次传递。虽然可以通过ack机制来保证,但这会带来极大的开销,导致许多使用Storm的公司面临消息积压的问题,这几乎是不可避免的。

大数据实时处理的王者-Flink图Storm

华友协同办公自动化OA系统
华友协同办公自动化OA系统

华友协同办公管理系统(华友OA),基于微软最新的.net 2.0平台和SQL Server数据库,集成强大的Ajax技术,采用多层分布式架构,实现统一办公平台,功能强大、价格便宜,是适用于企事业单位的通用型网络协同办公系统。 系统秉承协同办公的思想,集成即时通讯、日记管理、通知管理、邮件管理、新闻、考勤管理、短信管理、个人文件柜、日程安排、工作计划、工作日清、通讯录、公文流转、论坛、在线调查、

下载

将离线与实时处理分开的Lambda架构使用批处理技术处理全量数据,采用流式计算处理实时增量数据。同时支持流处理和批处理的计算引擎有两种选择:Apache Spark和Apache Flink。从技术和生态系统的综合考虑,Spark的技术理念是基于批处理来模拟流计算,而Flink则相反,采用基于流计算来模拟批计算。

大数据实时处理的王者-Flink图spark

从技术发展方向来看,用批处理模拟流计算存在一定的技术局限性,且这些局限性可能难以突破。而Flink基于流计算模拟批处理,在技术上具有更好的扩展性。

Flink起源于欧洲的一个大数据研究项目StratoSphere,该项目是柏林工业大学的一个研究性项目。早期,Flink主要用于批处理,但在2014年,StratoSphere的核心成员孵化出Flink,并将其捐赠给Apache,成为Apache的顶级大数据项目。Flink的计算主流方向被定位为Streaming,即用流式计算处理所有大数据,这就是Flink技术诞生的背景。

2015年,阿里开始介入Flink,负责资源调度和流式SQL的优化,成立了阿里内部版本Blink。在最近的1.9版本中,Blink开始合并入Flink。未来,Flink将支持Java、Scala、Python等更多语言,并在机器学习领域大展拳脚。

相关专题

更多
python开发工具
python开发工具

php中文网为大家提供各种python开发工具,好的开发工具,可帮助开发者攻克编程学习中的基础障碍,理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容,供大家免费下载使用。

775

2023.06.15

python打包成可执行文件
python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章,大家可以免费的下载体验。

684

2023.07.20

python能做什么
python能做什么

python能做的有:可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

768

2023.07.25

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

719

2023.07.31

python教程
python教程

Python已成为一门网红语言,即使是在非编程开发者当中,也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章,大家可以免费体验学习。

1445

2023.08.03

python环境变量的配置
python环境变量的配置

Python是一种流行的编程语言,被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后,我们需要配置环境变量,以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

571

2023.08.04

python eval
python eval

eval函数是Python中一个非常强大的函数,它可以将字符串作为Python代码进行执行,实现动态编程的效果。然而,由于其潜在的安全风险和性能问题,需要谨慎使用。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

579

2023.08.04

scratch和python区别
scratch和python区别

scratch和python的区别:1、scratch是一种专为初学者设计的图形化编程语言,python是一种文本编程语言;2、scratch使用的是基于积木的编程语法,python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容,供大家免费下载体验。

751

2023.08.11

c++ 根号
c++ 根号

本专题整合了c++根号相关教程,阅读专题下面的文章了解更多详细内容。

58

2026.01.23

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
CSS3 教程
CSS3 教程

共18课时 | 4.9万人学习

PostgreSQL 教程
PostgreSQL 教程

共48课时 | 7.8万人学习

Django 教程
Django 教程

共28课时 | 3.5万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号