0

0

2022 年下半年数据和人工智能技术预测

王林

王林

发布时间:2023-04-12 21:34:06

|

1516人浏览过

|

来源于51CTO.COM

转载

根据我们在 2022 年到目前为止的情况,Datanami 有信心在今年余下的时间里做出这五个预测。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

2022 年下半年数据和人工智能技术预测

数据可观察性继续运行

今年上半年对于数据可观察性来说意义重大,这让客户可以更好地了解数据流的情况并制定相关指标。随着数据对于决策制定变得越来越重要,该数据的健康和可用性也变得越来越重要。

我们看到许多数据可观察性初创公司获得了数亿美元的风险投资,其中包括Cribl(价值 1.5 亿美元的 D 轮融资);蒙特卡洛(D 系列价值 1.35 亿美元);Coralogix(D 系列价值 1.42 亿美元);和别的。其他制造新闻的公司包括推出元数据指标的Bigeye;StreamSets,被Software AG以 5.8 亿美元收购;IBM上个月收购了可观察性初创公司 Databand 。

这种势头将在 2022 年下半年继续,因为越来越多的数据可观察性初创公司走出困境,现有的初创公司寻求巩固其在这个新兴市场中的地位。

实时数据弹出

实时数据多年来一直处于次要地位,服务于一些小众用例,但实际上并未在常规企业中得到广泛使用。但是,由于过去几年的新冠疫情和相关的商业计划重组,实时数据进入主流科技圈的条件现在已经成熟。

“我认为流媒体终于发生了,” Databricks首席执行官 Ali Ghodsi 在最近的 Data + AI 峰会上表示,并指出该公司基于云的数据平台上的流媒体工作负载增长了 2.5 倍。“他们有越来越多的 AI 用例需要实时。”

内存数据库和内存数据网格也准备从实时复兴中受益(如果是这样的话)。RocksDB是一个快速分析数据库,它增强了 Kafka 等基于事件的系统,现在有一个名为 Speedb 的替代品。SingleStore在一个单一的关系框架中结合了 OLTP 和 OLAP 功能,在上个月的一轮融资中达到了 13 亿美元的估值。

还有StarRocks ,它最近获得了基于 Apache Doris的快速新 OLAP 数据库的资助;Imply于 5 月完成了 1 亿美元的 D 轮融资,以继续其基于 Apache Druid 的实时分析业务;DataStax将 Apache Pulsar 添加到其 Apache Cassandra 工具包中,筹集了 1.15 亿美元用于推动实时应用程序开发。Datanami预计这种对实时数据分析的关注将继续下去。

监管增长

GDPR生效已经四年了,让大数据用户受到关注,并加速了数据治理作为负责任数据计划的必要组成部分的兴起。在美国,监管数据访问的任务已经落到各州身上,加利福尼亚州在 CCPA 方面处于领先地位,它在许多方面模仿了 GPDR。但更多的州可能会效仿,这使美国公司的数据隐私等式变得复杂。

但 GDPR 和 CCPA 只是法规的开始。我们也处于第三方 cookie 的消亡之中,这使得公司更难跟踪用户的在线行为。谷歌决定将其平台上第三方 cookie 的终止时间推迟到 2023 年 1 月 1 日,这给了营销人员一些额外的时间来适应,但来自 cookie 的信息将难以复制。

除了数据法规之外,我们还处于关于使用人工智能的新法规的风口浪尖。欧盟于 2021 年推出了人工智能法案,专家预测它可能会在 2022 年底或 2023 年初成为法律。

可赞AI
可赞AI

文字一秒可视化,免费AI办公神器

下载

数据表格式之战

一场经典的技术大战正在形成新的数据表格式,这将决定数据如何存储在大数据系统中,谁可以访问它,以及用户可以用它做什么。

最近几个月, Apache Iceberg作为数据表格式的潜在新标准获得了热潮。云数据仓库巨头Snowflake和AWS今年年初出来支持 Iceberg,后者提供交易和其他数据控制,并从 Netflix 和 Apple 的工作中脱颖而出。前 Hadoop 分销商Cloudera在 6 月份也支持了 Iceberg。

但是 Databricks 的人们提供了 Delta Lake 表格式的替代方案,它提供了与 Iceberg 类似的功能。Apache Spark 支持者最初以专有方式开发了 Delta Lake 表格式,这导致指责 Databricks 为客户设置锁定。但在 6 月的数据 + AI 峰会上,该公司宣布将把整个格式都开源,从而让任何人都可以使用它。

在洗牌中迷失的是Apache Hudi,它还提供了数据的一致性,因为它位于大数据存储库中并且可以被各种计算引擎访问。Onehouse是一家由 Apache Hudi 的创建者支持的企业,今年早些时候推出了一个基于 Hudi 的 Lakehouse 平台。

大数据生态系统喜欢竞争,因此在 2022 年剩余时间里观察这些格式的演变和竞争将会很有趣。

语言 AI 继续令人惊叹

人工智能的前沿逐月变得越来越锋利,而今天,人工智能的矛头是大语言模型,它越来越好。事实上,大型语言模型已经变得如此出色,以至于 6 月份的一位Google工程师声称该公司的 LaMDA 会话系统已经变得有感知力。

人工智能还没有感知能力,但这并不意味着它们对企业没有用处。提醒我们,Salesforce有一个名为 CodeGen 的大型语言模型 (LLM) 项目,该项目旨在理解源代码,甚至以不同的编程语言生成自己的代码。

上个月,Meta(Facebook 的母公司)推出了一个可以翻译 200 种语言的大型语言模型。我们还看到了通过 BigScience 大型开放科学开放访问多语言语言模型或BLOOM等项目使 AI 民主化的努力。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
kafka消费者组有什么作用
kafka消费者组有什么作用

kafka消费者组的作用:1、负载均衡;2、容错性;3、广播模式;4、灵活性;5、自动故障转移和领导者选举;6、动态扩展性;7、顺序保证;8、数据压缩;9、事务性支持。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

167

2024.01.12

kafka消费组的作用是什么
kafka消费组的作用是什么

kafka消费组的作用:1、负载均衡;2、容错性;3、灵活性;4、高可用性;5、扩展性;6、顺序保证;7、数据压缩;8、事务性支持。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

149

2024.02.23

rabbitmq和kafka有什么区别
rabbitmq和kafka有什么区别

rabbitmq和kafka的区别:1、语言与平台;2、消息传递模型;3、可靠性;4、性能与吞吐量;5、集群与负载均衡;6、消费模型;7、用途与场景;8、社区与生态系统;9、监控与管理;10、其他特性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

202

2024.02.23

cookie
cookie

Cookie 是一种在用户计算机上存储小型文本文件的技术,用于在用户与网站进行交互时收集和存储有关用户的信息。当用户访问一个网站时,网站会将一个包含特定信息的 Cookie 文件发送到用户的浏览器,浏览器会将该 Cookie 存储在用户的计算机上。之后,当用户再次访问该网站时,浏览器会向服务器发送 Cookie,服务器可以根据 Cookie 中的信息来识别用户、跟踪用户行为等。

6424

2023.06.30

document.cookie获取不到怎么解决
document.cookie获取不到怎么解决

document.cookie获取不到的解决办法:1、浏览器的隐私设置;2、Same-origin policy;3、HTTPOnly Cookie;4、JavaScript代码错误;5、Cookie不存在或过期等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

346

2023.11.23

阻止所有cookie什么意思
阻止所有cookie什么意思

阻止所有cookie意味着在浏览器中禁止接受和存储网站发送的cookie。阻止所有cookie可能会影响许多网站的使用体验,因为许多网站使用cookie来提供个性化服务、存储用户信息或跟踪用户行为。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

411

2024.02.23

cookie与session的区别
cookie与session的区别

本专题整合了cookie与session的区别和使用方法等相关内容,阅读专题下面的文章了解更详细的内容。

88

2025.08.19

hadoop是什么
hadoop是什么

hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。本专题为大家免费提供hadoop相关的文章、下载和课程。

209

2023.06.30

拼多多赚钱的5种方法 拼多多赚钱的5种方法
拼多多赚钱的5种方法 拼多多赚钱的5种方法

在拼多多上赚钱主要可以通过无货源模式一件代发、精细化运营特色店铺、参与官方高流量活动、利用拼团机制社交裂变,以及成为多多进宝推广员这5种方法实现。核心策略在于通过低成本、高效率的供应链管理与营销,利用平台社交电商红利实现盈利。

31

2026.01.26

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
麻省理工大佬Python课程
麻省理工大佬Python课程

共34课时 | 5.2万人学习

国外Web开发全栈课程全集
国外Web开发全栈课程全集

共12课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号