Polars 中实现 pandas df.query() 功能的等效方法

霞舞

发布时间：2026-02-28 09:20:07

450人浏览过

来源于php中文网

原创

Polars 中实现 pandas df.query() 功能的等效方法

Polars 没有 .query() 方法，但可通过 filter() 配合表达式（如 pl.col()）高效、清晰地实现相同的数据筛选逻辑，语法更显式、类型安全且性能更优。

polars 没有 `.query()` 方法，但可通过 `filter()` 配合表达式（如 `pl.col()`）高效、清晰地实现相同的数据筛选逻辑，语法更显式、类型安全且性能更优。

在 Pandas 中，df.query("B >= @item") 是一种基于字符串的动态过滤方式，支持变量插值（@item）和类 SQL 语法，简洁易读。然而 Polars 的设计理念强调显式性、编译时可验证性与零拷贝计算，因此不提供字符串解析型查询接口——而是用 声明式表达式（Expression API） 取代。

✅ 正确等效写法如下：

import polars as pl
import numpy as np

data = {
    'A': ["Polars", "Python", "Pandas"],
    'B': [23000, 24000, 26000],
    'C': ['30days', '40days', None],  # 注意：Polars 中用 None 代替 np.nan
}
df = pl.DataFrame(data)

item = 24000
result = df.filter(pl.col("B") >= item)
print(result)

输出：

BJXSHOP网上开店专家

BJXShop网上购物系统是一个高效、稳定、安全的电子商店销售平台，经过近三年市场的考验，在中国网购系统中属领先水平；完善的订单管理、销售统计系统；网站模版可DIY、亦可导入导出；会员、商品种类和价格均实现无限等级；管理员权限可细分；整合了多种在线支付接口；强有力搜索引擎支持... 程序更新：此版本是伴江行官方商业版程序，已经终止销售，现于免费给大家使用。比其以前的免费版功能增加了：1，整合了论坛

下载

shape: (2, 3)
┌────────┬───────┬────────┐
│ A      ┆ B     ┆ C      │
│ ---    ┆ ---   ┆ ---    │
│ str    ┆ i64   ┆ str    │
╞════════╪═══════╪════════╡
│ Python ┆ 24000 ┆ 40days │
│ Pandas ┆ 26000 ┆ null   │
└────────┴───────┴────────┘

? 关键要点解析：

pl.col("B") 创建一个指向列 "B" 的惰性表达式，支持所有比较、算术、逻辑及字符串操作；
>= item 中的 item 是普通 Python 变量，无需 @ 前缀——Polars 自动识别并广播标量值；
filter() 接收布尔表达式（返回 Expr 或 Series），仅保留 True 对应行，语义明确，无歧义；
支持链式组合：df.filter((pl.col("B") >= item) & (pl.col("A").str.starts_with("P")))；
若需复用复杂条件，可提前定义表达式变量，提升可读性与可维护性：

condition = (pl.col("B") >= item) & pl.col("C").is_not_null()
result = df.filter(condition)

⚠️ 注意事项：

❌ 不要尝试 df.filter("B >= @item") —— 字符串形式会报错，Polars 不解析 SQL 式字符串；
✅ None 在 Polars 中表示缺失值（对应 null），而 np.nan 会被自动转为 null，但建议直接使用 None 保持一致性；
? filter() 等价于 Pandas 的 df.loc[...] 或 df.query(...) 的布尔筛选语义，不是 df.query() 的语法糖，而是更底层、更可控的原语；
? 表达式在执行前被优化（如谓词下推、列裁剪），因此 filter() 在大数据集上通常比 Pandas query() 更快、内存更友好。

总结：放弃对 .query() 的依赖，拥抱 filter() + pl.col() 组合——它更安全、更快速、更符合 Polars 的函数式数据流哲学。每一次显式列引用，都是对代码可维护性与执行确定性的投资。

相关标签:

sql pandas NULL Filter 字符串接口

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何在 Python 中根据条件从 CSV 文件中检索对应列的值下一篇：暂无

作者最新文章

如何在 Pandas 中高效提取合并操作中的非匹配行（排除已匹配数据）

2026-02-25 13:09

Next.js 13+ API Route 响应返回与客户端消费完整指南

2026-02-25 13:24

Prisma 透明事务系统原理与实现指南

2026-02-25 13:27

如何准确区分 PyTorch 普通张量与嵌套张量（Nested Tensor）

2026-02-25 13:57

BoltDB 并发访问与连接池实现指南：从单进程限制到 HTTP 服务化封装

2026-02-25 14:08

如何解决 Vite 项目部署后仅首页可访问、其他路由 404 的问题

2026-02-25 14:39

Polars 中实现两个爆炸列的左连接：基于 ID 匹配的高效映射

2026-02-25 14:39

Java中使用XPath精准提取XML中同级子元素文本值的完整教程

2026-02-25 15:13

Java Streams 中对字符串型数字字段进行整型排序的完整实践指南

2026-02-25 15:14

如何在 Promise.allSettled 结果中保留原始 ID 映射关系

2026-02-25 15:37

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

1048

2023.10.12