0

0

PySpark 自定义 Logger 无法输出 INFO 日志的完整解决方案

碧海醫心

碧海醫心

发布时间:2026-02-17 23:08:01

|

825人浏览过

|

来源于php中文网

原创

PySpark 自定义 Logger 无法输出 INFO 日志的完整解决方案

PySpark 中通过 Log4j 获取的自定义 Logger(如 'Example Processor')未输出 INFO 级别日志,根本原因在于 Log4j 根记录器(root logger)的级别限制了子记录器的实际生效级别;即使显式设置了子 Logger 级别为 INFO,若 root logger 级别为 WARN,则 INFO 及以下日志仍被静默丢弃。

pyspark 中通过 log4j 获取的自定义 logger(如 `'example processor'`)未输出 info 级别日志,根本原因在于 **log4j 根记录器(root logger)的级别限制了子记录器的实际生效级别**;即使显式设置了子 logger 级别为 info,若 root logger 级别为 warn,则 info 及以下日志仍被静默丢弃。

在 PySpark 应用中,日志系统基于 JVM 层的 Log4j(Spark 3.0+ 默认使用 Log4j 2,但 PySpark Python API 仍主要通过 org.apache.log4j 兼容接口操作)。关键要理解 Log4j 的双级过滤机制

  • Logger 级别(如 self.log.setLevel(Level.INFO)):决定该 Logger 是否接受 某条日志(即“准入门槛”);
  • Appender/Root Logger 级别(如 LogManager.getRootLogger().setLevel(Level.WARN)):决定日志 是否最终输出(即“出口闸门”)。

只有当一条日志同时满足 Logger 级别 ≥ 当前日志级别root logger 级别 ≤ 当前日志级别 时,它才会被打印。这就是为什么你设置 self.log.setLevel(Level.INFO) 后,info() 仍不输出——因为 Spark 启动时默认将 root logger 设为 WARN(见控制台提示 "Setting default log level to 'WARN'"),而 INFO

✅ 正确做法是:同步提升 root logger 级别,而非仅设置子 Logger。以下是推荐的完整配置方案:

亿众购物系统
亿众购物系统

一套设计完善、高效的web商城解决方案,独有SQL注入防范、对非法操作者锁定IP及记录功能,完整详细的记录了非法操作情况,管理员可以随时查看网站安全日志以及解除系统自动锁定的IP等前台简介:  1)系统为会员制购物,无限会员级别。  2)会员自动升级、相应级别所享有的折扣不同。  3)产品可在缺货时自动隐藏。  4)自动统计所有分类中商品数量,并在商品分类后面显示。  5)邮件列表功能,可在线订阅

下载
from pyspark.sql import SparkSession

self.spark = SparkSession.builder \
    .master("local[1]") \
    .appName("DemoProcessor") \
    .getOrCreate()

# 获取 JVM Log4j 接口
log4j = self.spark.sparkContext._jvm.org.apache.log4j

# ✅ 步骤1:设置 root logger 级别为 INFO(关键!)
root_logger = log4j.LogManager.getRootLogger()
root_logger.setLevel(log4j.Level.INFO)

# ✅ 步骤2:创建并配置自定义 Logger
self.log = log4j.LogManager.getLogger("Example Processor")
self.log.setLevel(log4j.Level.INFO)  # 此步可选,因继承自 root,但建议显式声明

# 测试日志(INFO 及以上均可见)
self.log.info("Info Message!")    # ✅ 现在可见
self.log.warn("Warn Message!")    # ✅
self.log.error("Error Message!")  # ✅
self.log.debug("Debug Message!")  # ❌ 仍不可见(DEBUG < INFO)

⚠️ 注意事项:

  • 不要仅依赖 sc.setLogLevel("INFO"):该方法仅控制 Spark 内部日志(如 org.apache.spark 包下日志),不影响用户自定义 Logger(如 "Example Processor"),因其属于独立命名空间。
  • 避免 setLevel(Level.DEBUG) 用于生产环境:DEBUG 级别会产生海量日志,显著影响性能与磁盘 I/O;开发调试时启用,上线前务必回调至 INFO 或 WARN。
  • Log4j 2 用户注意:若集群启用 Log4j 2(通过 spark.jars 指定 log4j-api/log4j-core),需改用 org.apache.logging.log4j 包,并调用 LogManager.getLogger(...) + Configurator.setLevel(...),但 PySpark 3.x 默认仍兼容 Log4j 1.x 接口。
  • 线程安全:Log4j Logger 是线程安全的,可在多线程任务(如 mapPartitions)中安全复用 self.log。

? 总结:PySpark 自定义日志生效的前提是 “子 Logger 级别 ≥ 日志级别” 且 “root Logger 级别 ≤ 日志级别”。解决 INFO 不输出问题,核心是调用 LogManager.getRootLogger().setLevel(Level.INFO) 打开根闸门。配置完成后,即可精准控制业务日志粒度,兼顾可观测性与运行效率。

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
硬盘接口类型介绍
硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍:1、IDE接口是一种并行接口,主要用于连接硬盘和光驱等设备,它主要有两种类型:ATA和ATAPI,IDE接口已经逐渐被SATA接口;2、SATA接口是一种串行接口,相较于IDE接口,它具有更高的传输速度、更低的功耗和更小的体积;3、SCSI接口等等。

1486

2023.10.19

PHP接口编写教程
PHP接口编写教程

本专题整合了PHP接口编写教程,阅读专题下面的文章了解更多详细内容。

403

2025.10.17

php8.4实现接口限流的教程
php8.4实现接口限流的教程

PHP8.4本身不内置限流功能,需借助Redis(令牌桶)或Swoole(漏桶)实现;文件锁因I/O瓶颈、无跨机共享、秒级精度等缺陷不适用高并发场景。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2245

2025.12.29

java接口相关教程
java接口相关教程

本专题整合了java接口相关内容,阅读专题下面的文章了解更多详细内容。

37

2026.01.19

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

675

2023.08.10

Python 多线程与异步编程实战
Python 多线程与异步编程实战

本专题系统讲解 Python 多线程与异步编程的核心概念与实战技巧,包括 threading 模块基础、线程同步机制、GIL 原理、asyncio 异步任务管理、协程与事件循环、任务调度与异常处理。通过实战示例,帮助学习者掌握 如何构建高性能、多任务并发的 Python 应用。

366

2025.12.24

java多线程相关教程合集
java多线程相关教程合集

本专题整合了java多线程相关教程,阅读专题下面的文章了解更多详细内容。

25

2026.01.21

C++多线程相关合集
C++多线程相关合集

本专题整合了C++多线程相关教程,阅读专题下面的的文章了解更多详细内容。

24

2026.01.21

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

462

2026.02.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

相关下载

更多

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号