
本教程详细讲解如何在python中处理复杂的嵌套字典与列表数据结构。我们将学习如何层层深入访问特定数据,迭代列表中的字典,并应用条件逻辑对数据进行过滤和提取,最终生成符合要求的结果集。
在现代数据处理中,我们经常会遇到结构复杂、多层嵌套的数据,尤其是在处理API响应或配置文件时。Python的字典(dictionary)和列表(list)是处理这类数据的核心工具。本教程将以一个具体的案例为例,演示如何从一个包含字典和列表的嵌套结构中,提取特定信息并根据条件进行过滤。
首先,我们来看一个典型的嵌套数据结构示例:
repo = {
'code': 200,
'msg': '',
'snapshotVos': [
{
'data': {
'balances': [
{'asset': 'ADD', 'free': '10', 'locked': '0'},
{'asset': 'RDP', 'free': '0', 'locked': '0'},
{'asset': 'SHIB', 'free': '0', 'locked': '947415'}
],
'totalAsset': '152'
},
'type': 'spot',
'updateTime': 1703807999000
}
]
}这个 repo 字典包含以下层级:
我们的目标是从 balances 列表中提取数据,并过滤掉那些 free 和 locked 值都为 '0' 的条目。
立即学习“Python免费学习笔记(深入)”;
要访问 balances 列表,我们需要按照其层级结构逐步深入。
rows1 = [] # 用于存储最终结果
for snapshot_item in repo['snapshotVos']:
# 访问 'data' 字典
data_content = snapshot_item['data']
# 访问 'balances' 列表
balances_list = data_content['balances']
for balance_entry in balances_list:
# balance_entry 现在是 {'asset': 'ADD', 'free': '10', 'locked': '0'} 这样的字典
# ... 在这里进行过滤和提取操作根据需求,我们需要移除那些 free 和 locked 值都为 '0' 的条目。这可以通过一个 if 语句来实现:
if not (balance_entry['free'] == '0' and balance_entry['locked'] == '0'):
# 如果不满足 'free' 和 'locked' 都为 '0' 的条件,则保留该条目
# ... 执行提取操作这里的 not (...) 逻辑表示:如果 free 等于 '0' 并且 locked 也等于 '0',那么整个条件 (balance_entry['free'] == '0' and balance_entry['locked'] == '0') 为 True,经过 not 后变为 False,该条目将被跳过。反之,如果其中任何一个不为 '0',则条件为 False,经过 not 后变为 True,该条目被处理。
在满足过滤条件的条目中,我们需要提取其值。根据原始问题的意图,我们可能需要将每个 balance_entry 字典的值转换为一个列表,并确保结果列表中不包含重复的条目。
val = list(balance_entry.values()) # 将字典的值转换为列表,例如 ['ADD', '10', '0']
if val not in rows1: # 检查该值列表是否已存在于结果集中,避免重复
rows1.append(val)将上述所有步骤整合起来,形成完整的解决方案:
repo = {
'code': 200,
'msg': '',
'snapshotVos': [
{
'data': {
'balances': [
{'asset': 'ADD', 'free': '10', 'locked': '0'},
{'asset': 'RDP', 'free': '0', 'locked': '0'},
{'asset': 'SHIB', 'free': '0', 'locked': '947415'}
],
'totalAsset': '152'
},
'type': 'spot',
'updateTime': 1703807999000
}
]
}
rows1 = [] # 初始化一个空列表,用于存储最终过滤后的数据
# 遍历 'snapshotVos' 列表中的每一个字典
for snapshot_item in repo['snapshotVos']:
# 访问当前 snapshot_item 字典中的 'data' 键
data_content = snapshot_item['data']
# 访问 data_content 字典中的 'balances' 键,它是一个列表
balances_list = data_content['balances']
# 遍历 balances_list 中的每一个 balance_entry 字典
for balance_entry in balances_list:
# 检查 'free' 和 'locked' 字段是否都为 '0'
# 如果不是都为 '0' (即至少有一个不为 '0'),则执行以下操作
if not (balance_entry['free'] == '0' and balance_entry['locked'] == '0'):
# 将当前 balance_entry 字典的所有值转换为一个列表
# 例如 {'asset': 'ADD', 'free': '10', 'locked': '0'} 会变成 ['ADD', '10', '0']
val = list(balance_entry.values())
# 检查这个值列表是否已经存在于 rows1 中,防止添加重复项
if val not in rows1:
# 如果不存在,则将其添加到 rows1 列表中
rows1.append(val)
print(rows1)运行结果:
[['ADD', '10', '0'], ['SHIB', '0', '947415']]
可以看到,['RDP', '0', '0'] 这个条目因为 free 和 locked 都为 '0' 而被成功过滤掉了。
健壮性处理: 在实际应用中,数据结构可能不总是完美的。例如,某个字典可能缺少 free 或 locked 键。为了避免 KeyError,可以使用 dict.get() 方法提供默认值,或使用 try-except 块。
# 示例:使用 .get() 避免 KeyError
free_val = balance_entry.get('free', '0') # 如果 'free' 键不存在,默认为 '0'
locked_val = balance_entry.get('locked', '0')
if not (free_val == '0' and locked_val == '0'):
# ...数据类型: 示例中的 free 和 locked 值是字符串 '0'。如果它们是数字 0,则比较时应使用 balance_entry['free'] == 0。在从外部数据源(如JSON)获取数据时,经常会遇到数字以字符串形式表示的情况,需要注意类型转换。
列表推导式: 对于更简洁的代码,可以使用列表推导式(List Comprehension)来完成过滤和提取:
rows_filtered = []
for snapshot_item in repo['snapshotVos']:
for balance_entry in snapshot_item['data']['balances']:
if not (balance_entry.get('free', '0') == '0' and balance_entry.get('locked', '0') == '0'):
# 如果不需要去重,直接 append 字典
rows_filtered.append(balance_entry)
# 如果需要去重,并且去重是基于字典内容,可能需要转换为元组或使用集合
# rows_filtered.append(tuple(balance_entry.items())) # 转换为元组以便去重
# 如果要转换为列表的值并去重
unique_values_list = []
seen_values = set() # 使用集合进行高效去重
for item in rows_filtered:
current_values = tuple(item.values()) # 转换为元组以便加入集合
if current_values not in seen_values:
seen_values.add(current_values)
unique_values_list.append(list(current_values)) # 最终存储为列表
print(unique_values_list)这种方式在处理复杂去重逻辑时更为灵活。
输出格式: 原始问题要求将字典值转换为列表并去重。如果希望保留原始字典结构,则可以直接 rows1.append(balance_entry)。根据具体需求选择最合适的输出格式。
通过本教程,我们学习了如何有效地在Python中导航和操作复杂的嵌套字典和列表结构。关键在于理解数据层级,使用嵌套循环逐步深入,并结合条件判断进行数据过滤。掌握这些技巧将使您能够更灵活、高效地处理各种复杂的数据集。在实际开发中,考虑代码的健壮性、数据类型匹配以及选择合适的Python特性(如列表推导式)来提高代码的可读性和效率至关重要。
以上就是Python中处理嵌套字典与列表数据:提取与条件过滤教程的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号