0

0

Pandas 中按日期与股票代码合并价格数据的完整教程

心靈之曲

心靈之曲

发布时间:2026-01-31 08:51:13

|

762人浏览过

|

来源于php中文网

原创

Pandas 中按日期与股票代码合并价格数据的完整教程

本文详解如何将宽格式股价 dataframe(日期为索引、股票列为列)与交易记录 dataframe(含 date 和 symbol 列)高效关联,通过 stack + merge 实现精准价格匹配。

在量化分析或回测系统中,常需将交易指令(如买入/卖出某只股票)与其对应的历史价格对齐。典型场景是:一个 DataFrame 以日期为行索引、股票代码为列(宽格式),存储每日收盘价;另一个 DataFrame 记录每笔交易的日期(Date)、标的(Symbol)、方向(Order)和数量(Shares)。目标是为每笔交易添加当日该股票的成交价格(Price),生成带价格信息的交易明细表。

关键难点在于:第一个 DataFrame 是宽格式且索引为日期,而第二个 DataFrame 的日期是普通列,且需按“日期+股票代码”双重键匹配价格。直接使用 pd.concat() 或 join 并不适用——这不是简单的行拼接或索引对齐,而是基于多字段的查找式合并。

正确解法是:先将宽格式价格表转换为长格式(即“日期-股票-价格”三元组),再与交易表按 Date 和 Symbol 字段进行内连接(inner merge)。核心步骤如下:

  1. 重塑价格 DataFrame:使用 .stack() 将列名(如 'AAPL', 'IBM')转为新列(默认为 level_1),原索引(日期)自动成为 level_0;再用 .reset_index(name='Price') 展平并命名价格列;
  2. 执行合并:以交易表的 ['Date', 'Symbol'] 为左键,重塑后价格表的 ['level_0', 'level_1'] 为右键,指定 how='inner' 仅保留有价格匹配的交易;
  3. 清理冗余列:删除临时生成的 level_0 和 level_1 列,保留语义清晰的字段。

✅ 示例代码(假设 df_prices 索引为 DatetimeIndex,df_trades 含 Date 和 Symbol 列):

HaiSnap
HaiSnap

一站式AI应用开发和部署工具

下载
# 步骤1:将宽格式价格表转为长格式
price_long = df_prices.stack().reset_index(name='Price')
price_long.columns = ['Date', 'Symbol', 'Price']  # 显式重命名,提升可读性

# 步骤2:与交易表合并(推荐显式列名,避免 level_x 混淆)
result = df_trades.merge(price_long, on=['Date', 'Symbol'], how='inner')

# 输出结果(自动包含 Date, Symbol, Order, Shares, Price)
print(result)

? 注意事项:

  • 确保 df_trades['Date'] 与 df_prices.index 的数据类型一致(建议统一为 datetime64[ns]),可用 pd.to_datetime() 强制转换;
  • 若存在某日某股票无价格数据(如停牌),how='inner' 会自动过滤掉该交易;如需保留并填充 NaN,改用 how='left';
  • stack() 默认忽略 NaN 值,若原始价格表含空值,对应组合不会出现在长格式中;
  • 对于大规模数据,可提前对 df_trades 和 price_long 的合并键列设置索引或使用 pd.merge(..., sort=False) 提升性能。

该方法逻辑清晰、无循环、完全向量化,是 Pandas 处理“宽表→长表→关联”类任务的标准范式,适用于任意多股票、多日期场景。

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
Python 时间序列分析与预测
Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧,涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估,以及基于实际业务场景的时间序列项目实操,帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

71

2025.12.04

Python 数据清洗与预处理实战
Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术,包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换,结合 NumPy 高效处理大规模数据。通过实战案例,帮助学习者掌握 如何处理混乱、不完整数据,为后续数据分析与机器学习模型训练打下坚实基础。

1

2026.01.31

数据类型有哪几种
数据类型有哪几种

数据类型有整型、浮点型、字符型、字符串型、布尔型、数组、结构体和枚举等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

310

2023.10.31

php数据类型
php数据类型

本专题整合了php数据类型相关内容,阅读专题下面的文章了解更多详细内容。

222

2025.10.31

sort排序函数用法
sort排序函数用法

sort排序函数的用法:1、对列表进行排序,默认情况下,sort函数按升序排序,因此最终输出的结果是按从小到大的顺序排列的;2、对元组进行排序,默认情况下,sort函数按元素的大小进行排序,因此最终输出的结果是按从小到大的顺序排列的;3、对字典进行排序,由于字典是无序的,因此排序后的结果仍然是原来的字典,使用一个lambda表达式作为key参数的值,用于指定排序的依据。

395

2023.09.04

2026赚钱平台入口大全
2026赚钱平台入口大全

2026年最新赚钱平台入口汇总,涵盖任务众包、内容创作、电商运营、技能变现等多类正规渠道,助你轻松开启副业增收之路。阅读专题下面的文章了解更多详细内容。

25

2026.01.31

高干文在线阅读网站大全
高干文在线阅读网站大全

汇集热门1v1高干文免费阅读资源,涵盖都市言情、京味大院、军旅高干等经典题材,情节紧凑、人物鲜明。阅读专题下面的文章了解更多详细内容。

7

2026.01.31

无需付费的漫画app大全
无需付费的漫画app大全

想找真正免费又无套路的漫画App?本合集精选多款永久免费、资源丰富、无广告干扰的优质漫画应用,涵盖国漫、日漫、韩漫及经典老番,满足各类阅读需求。阅读专题下面的文章了解更多详细内容。

16

2026.01.31

漫画免费在线观看地址大全
漫画免费在线观看地址大全

想找免费又资源丰富的漫画网站?本合集精选2025-2026年热门平台,涵盖国漫、日漫、韩漫等多类型作品,支持高清流畅阅读与离线缓存。阅读专题下面的文章了解更多详细内容。

1

2026.01.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号