
本文详解如何基于时间序列数据,用 matplotlib 绘制一条连续的累计距离-时间曲线,准确反映行驶(斜线)、停驶(水平线)和行程衔接(阶梯式累积),支持字符串时间解析与自动分段建模。
要绘制符合真实行车逻辑的“累计距离 vs 时间”图(即:行程中匀速/近似匀速行驶 → 斜线;停车等待 → 水平线;行程间无运动 → 距离保持不变),关键在于将每段行程建模为两个端点(起点时间、起点累计距离)→(终点时间、终点累计距离),并确保相邻行程首尾自然衔接——后一段的起点累计距离等于前一段的终点累计距离。
原始尝试失败的根本原因在于:plt.plot() 直接连接离散点,但未显式构造完整的分段时间-距离坐标序列,导致无法表达“停驶期距离恒定”这一核心语义。正确做法是显式构建一个时间轴数组 time 和对应的累计距离数组 distance,二者长度一致、一一对应,且包含所有状态变化节点(启程、到站、再出发)。
以下为优化后的完整实现(兼容 Pandas 数据结构,增强鲁棒性与可读性):
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
# 原始数据(转为 DataFrame 便于处理)
df = pd.DataFrame({
'veh_ID': [102, 102],
'Trip_ID': [1, 2],
'Trip_Start': ['08:00', '11:00'],
'Trip_end': ['10:00', '11:10'],
'Travel distance': [12, 1]
})
def plot_cumulative_journey(df, time_col_start='Trip_Start', time_col_end='Trip_end',
dist_col='Travel distance', title='Journey Plot'):
"""
绘制单辆车的累计距离-时间行程图,自动处理停驶段(水平线)
Parameters:
- df: 包含行程起止时间与单程距离的DataFrame
- time_col_start: 起始时间列名(格式如 'HH:MM')
- time_col_end: 结束时间列名
- dist_col: 单程行驶距离列名
"""
# 步骤1:解析时间字符串为小时制浮点数(例:'08:00' → 8.0,'10:30' → 10.5)
def parse_time(t_str):
h, m = map(int, t_str.split(':'))
return h + m / 60.0
df = df.copy()
df['Start_Hour'] = df[time_col_start].apply(parse_time)
df['End_Hour'] = df[time_col_end].apply(parse_time)
# 步骤2:构建分段时间点与对应累计距离
times = []
distances = []
cumulative = 0.0
for idx, row in df.iterrows():
# 当前行程起点:时间 = Start_Hour,距离 = 当前累计值
times.append(row['Start_Hour'])
distances.append(cumulative)
# 当前行程终点:时间 = End_Hour,距离 = 累计值 + 本段距离
cumulative += row[dist_col]
times.append(row['End_Hour'])
distances.append(cumulative)
# 步骤3:绘图(使用 line plot 自动连接所有点,天然形成“行驶斜线+停驶水平线”)
plt.figure(figsize=(8, 5))
plt.plot(times, distances, marker='o', linestyle='-', linewidth=2, markersize=6,
color='#1f77b4', label='Cumulative Distance')
# 可选:标注各行程段
for i, (t_start, t_end, dist) in enumerate(zip(df['Start_Hour'], df['End_Hour'], df[dist_col])):
mid_t = (t_start + t_end) / 2
plt.text(mid_t, distances[2*i+1] - 0.3, f'Trip {i+1}',
ha='center', va='top', fontsize=9, color='darkblue')
# 设置坐标轴
plt.xlabel('Time (Hour)', fontsize=11)
plt.ylabel('Cumulative Distance (km)', fontsize=11)
plt.title(title, fontsize=13, fontweight='bold')
plt.grid(True, alpha=0.3)
plt.legend()
# 优化 x 轴显示(转换回 HH:MM 格式刻度)
def hour_to_hm(x, _):
h = int(x)
m = int((x - h) * 60)
return f'{h:02d}:{m:02d}'
plt.gca().xaxis.set_major_formatter(plt.FuncFormatter(hour_to_hm))
plt.xticks(rotation=0)
plt.tight_layout()
plt.show()
# 调用绘图函数
plot_cumulative_journey(df)✅ 输出效果说明:
立即学习“Python免费学习笔记(深入)”;
- 图中呈现一条连续折线:从 08:00(0 km)→ 10:00(12 km)斜上升(第一段行驶),接着 10:00→11:00 水平线(停驶 1 小时),再 11:00→11:10 斜上升至 13 km(第二段行驶)。
- 所有停驶时段自动表现为零斜率水平线,无需额外插值或手动拼接。
⚠️ 注意事项:
- 时间字符串必须严格为 'HH:MM' 格式(24 小时制),否则 split(':') 会报错;生产环境建议添加异常捕获与格式校验。
- 若存在跨天行程(如 '23:50' → '00:20'),需转换为 datetime 类型并处理日期偏移,本例假设单日内行程。
- 如需多车对比,可按 veh_ID 分组后循环调用该函数,并用不同颜色/线型区分。
此方法本质是将业务逻辑(行程状态机)映射为数学序列,比强行用 shift() 或 repeat() 拼接更清晰、可维护性更高,也易于扩展(如加入速度计算、停留时长统计等)。










