
本文详解如何绕过前端渲染限制,直接调用 coincodex 隐式 api 接口批量获取加密货币市值等时序图表数据,并将其结构化为 pandas dataframe,支持长期历史特征提取与模型训练。
在构建金融时间序列模型(如价格预测、市场情绪分析)时,高质量、高频率、长周期的历史图表数据是关键特征来源。然而,许多公开平台(如 CoinCodex)虽以交互式图表形式展示数据,却不提供免费的全量历史 API——其前端通常通过 JavaScript 动态请求后端接口加载数据,而该接口往往未在文档中公开,也无需认证密钥,仅需构造正确的参数即可访问。
以 CoinCodex 全币种总市值图表 为例,实际数据由 https://coincodex.com/api/v1/assets/get_charts 接口返回 JSON 格式时序点。关键在于理解其参数语义:
- charts=ALL: 请求全部时间粒度(含日线、周线等);
- samples=md: 指定采样精度(md 表示 medium,即约每 2–3 天一个点;hd 为 high density,更密集);
- assets=SUM_ALL_COINS: 目标资产标识(亦可替换为 BTC、ETH 等单币代码);
- include=market_cap: 指定返回字段(支持 price, volume, market_cap);
- t=5693725: 时间戳“盐值”(实测为防缓存的随机整数,非真实时间戳;可固定使用或每次生成新值,不影响数据完整性)。
以下为完整可运行示例代码:
import pandas as pd
import requests
api_url = "https://coincodex.com/api/v1/assets/get_charts"
params = {
"charts": "ALL",
"samples": "md",
"assets": "SUM_ALL_COINS",
"include": "market_cap",
"t": "5693725", # 可替换为 int(time.time()) 实现动态防缓存
}
response = requests.get(api_url, params=params, timeout=10)
response.raise_for_status()
data = response.json()
# 解析响应:data 是 dict,键为资产名(如 "SUM_ALL_COINS"),值为图表数据列表
# 注意:实际结构为 data["SUM_ALL_COINS"]["ALL"],但示例中误写为 data["BTC"]["ALL"]
# ✅ 正确路径如下:
chart_data = data["SUM_ALL_COINS"]["ALL"]
df = pd.DataFrame(chart_data, columns=["Timestamp", "Value", "Cap"])
df["Date"] = pd.to_datetime(df["Timestamp"], unit="s")
df = df[["Date", "Value", "Cap"]].sort_values("Date").reset_index(drop=True)
print("✅ 成功获取", len(df), "条历史记录")
print(df.tail())⚠️ 重要注意事项:资产标识需严格匹配:assets 参数必须与 API 返回的 key 一致(如 SUM_ALL_COINS 而非 ALL_COINS),建议先发起一次请求打印 data.keys() 确认可用值;字段命名可能变化:部分资产返回字段顺序或名称略有差异(如含 "Volume" 列),建议用 df.columns.tolist() 动态检查;反爬与稳定性:虽无需 User-Agent,但高频请求易触发限流。建议添加 time.sleep(1) 及异常重试机制;扩展多资产批量采集:只需将 assets 改为逗号分隔字符串(如 "BTC,ETH,SOL"),响应中会包含对应嵌套字典,遍历解析即可;替代方案预研:若目标站点变更接口,推荐配合浏览器自动化工具(如 Playwright)捕获真实网络请求,或使用 requests-html 渲染并提取 中的内联 JSON 数据。
通过该方法,你不仅能稳定获取 CoinCodex 的多年历史市值曲线,还可快速复用于其他类似架构的财经/加密数据平台,真正实现「一次开发、多图复用」的自动化特征工程流水线。










