如何自动化抓取 CoinCodex 等网站的交互式图表历史数据

霞舞

发布时间：2026-02-09 10:00:42

390人浏览过

来源于php中文网

原创

如何自动化抓取 CoinCodex 等网站的交互式图表历史数据

本文详解如何绕过前端渲染限制，直接调用 coincodex 隐式 api 接口批量获取加密货币市值等时序图表数据，并将其结构化为 pandas dataframe，支持长期历史特征提取与模型训练。

在构建金融时间序列模型（如价格预测、市场情绪分析）时，高质量、高频率、长周期的历史图表数据是关键特征来源。然而，许多公开平台（如 CoinCodex）虽以交互式图表形式展示数据，却不提供免费的全量历史 API——其前端通常通过 JavaScript 动态请求后端接口加载数据，而该接口往往未在文档中公开，也无需认证密钥，仅需构造正确的参数即可访问。

以 CoinCodex 全币种总市值图表为例，实际数据由 https://coincodex.com/api/v1/assets/get_charts 接口返回 JSON 格式时序点。关键在于理解其参数语义：

charts=ALL: 请求全部时间粒度（含日线、周线等）；
samples=md: 指定采样精度（md 表示 medium，即约每 2–3 天一个点；hd 为 high density，更密集）；
assets=SUM_ALL_COINS: 目标资产标识（亦可替换为 BTC、ETH 等单币代码）；
include=market_cap: 指定返回字段（支持 price, volume, market_cap）；
t=5693725: 时间戳“盐值”（实测为防缓存的随机整数，非真实时间戳；可固定使用或每次生成新值，不影响数据完整性）。

以下为完整可运行示例代码：

微撰

AI智能写作平台

下载

import pandas as pd
import requests

api_url = "https://coincodex.com/api/v1/assets/get_charts"

params = {
    "charts": "ALL",
    "samples": "md",
    "assets": "SUM_ALL_COINS",
    "include": "market_cap",
    "t": "5693725",  # 可替换为 int(time.time()) 实现动态防缓存
}

response = requests.get(api_url, params=params, timeout=10)
response.raise_for_status()
data = response.json()

# 解析响应：data 是 dict，键为资产名（如 "SUM_ALL_COINS"），值为图表数据列表
# 注意：实际结构为 data["SUM_ALL_COINS"]["ALL"]，但示例中误写为 data["BTC"]["ALL"]
# ✅ 正确路径如下：
chart_data = data["SUM_ALL_COINS"]["ALL"]

df = pd.DataFrame(chart_data, columns=["Timestamp", "Value", "Cap"])
df["Date"] = pd.to_datetime(df["Timestamp"], unit="s")
df = df[["Date", "Value", "Cap"]].sort_values("Date").reset_index(drop=True)

print("✅ 成功获取", len(df), "条历史记录")
print(df.tail())

⚠️ 重要注意事项：资产标识需严格匹配：assets 参数必须与 API 返回的 key 一致（如 SUM_ALL_COINS 而非 ALL_COINS），建议先发起一次请求打印 data.keys() 确认可用值；字段命名可能变化：部分资产返回字段顺序或名称略有差异（如含 "Volume" 列），建议用 df.columns.tolist() 动态检查；反爬与稳定性：虽无需 User-Agent，但高频请求易触发限流。建议添加 time.sleep(1) 及异常重试机制；扩展多资产批量采集：只需将 assets 改为逗号分隔字符串（如 "BTC,ETH,SOL"），响应中会包含对应嵌套字典，遍历解析即可；替代方案预研：若目标站点变更接口，推荐配合浏览器自动化工具（如 Playwright）捕获真实网络请求，或使用 requests-html 渲染并提取中的内联 JSON 数据。

通过该方法，你不仅能稳定获取 CoinCodex 的多年历史市值曲线，还可快速复用于其他类似架构的财经/加密数据平台，真正实现「一次开发、多图复用」的自动化特征工程流水线。

eq 如何支持与不同类型的对象比较且返回合理结果

如何绕过纽约时报的 JavaScript 验证，高效提取文章正文内容

Python 如何在类里实现类似 JavaScript 的可选链式调用

如何在 QML 中高效渲染带层级关系的 SQL 树形数据（支持展开/折叠与多选）

如何在网页无标准表格标签时高效提取结构化数据

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：加权随机抽样：在 SQL 和 Python 中实现按权重从数据表中采样下一篇：如何从CSV列字符串中精准提取日期并过滤最大日期行

作者最新文章

如何从CSV列字符串中安全提取日期并过滤掉最大日期

2026-02-09 14:23

Go 中 switch 语句天然支持空 case 实现“无操作”（no-op）

2026-02-09 14:46

如何在 PHP 循环中为每个按钮绑定独立的点击事件并显示对应隐藏字段的值

2026-02-09 14:46

如何在 Docker 中正确构建包含本地 Go 包的项目

2026-02-09 14:58

如何在Java应用中正确加载包含嵌套依赖的JAR包

2026-02-09 14:59

如何为每个文件输入字段独立分组上传的文件数据

2026-02-09 15:07

如何基于隐藏的“幽灵内容”控制 div 的尺寸

2026-02-09 15:09

PHP 中安全地向 MySQL JSON 字段追加数据的完整教程

2026-02-09 15:09

API 版本控制的最佳实践：Go 服务中清晰、高效且可维护的版本路由方案

2026-02-09 15:10

SVG 元素透明度过渡抖动与跳变问题的解决方案

2026-02-09 15:33

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章，帮助大家解决问题。

435

2023.08.07

json是什么

JSON是一种轻量级的数据交换格式，具有简洁、易读、跨平台和语言的特点，JSON数据是通过键值对的方式进行组织，其中键是字符串，值可以是字符串、数值、布尔值、数组、对象或者null，在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容，供大家免费下载体验。

543

2023.08.23