0

0

新浪财经知识图谱解译平台

P粉084495128

P粉084495128

发布时间:2025-07-24 10:04:34

|

701人浏览过

|

来源于php中文网

原创

本项目围绕新浪财经股票信息构建知识图谱并解译。通过爬取新浪财经股票数据存为Excel,用Python处理生成三元组文件,导入GraphDB构建知识库。前端接收用户输入,经后台服务器转发至语义解析服务转为SPARQL,查询知识图谱后返回结果显示,实现股票信息的智能查询。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

新浪财经知识图谱解译平台 - php中文网

新浪财经知识图谱解译平台

经济就是人们生产、流通、分配、消费一切物质精神资料的总称。经济的发展与人民生活息息相关。

新浪财经是国内第一大财经网络媒体。新浪财经打造高端新闻资讯,深度挖掘业内信息,全程报道80%以上的业界重要会议及事件,独家率达90%,是最具影响力的主流媒体平台。同时,新浪财经也开发出如金融超市、股市行情、基金筛选器、呼叫中心,金融产品在线查询等一系列实用产品,帮助网民理财,是最为贴心实用的服务平台。除此之外,新浪财经为网友搭建互动、交流、学习的财经大平台。财经博客、财经吧、模拟股市、模拟汇市等均成为业界最早、人气最旺、最知名的财经互动社区。

基于领先的财经资讯和贴心的产品服务,新浪财经吸引了非常庞大的高端用户群,已经成为金融行业客户进行网络营销的主要平台,同时也获得了非金融类客户的广泛青睐。

新浪财经知识图谱解译平台 - php中文网        

本项目爬取新浪财经中的股票信息,制作成知识图谱,并尝试对知识图谱进行解译。

项目设计

项目设计如图,web前端接收用户输入,将用户输入发送到后台的用户服务器,并由用户服务器转发到语义解析服务,语义解析根据用户输入信息转化为sparql语言,发送给用户服务器,用户服务器再将sparql发送到知识图谱库中查找结果返回给用户服务器,最终用户服务器将结果显示到前端。

新浪财经知识图谱解译平台 - php中文网        

数据获取以及构建知识图谱

  • 使用软件对新浪财经网站进行爬取,爬取后的数据保存为Excel文件。

新浪财经知识图谱解译平台 - php中文网        

  • 使用python读取Excel并按照数据格式自定义三元组,将三元组保存为.shtml.nt文件,代码如下。

新浪财经知识图谱解译平台 - php中文网        

  • 在GraphDB上新开一个知识库,将.shtml.nt文件导入到知识库中

新浪财经知识图谱解译平台 - php中文网        

In [ ]
import pandas as pdimport numpy as np

df = pd.read_excel('新浪行业_板块行情_新浪财经_新浪网.xlsx')with open('SinaFinance.shtml.nt','w',encoding='utf-8') as fp:
    fp.write('  "Sina Finance".\n')
    fp.write('  "新浪财经".\n')
    fp.write('  "http://finance.sina.com.cn/".\n')
    classes = np.array(df['板块']).astype(np.str)    for i,v in enumerate(classes):
        fp.write('  .\n')
   
In [ ]
import pandas as pdimport numpy as np

df = pd.read_excel('新浪行业_板块行情_新浪财经_新浪网.xlsx')
df2 = pd.read_excel('行情中心_新浪财经_新浪网.xlsx')with open('SinaClass.shtml.nt','w',encoding='utf-8') as fp:
    classes = np.array(df['板块']).astype(np.str)    for i,v in enumerate(classes):
        fp.write('  "'+v+'".\n')
    classes = np.array(df['链接地址']).astype(np.str)    for i,v in enumerate(classes):
        fp.write('  "'+v+'".\n')    id = np.array(df2['页面网址']).astype(np.str)
    id2 = np.array(df['链接地址']).astype(np.str)    for i,v in enumerate(id):        for j,k in enumerate(id2):            if v.split('#')[-1]==str(k).split('#')[-1] and not pd.isnull(df2.loc[i,'代码']):
                fp.write('  .\n')with open('Stock.shtml.nt','w',encoding='utf-8') as fp:    id = np.array(df2['代码']).astype(np.str)    for i,v in enumerate(id):
        fp.write('  "'+str(v)+'".\n')
        fp.write('  "'+str(df2.loc[i,'名称'])+'".\n')
        fp.write('  "'+str(df2.loc[i,'代码_链接'])+'".\n')
   

知识图谱结构展示

新浪财经知识图谱解译平台 - php中文网        

新浪财经知识图谱解译平台 - php中文网        

新浪财经知识图谱解译平台 - php中文网        

web前后端设计

前端

前端使用vue框架进行设计,代码详见SinaFinanceKnowledge\zg-vue

艾绘
艾绘

艾绘:一站式绘本创作平台,AI智能绘本设计神器!

下载

新浪财经知识图谱解译平台 - php中文网        

用户服务器

后台使用springboot撰写与知识图谱的对接接口,代码详见SinaFinanceKnowledge\zg-java

新浪财经知识图谱解译平台 - php中文网        

语义解析服务器

由于语义解析部分使用python+paddlepaddle构建,所以语义解析服务器使用django搭建的,代码详见SinaFinanceKnowledge\text2sparql

新浪财经知识图谱解译平台 - php中文网        

语义解析

代码及模型

详见text2sparql.ipynb

部署

由于深度学习使用的python语言,所以本地部署使用django第三方库来生成后台服务接口。部署代码和预测代码差不多。 这里注意的是,由于我们生成的词典全部使用小写,所以生成后的部分语句中的特定词需要转为sparql中的定义词。如:

sparql = " ".join(word_list_s).replace('sct:haschineselabel','sct:hasChineseLabel').replace('sct:id','sct:ID').replace('zg:sinafinance','zg:SinaFinance')
   

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
硬盘接口类型介绍
硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍:1、IDE接口是一种并行接口,主要用于连接硬盘和光驱等设备,它主要有两种类型:ATA和ATAPI,IDE接口已经逐渐被SATA接口;2、SATA接口是一种串行接口,相较于IDE接口,它具有更高的传输速度、更低的功耗和更小的体积;3、SCSI接口等等。

1126

2023.10.19

PHP接口编写教程
PHP接口编写教程

本专题整合了PHP接口编写教程,阅读专题下面的文章了解更多详细内容。

192

2025.10.17

php8.4实现接口限流的教程
php8.4实现接口限流的教程

PHP8.4本身不内置限流功能,需借助Redis(令牌桶)或Swoole(漏桶)实现;文件锁因I/O瓶颈、无跨机共享、秒级精度等缺陷不适用高并发场景。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1622

2025.12.29

java接口相关教程
java接口相关教程

本专题整合了java接口相关内容,阅读专题下面的文章了解更多详细内容。

20

2026.01.19

excel对比两列数据异同
excel对比两列数据异同

Excel作为数据的小型载体,在日常工作中经常会遇到需要核对两列数据的情况,本专题为大家提供excel对比两列数据异同相关的文章,大家可以免费体验。

1399

2023.07.25

excel重复项筛选标色
excel重复项筛选标色

excel的重复项筛选标色功能使我们能够快速找到和处理数据中的重复值。本专题为大家提供excel重复项筛选标色的相关的文章、下载、课程内容,供大家免费下载体验。

409

2023.07.31

excel复制表格怎么复制出来和原来一样大
excel复制表格怎么复制出来和原来一样大

本专题为大家带来excel复制表格怎么复制出来和原来一样大相关文章,帮助大家解决问题。

562

2023.08.02

excel表格斜线一分为二
excel表格斜线一分为二

在Excel表格中,我们可以使用斜线将单元格一分为二。本专题为大家带来excel表格斜线一分为二怎么弄的相关文章,希望可以帮到大家。

1243

2023.08.02

俄罗斯Yandex引擎入口
俄罗斯Yandex引擎入口

2026年俄罗斯Yandex搜索引擎最新入口汇总,涵盖免登录、多语言支持、无广告视频播放及本地化服务等核心功能。阅读专题下面的文章了解更多详细内容。

158

2026.01.28

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Vue 教程
Vue 教程

共42课时 | 7.3万人学习

Vue3.x 工具篇--十天技能课堂
Vue3.x 工具篇--十天技能课堂

共26课时 | 1.5万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号