扫码关注官方订阅号
假设有如下的多条数据:
佛山市威尔康乳胶制品有限公司 爱奥乐医疗器械(深圳)有限公司 ...
现在如何判断这些数据中哪些是有效的企业注册名称,希望说下思路。
这样的工商信息最好是去工商网站看一下了,能不能查到,不过工商网站有查询限制,验证码什么的,自动化处理的话要注意下
这属于命名实体识别(NER),如果你只是想应用而已,直接import jieba就行了。
import jieba
如果是想具体学习原理,推荐论文NLP from scratch
微信扫码关注PHP中文网服务号
QQ扫码加入技术交流群
Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号
PHP学习
技术支持
返回顶部
这样的工商信息最好是去工商网站看一下了,能不能查到,不过工商网站有查询限制,验证码什么的,自动化处理的话要注意下
这属于命名实体识别(NER),如果你只是想应用而已,直接
import jieba就行了。如果是想具体学习原理,推荐论文NLP from scratch