0

0

如何用JavaScript实现自然语言处理的基础功能?

紅蓮之龍

紅蓮之龍

发布时间:2025-09-26 12:51:01

|

639人浏览过

|

来源于php中文网

原创

JavaScript可通过原生方法和库实现基础NLP功能:1. 使用split或nodejieba进行中英文分词;2. 借助停用词表过滤无意义词汇;3. 通过freqMap统计词频并提取关键词;4. 利用Compromise、Natural等库增强分析能力,适用于前端轻量级处理。

如何用javascript实现自然语言处理的基础功能?

JavaScript 虽然不是自然语言处理(NLP)的主流语言,但在浏览器端或 Node.js 环境中实现基础 NLP 功能是完全可行的。通过一些库和原生方法,可以完成分词、词性标注、关键词提取等常见任务。

1. 文本分词(Tokenization)

分词是 NLP 的第一步,即将句子拆分为单词或词语。

对于英文,可以直接使用字符串操作:

const text = "Hello, how are you?"; const tokens = text.toLowerCase().split(/\W+/).filter(word => word.length > 0); // 结果: ["hello", "how", "are", "you"]

中文分词需要借助第三方库,比如 nodejieba(Node.js):

立即学习Java免费学习笔记(深入)”;

const nodejieba = require("nodejieba"); const words = nodejieba.cut("我爱自然语言处理"); // 结果: ["我", "爱", "自然语言", "处理"]

2. 停用词过滤(Stopword Removal)

去除无实际意义的词(如“的”、“是”、“在”),有助于提升分析效率。

定义一个停用词表,然后过滤:

天工大模型
天工大模型

中国首个对标ChatGPT的双千亿级大语言模型

下载
const stopwords = new Set(["的", "了", "是", "在", "我", "你"]); const filteredWords = words.filter(word => !stopwords.has(word));

英文可使用常见的停用词列表(如 NLTK 提供的)进行类似处理。

3. 词频统计与关键词提取

统计每个词出现的频率,可用于简单关键词提取。

const freqMap = {}; filteredWords.forEach(word => { freqMap[word] = (freqMap[word] || 0) + 1; }); // 按频率排序取前 N 个关键词 const keywords = Object.entries(freqMap) .sort((a, b) => b[1] - a[1]) .slice(0, 5);

4. 使用 NLP 库增强功能

JavaScript 有一些轻量级 NLP 库可以简化开发:

  • Compromise:适合英文,支持词性标注、句法分析。
  • Natural:Node.js 的 NLP 工具库,支持分类、词干提取等。
  • Sentiment:用于情感分析。

例如用 Compromise 分析句子:

const nlp = require('compromise'); const doc = nlp("Apple makes iPhones in California."); doc.terms().forEach(term => console.log(term.text, term.tags())); // 输出每个词及其词性

基本上就这些。对于简单场景,原生 JavaScript 加上少量库就能实现基础 NLP 功能。复杂任务建议结合后端服务或专用模型,但前端做预处理或轻量分析已足够实用。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
sort排序函数用法
sort排序函数用法

sort排序函数的用法:1、对列表进行排序,默认情况下,sort函数按升序排序,因此最终输出的结果是按从小到大的顺序排列的;2、对元组进行排序,默认情况下,sort函数按元素的大小进行排序,因此最终输出的结果是按从小到大的顺序排列的;3、对字典进行排序,由于字典是无序的,因此排序后的结果仍然是原来的字典,使用一个lambda表达式作为key参数的值,用于指定排序的依据。

409

2023.09.04

php中foreach用法
php中foreach用法

本专题整合了php中foreach用法的相关介绍,阅读专题下面的文章了解更多详细教程。

267

2025.12.04

require的用法
require的用法

require的用法有引入模块、导入类或方法、执行特定任务。想了解更多require的相关内容,可以阅读本专题下面的文章。

510

2023.11.27

c语言const用法
c语言const用法

const是关键字,可以用于声明常量、函数参数中的const修饰符、const修饰函数返回值、const修饰指针。详细介绍:1、声明常量,const关键字可用于声明常量,常量的值在程序运行期间不可修改,常量可以是基本数据类型,如整数、浮点数、字符等,也可是自定义的数据类型;2、函数参数中的const修饰符,const关键字可用于函数的参数中,表示该参数在函数内部不可修改等等。

562

2023.09.20

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

760

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

221

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1566

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

649

2023.11.24

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

76

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
React 教程
React 教程

共58课时 | 6万人学习

TypeScript 教程
TypeScript 教程

共19课时 | 3.4万人学习

Bootstrap 5教程
Bootstrap 5教程

共46课时 | 3.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号