0

0

JavaScript自然语言处理实践

夜晨

夜晨

发布时间:2025-10-17 14:15:01

|

535人浏览过

|

来源于php中文网

原创

JavaScript在NLP中应用广泛,尤其适用于前端场景。1. 使用Natural库可实现分词、词干提取、相似度计算等基础处理;2. Compromise库适合浏览器端轻量级NLP,支持实体提取与情感分析;3. 借助TfIdf类可实现关键词提取与文本摘要;4. 利用Bayes分类器可构建意图识别系统,适用于聊天机器人等交互场景。

javascript自然语言处理实践

JavaScript在自然语言处理(NLP)中的应用正变得越来越广泛,尤其在前端场景中,比如聊天机器人、文本分析、情感识别和关键词提取等。虽然Python是NLP的主流语言,但借助现代JavaScript库和浏览器能力,我们也能在客户端高效实现基本的自然语言处理功能。

1. 使用Natural库进行基础文本处理

Natural 是一个流行的 Node.js NLP 库,支持分词、词干提取、词性标注、相似度计算等功能。

安装 Natural:

npm install natural

常见操作示例:
  • 分词(Tokenization):将句子拆分为单词
  • const tokenizer = new natural.WordTokenizer();
    console.log(tokenizer.tokenize("Hello world, how are you?"));
    // 输出: ["Hello", "world", "how", "are", "you"]

    立即学习Java免费学习笔记(深入)”;

  • 词干提取(Stemming):将单词还原为词根
  • console.log(natural.PorterStemmer.stem("running")); // 输出: "run"

  • 文本相似度:使用Jaro-Winkler算法比较字符串相似度
  • const similarity = natural.JaroWinklerDistance("martha", "marhta");
    console.log(similarity); // 输出: 0.94...

2. 在浏览器中使用 Compromise 进行轻量级NLP

Compromise 是专为浏览器设计的轻量级NLP库,适合处理用户输入、提取实体或理解句子结构。

引入方式:

<script src="https://unpkg.com/compromise"></script>

实用功能示例:
  • 提取名词、动词、日期等:
  • const doc = nlp("I bought a laptop yesterday.");
    console.log(doc.nouns().out()); // "laptop"
    console.log(doc.verbs().out()); // "bought"
    console.log(doc.dates().out()); // "yesterday"

    Chromox
    Chromox

    Chromox是一款领先的AI在线生成平台,专为喜欢AI生成技术的爱好者制作的多种图像、视频生成方式的内容型工具平台。

    下载
  • 情感倾向判断(配合插件):
  • 可结合 compromise-sentiment 插件做简单情感分析:
    doc.sentiment().score; // 值范围 -1 到 1

3. 实现关键词提取与文本摘要

通过 TF-IDF 或词频统计,可以在 JavaScript 中实现关键词提取。

使用 natural 的 TfIdf 类:
  • 给多段文本添加文档,自动计算关键词权重
  • const tfidf = new natural.TfIdf();
    tfidf.addDocument("The sky is blue.");
    tfidf.addDocument("The sun is bright.");

    tfidf.tfidfs("The sun in the sky is bright", function(i, measure) {
    console.log("文档 " + i + ", 得分 : " + measure);
    });

  • 输出每个词在文档中的重要性,可用于提取关键词

4. 构建简单的意图识别系统

结合分类器(如 BayesianClassifier),可以识别用户输入的意图。

示例:识别用户是想“搜索”还是“下单”

const classifier = new natural.BayesClassifier();

classifier.addDocument(["search", "find", "look for"], "query");
classifier.addDocument(["buy", "order", "purchase"], "order");
classifier.train();

console.log(classifier.classify(["I want to buy a book"])); // 输出: "order"

这种模式可用于表单预处理或对话系统路由

基本上就这些。JavaScript 虽然不适合复杂模型训练,但在轻量级 NLP 场景下表现不错,尤其是结合用户交互实时处理文本时,优势明显。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
c语言const用法
c语言const用法

const是关键字,可以用于声明常量、函数参数中的const修饰符、const修饰函数返回值、const修饰指针。详细介绍:1、声明常量,const关键字可用于声明常量,常量的值在程序运行期间不可修改,常量可以是基本数据类型,如整数、浮点数、字符等,也可是自定义的数据类型;2、函数参数中的const修饰符,const关键字可用于函数的参数中,表示该参数在函数内部不可修改等等。

562

2023.09.20

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

760

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

221

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1567

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

649

2023.11.24

java读取文件转成字符串的方法
java读取文件转成字符串的方法

Java8引入了新的文件I/O API,使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java,可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中,你需要将文件路径替换为你的实际文件路径,并且可能需要处理可能的IOException异常。想了解更多java的相关内容,可以阅读本专题下面的文章。

1228

2024.03.22

php中定义字符串的方式
php中定义字符串的方式

php中定义字符串的方式:单引号;双引号;heredoc语法等等。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

1204

2024.04.29

go语言字符串相关教程
go语言字符串相关教程

本专题整合了go语言字符串相关教程,阅读专题下面的文章了解更多详细内容。

193

2025.07.29

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

76

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
React 教程
React 教程

共58课时 | 6万人学习

TypeScript 教程
TypeScript 教程

共19课时 | 3.4万人学习

Bootstrap 5教程
Bootstrap 5教程

共46课时 | 3.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号