更多>
最新下载
24小时阅读排行榜
- 1 Golang中的错误处理与面向对象思想 Go语言错误作为第一等公民
- 2 Beego 模板中使用 if-else 条件与 range 循环的完整指南
- 3 实现视口边缘循环移动的 JavaScript 动画逻辑详解
- 4 C++怎么判断大端小端 C++检查系统字节序方法【核心】
- 5 Linux kernel livepatch(kpatch / ksplice)的在线补丁应用与回滚机制实践
- 6 Golang中的标签Label与continue Go语言复杂循环跳出处理
- 7 C++怎么写单例模式 C++线程安全的单例写法【精析】
- 8 C++如何读取系统触摸屏设备信息?(libinput或Windows Touch API)
- 9 Python中乘法运算符“*”不可省略:详解语法错误与正确写法
- 10 SQL CASE 表达式复杂逻辑应用方法
- 11 CSS如何处理移动端菜单的均分布局_利用flex:auto自动填充
- 12 解析Golang中的代码行数统计与测试量化 Go语言工程质量评估
- 13 PHP中变量在单引号字符串中不解析:正确拼接文件路径的实践指南
- 14 如何在Golang中配置持续交付环境 Go语言ArgoCD集成实战
- 15 C++怎么求绝对值 C++中abs与fabs的区别【笔记】
更多>
最新教程
-
- Node.js 教程
- 17956 2025-08-28
-
- CSS3 教程
- 1552008 2025-08-27
-
- Rust 教程
- 25029 2025-08-27
-
- Vue 教程
- 26915 2025-08-22
-
- PostgreSQL 教程
- 23323 2025-08-21
-
- Git 教程
- 10189 2025-08-21
下载首页 / 类库下载 / 其它类库
<?php
class Segmentation {
var $options = array('lowercase' => TRUE,
'segment_english' => FALSE);
var $dict_name = 'Unknown';
var $dict_words = array();
function setLowercase($value) {
if ($value) {
$this->options['lowercase'] = TRUE;
} else {
$this->options['lowercase'] = FALSE;
}
return TRUE;
}
function setSegmentEnglish($value) {
if ($value) {
$this->options['segment_english'] = TRUE;
} else {
$this->options['segment_english'] = FALSE;
}
return TRUE;
}中文分词(Chinese Word Segmentation) 指的是将一个汉字序列切分成一个一个单独的词。分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。我们知道,在英文的行文中,单词之间是以空格作为自然分界符的,而中文只是字、句和段能通过明显的分界符来简单划界,唯独词没有一个形式上的分界符,虽然英文也同样存在短语的划分问题,不过在词这一层上,中文比之英文要复杂得多、困难得多
本站所有资源都是由网友投搞发布,或转载各大下载站,请自行检测软件的完整性!本站所有资源仅供学习与参考,请勿用于商业用途,否则产生的一切后果将由您自己承担!如有侵权请联系我们删除下架,联系方式:admin@php.cn
