更多>
最新下载
24小时阅读排行榜
- 1 构建 Go CLI 应用与可复用库的统一项目结构
- 2 CSS浮动实现的图文卡片排版_提升自媒体页面的视觉感
- 3 Golang中的并发与函数式编程组合 Go语言不可变数据并发优势
- 4 CSS如何优化响应式网页的加载速度_利用媒体查询按需加载特定css文件
- 5 C++怎么使用Valgrind_C++内存检测教程【诊断】
- 6 Golang Web框架Gin的路由性能解析 Go语言高性能路由匹配算法技巧
- 7 CSS Flexbox 中图片无法超分辨率缩放的解决方案
- 8 Golang中的栈扩容机制与指针更新 Go语言连续栈(Contiguous Stack)
- 9 mysql如何搭建后台管理系统_mysql项目实战教程
- 10 如何在Golang中优化大规模文本检索 Go语言Aho-Corasick算法实现
- 11 SQL CHECK 约束的自定义函数校验与性能开销评估
- 12 如何在Golang中优化内存分配 Go语言逃逸分析与堆内存管理技巧
- 13 PHP 中检查商品库存状态的正确函数设计与实现
- 14 Golang ioutil包(旧)与os包新版读取函数对比
- 15 C++怎么写switch语句 C++多分支选择结构用法【基础】
更多>
最新教程
-
- Node.js 教程
- 17952 2025-08-28
-
- CSS3 教程
- 1551985 2025-08-27
-
- Rust 教程
- 25022 2025-08-27
-
- Vue 教程
- 26913 2025-08-22
-
- PostgreSQL 教程
- 23322 2025-08-21
-
- Git 教程
- 10187 2025-08-21
下载首页 / 类库下载 / 其它类库
<?php
class Segmentation {
var $options = array('lowercase' => TRUE,
'segment_english' => FALSE);
var $dict_name = 'Unknown';
var $dict_words = array();
function setLowercase($value) {
if ($value) {
$this->options['lowercase'] = TRUE;
} else {
$this->options['lowercase'] = FALSE;
}
return TRUE;
}
function setSegmentEnglish($value) {
if ($value) {
$this->options['segment_english'] = TRUE;
} else {
$this->options['segment_english'] = FALSE;
}
return TRUE;
}中文分词(Chinese Word Segmentation) 指的是将一个汉字序列切分成一个一个单独的词。分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。我们知道,在英文的行文中,单词之间是以空格作为自然分界符的,而中文只是字、句和段能通过明显的分界符来简单划界,唯独词没有一个形式上的分界符,虽然英文也同样存在短语的划分问题,不过在词这一层上,中文比之英文要复杂得多、困难得多
本站所有资源都是由网友投搞发布,或转载各大下载站,请自行检测软件的完整性!本站所有资源仅供学习与参考,请勿用于商业用途,否则产生的一切后果将由您自己承担!如有侵权请联系我们删除下架,联系方式:admin@php.cn
