更多>
最新下载
24小时阅读排行榜
- 1 KyotoCabinet TreeDB性能深度解析与高效基准测试实践
- 2 iBeacon原始十六进制数据解码教程
- 3 Go语言:函数如何返回可变长度切片
- 4 Go语言函数如何返回可变大小的切片
- 5 拥抱鸿蒙生态,重塑服务体验:“我的盐城”树立智慧政务新范式
- 6 拼多多已售罄还会补货吗
- 7 天猫换货成功后怎么申请退货退款?换货状态中怎么申请退货退款
- 8 三色激光画质惊人!当贝D7X激光投影仪评测:三千元不到就能体验旗舰技术
- 9 拼多多3人团必须自己找人吗?3人团是自己找三人吗
- 10 天猫怎么取消退货退款申请?淘宝申请了退货退款怎么取消
- 11 拼多多直播间卖鞋为啥这么便宜
- 12 解读iBeacon原始十六进制数据:结构解析与编程实践
- 13 拼多多直播平台使用攻略是什么?拼多多怎么进入直播间
- 14 怎么查找拼多多管理后台
- 15 手机淘宝自定义模块怎么用?淘宝手机端自定义模块怎么设置
更多>
最新教程
-
- Node.js 教程
- 10929 2025-08-28
-
- CSS3 教程
- 1274093 2025-08-27
-
- Rust 教程
- 17004 2025-08-27
-
- Vue 教程
- 19837 2025-08-22
-
- PostgreSQL 教程
- 17610 2025-08-21
-
- Git 教程
- 7244 2025-08-21
下载首页 / 类库下载 / 其它类库
<?php
class Segmentation {
var $options = array('lowercase' => TRUE,
'segment_english' => FALSE);
var $dict_name = 'Unknown';
var $dict_words = array();
function setLowercase($value) {
if ($value) {
$this->options['lowercase'] = TRUE;
} else {
$this->options['lowercase'] = FALSE;
}
return TRUE;
}
function setSegmentEnglish($value) {
if ($value) {
$this->options['segment_english'] = TRUE;
} else {
$this->options['segment_english'] = FALSE;
}
return TRUE;
}中文分词(Chinese Word Segmentation) 指的是将一个汉字序列切分成一个一个单独的词。分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。我们知道,在英文的行文中,单词之间是以空格作为自然分界符的,而中文只是字、句和段能通过明显的分界符来简单划界,唯独词没有一个形式上的分界符,虽然英文也同样存在短语的划分问题,不过在词这一层上,中文比之英文要复杂得多、困难得多
本站所有资源都是由网友投搞发布,或转载各大下载站,请自行检测软件的完整性!本站所有资源仅供学习与参考,请勿用于商业用途,否则产生的一切后果将由您自己承担!如有侵权请联系我们删除下架,联系方式:admin@php.cn

