微信公众号讲师中心

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机/移动开发手机游戏

最近更新

搜索

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程

首页 > 数据库 > mysql教程 > 正文

《数据挖掘概念与技术》学习笔记第6章(6/10)挖掘大型数据库中的

php中文网

发布： 2016-06-07 15:12:08

原创

2006人浏览过

项目集：项的集合，记为 I 。牛奶，面包，苹果， etc 事务：事务 T 是 I 中的一组项目的集合，每个事务都有个一个 TID 作为标识符号。项目集 X 的支持度 Sup(X)=Count(X)/|D| 关联规则 X-Y 的支持度 Sup(X-Y)=Count(X-Y)/|D| 关联规则 X-Y 的置信度 Conf

项目集：项的集合，记为I。牛奶，面包，苹果，etc

事务：事务T是I中的一组项目的集合，每个事务都有个一个TID作为标识符号。

项目集X的支持度

Sup(X)=Count(X)/|D|

关联规则X->Y的支持度

Sup(X->Y)=Count(X->Y)/|D|

关联规则X->Y的置信度

Conf(X->Y)=Count( X->Y)/Count(X)

步骤：

1 找出所有频繁项集

2 有频繁项集产生强关联规则

算法之Apriori算法

核心思想

频繁1-项集then关联规则then剪枝
then频繁2-项集then关联规则then剪枝
then频繁3-项集then关联规则then剪枝
……

重复此过程直到做不下去为止

算法实现 以后单独写出

改进措施 FP(Frequent Pattern Growth) 频繁模式增长

Codeium

Codeium

一个免费的AI代码自动完成和搜索工具

Codeium

228

Codeium

多层关联规则

基本思想：

自顶向下，在每个概念层找寻频繁项集。然后①在该层发掘关联规则②适当剪枝，向下进入更具体的一层。

可选方案：

1 使用一致的最小支持度

2使用递减的最小支持度

3 逐层独立

4 层交叉单项过滤

5 曾交叉k-项集过滤

多维关联规则

涉及两个或者多个维的关联规则

e.g． age(X, “IBM desktop computer”)^occupation(“drive”r)=>buys(X, ”laptop”)

多维关联规则注意

强关联规则不一定是有趣的。比如，

buys(X, “computer games”)=>buys(X, “videos”) [Support=40%, confidence= 66%]

推导出来的结果可能是满足支持度和置信度的，但是却不是有趣的。

因为可能实际上不购买computer games而去购买video的人有75%，而同时购买了computer games和videos的人只有66%，说明其实computer games和videos是负相关。

大家都在看：

MySQL事务应用指南：5种情况下最适合使用事务利用MySQL开发实现数据流水线与自动化运维的项目经验探讨通过MySQL开发实现数据挖掘与推荐系统的项目经验分享如何快速理解MySQL核心技术？如何深入理解MySQL的存储引擎技术？

最佳 Windows 性能的顶级免费优化软件

最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移，垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是，许多工具可以让 Windows 保持平稳运行。

来源：php中文网

上一篇：在Access数据库中实现admin888管理的另一种方式下一篇：mongodb 学习笔记之二 mongodb入门（数据库、文档和集合）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

最新问题

如何在mysql中创建唯一索引_mysql唯一索引创建方法创建唯一索引可确保数据不重复并提升查询效率。1.使用CREATEUNIQUEINDEX语句为已有表添加，如CREATEUNIQUEINDEXidx_emailONusers(email)；2.建表时通过UNIQUEKEY定义，如CREATETABLEusers(...,UNIQUEKEYuk_email(email))；3.用ALTERTABLE为现有表增加，如ALTERTABLEusersADDUNIQUEuk_username(username)；4.创建多列唯一索引保证组合唯一，如CREA

2025-12-03 14:22:02

531

mysql离线安装如何安装到d盘_mysql离线安装自定义安装路径设置方法可通过MySQLInstaller或ZIP解压版将MySQL安装到D盘。1.使用Installer时选择自定义安装，通过AdvancedOptions修改MySQLServer安装路径为D盘目录；2.使用ZIP版则直接解压至D盘指定路径，配置my.ini文件中的basedir和datadir，以管理员身份运行命令提示符执行安装与初始化操作。注意路径不含中文、空格，确保权限、端口及配置文件正确。

2025-12-03 14:17:02

120

如何在mysql中优化大数据量查询_mysql大数据量优化方法答案是优化MySQL大数据量查询需从索引设计、SQL语句、表结构、缓存与读写分离入手。合理创建索引并避免失效，优化SQL减少数据扫描，选择合适数据类型与存储引擎，拆分大表，利用Redis缓存热点数据，通过主从复制实现读写分离，并结合EXPLAIN分析执行计划，监控慢查询日志持续调优。

2025-12-03 14:04:02

913

mysql如何排查备份恢复错误_mysql备份恢复错误排查方法首先检查备份文件完整性，使用校验和及日志确认无损坏；接着确保字符集一致，导出导入时统一使用utf8mb4；然后验证用户权限与目标数据库配置，保证具备相应操作权限并创建所需数据库；最后通过MySQL错误日志定位具体问题，结合关闭外键检查等临时措施完成恢复。定期演练可预防多数问题。

2025-12-03 13:57:37

744

mysql如何配置MHA集群_mysql MHA集群安装与配置 MHA通过自动故障转移实现MySQL高可用，需安装Node和Manager组件，配置SSH免密登录及GTID主从复制，设置监控与复制用户，编写MHA配置文件并验证SSH与复制状态，最后启动Manager并测试主库宕机切换，确保集群高可用。

2025-12-03 13:48:34

774

如何安装mysql客户端_mysql客户端安装方法安装MySQL客户端可连接和操作MySQL服务器，常用工具为mysql命令行。Windows用户可通过MySQLInstaller自定义安装并选择客户端组件，或使用Zip包解压运行；Linux（Ubuntu/Debian）用户使用sudoaptinstallmysql-client安装；CentOS/RHEL用户使用sudoyuminstallmysql或sudodnfinstallmysql；macOS用户推荐用Homebrew安装：brewinstallmysql-client，并将路径添加

2025-12-03 13:43:30

210

mysql数据库索引优化概念_mysql索引优化基本概念索引优化需平衡读写性能，合理使用B+树、哈希、全文等索引类型，遵循最左前缀原则，避免函数操作和隐式转换，利用EXPLAIN分析执行计划，结合业务查询模式设计主键、唯一、组合等索引，控制数量与字段选择，持续监控慢查询并调整。

2025-12-03 13:32:02

817

如何在mysql中优化全文索引查询答案：优化MySQL全文索引需选用InnoDB引擎并创建FULLTEXT索引，如CREATEFULLTEXTINDEXidx_contentONarticles(title,body)；使用MATCH()AGAINST()语法配合NATURALLANGUAGE、BOOLEAN或QUERYEXPANSION模式提升查询效率；调整ft_min_word_len、ft_stopword_file等参数优化分词效果；针对中文搜索局限，可通过ngram插件（配置ngram_token_size=2）实现分

2025-12-03 13:24:16

948

mysql如何恢复全量备份_mysql全量恢复操作方法恢复MySQL全量备份需先确认备份为mysqldump生成的SQL文件，登录数据库后创建目标库并选择，通过source命令或重定向导入数据，建议恢复前关闭autocommit等检查以提升性能，恢复后验证表结构与数据完整性，注意处理表不存在、重复插入及字符集错误等问题，确保路径、数据库名和字符集设置正确。

2025-12-03 13:19:35

486

mysql如何备份大数据量数据库_mysql大数据库备份方法根据业务场景选择合适备份策略：小到中等规模数据库可使用分表导出、--single-transaction和压缩的mysqldump；大型生产环境推荐PerconaXtraBackup进行热备，结合主从复制在从库备份，避免锁表与性能影响，支持增量备份且可通过自动化脚本实现定时压缩与校验，确保高效、稳定、可恢复。

2025-12-03 13:19:26

586

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新 English: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

PHP中文网APP: 随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部