首页 - 关注 > 关联词语的种类和用法(关联词语分类)

关联词语的种类和用法(关联词语分类)

发布于：2024-04-04 19:22:11 来源：互联网

类关联规则实际上就是用关联规则做的分类器。全名叫Class Based Association Rule，简称CBA，不要和中国男篮搞混了。假设你的训练数据是一张表格，每行代表对一个物体的描述，每列代表物体某个属性的值，其中最后一列是物体的类别编号（其实就是分类问题的训练数据）CBA的经典执行方法为：1. 离散化该表格，针对每个连续属性，将其定义域分割成若干个区间，用数据所在的区间来代替原数据。2. 对表格中出现过的每个属性的每个不同离散值赋予一个独一无二的整数编号。这样就成功把表格变成了挖掘经典关联规则所用的事务数据集。3. 用关联规则挖掘算法从转换后的数据中挖掘关联规则。4. 将那些后件中不包含类别信息的规则删除。执行到这里，我们就获得了一些分类用的分类规则了，此时，若出现了一条不包含类别信息的新数据，就可以将该数据和规则库中的所有规则前件加以匹配，找出最符合的规则输出类别，就完成了分类。前件匹配的优先级（仅仅是建议，具体还是要根据实践调整）1. 前件与新数据的汉明距离，当然新数据也必须用同样的方法离散化。越小越好2. 置信度越大越好3. 支持度越大越好4. 提升度，即前件出现的情况下，后件出现的概率与后件通常情况下出现概率的比值，越大越好当然，经过许多年的学术研究，CBA的算法早已汗牛充栋，具体可在谷歌学术中搜索Class based association rule，国内的话可以用镜像“glgoo学术”。CBA的优点是分类逻辑极其明确，不像许多其他分类器跟炼丹似的，完全不知道为什么work。而且，有研究显示，CBA的分类精度很高。缺点是太屌丝（因为挖规则，通过规则匹配来分类太容易懂，不怎么高大上），不容易忽悠个别好大喜功的老板。总的来说，核心技术就是数据转换+关联规则挖掘+规则匹配我在我的github上分享了一些用c++写的Python2.7包，做关联规则用的。欢迎使用。

https://github.com/DMDarkness/Data-mining

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如有侵权行为，请第一时间联系我们修改或删除，多谢。

委托收款授权书(银行要求客户签付款授权书合法吗)

在去银行办理贷款时，经常会遇到要签署各种授权书的情况。其中有一个授权书是付款授权书，有些银行叫委托支付协议或受托支付协议。这些授权...

2024-04-04
细说易经六十四卦(如何记忆《周易》六十四卦之推理法)

《周易》是通过卦来阐述万物发展变化规律的。所以记忆《周易》六十四卦的推理，也应该根据事物的发展变化的现象来辅助记忆，不应该***记硬...

2024-04-04
幸福树的图片(幸福树枝干发黑，一直不长新叶是什么原因呢)

烂根、少光、暴晒、虫害都有可能造成幸福树枝干发黑，且一直不长新叶！仔细观察题主提供的照片，感受到幸福树绿色，但是已经出现也有一棵遇...

2024-04-04
基于大数据分析的精准化教学(互联网时代，如何运用大数据帮助企业发展)

作为一名IT行业的从业者，大数据和机器学习是我的主要研究方向，目前也在带相关方向的研究生，所以我来回答一下这个问题。首先，当前大数据...

2024-04-04
日日杆天天燥(人活着最怕什么，大家说说看看)

谢谢提问，谢谢悟空栏目组內容丰富多彩！这得分情况了，慨况是大至这样的……！幼儿怕丧母，一旦失去母爱的庇护，伤害是可怕的……人到中年...

2024-04-04
经典成语故事100篇(你都知道哪些有趣的成语故事，可以讲述一个吗？比如杯弓蛇影)

梅园居士：文斓苑选汇：成语典故：举案齐眉：（梁鸿配孟光之贤）汉光武帝之妹湖阳公主新寡，光武帝旨允其妹，任意在文武大臣中挑选意中人再...

2024-04-04
薏米的功效与作用及禁忌(赤小豆炒薏米煮水祛寒湿吗，为什么)

薏苡仁，赤小豆有健脾除湿的功效。可以直接煮汤或者煮粥食用。也可以泡水喝。建议，只喝水,这两种食物里面的成分不可能全部进入水中,如果喝...

2024-04-04
宋词名篇100首(有什么绝美的宋词吗)

绝美的宋词，太多，应该选哪一首呢？我想蒋捷的听雨，可能很多人不反对吧？这首听雨的词，每个人都可以看到自己的影子，确实值得品味，称得...

2024-04-04