黄色网页视频 I 影音先锋日日狠狠久久 I 秋霞午夜毛片 I 秋霞一二三区 I 国产成人片无码视频 I 国产 精品 自在自线 I av免费观看网站 I 日本精品久久久久中文字幕5 I 91看视频 I 看全色黄大色黄女片18 I 精品不卡一区 I 亚洲最新精品 I 欧美 激情 在线 I 人妻少妇精品久久 I 国产99视频精品免费专区 I 欧美影院 I 欧美精品在欧美一区二区少妇 I av大片网站 I 国产精品黄色片 I 888久久 I 狠狠干最新 I 看看黄色一级片 I 黄色精品久久 I 三级av在线 I 69色综合 I 国产日韩欧美91 I 亚洲精品偷拍 I 激情小说亚洲图片 I 久久国产视频精品 I 国产综合精品一区二区三区 I 色婷婷国产 I 最新成人av在线 I 国产私拍精品 I 日韩成人影音 I 日日夜夜天天综合

挖掘FP-Tree

系統 2150 0

關聯規則如何并行實現呢?一個很直觀的想法是要么分數據要么分計算。本文要說的是分數據,想法來自mahout的fp-tree并行實現。其中分數據的博客已在前篇 mahout關聯規則FPGrowthDriver源碼分析之如何分數據 中說明,如何建樹可以在網上查找(這個相對來說比較簡單)或者直接看此片論文:《Mining FrequentPatterns without Candidate Generation》,這篇博客要說的是如何挖掘已經建好的FP-tree,也是參考《Mining FrequentPatterns without Candidate Generation》的(最好對照原篇來看,原篇為全英)。

先把建好的樹貼出來看:

挖掘FP-Tree

挖掘的過程即為遍歷Header table中的每個item,然后重新構造事務集,以及相應的f-list,然后重新建樹的過程。下面就p和m項目進行演示:

查找項目p在fp-tree的鏈接可以找到兩條路徑:f,c,a,m:2; c,b:1 這里的次數以p的次數為準,比如f:4,c:3,a:3,m:2,因為后面的p:2,所以f,c,a,m:2;

則其事務集為{[f,c,a,m:2],[c,b:1]},其g-list為c:3;所以其建好的樹為:


由于上面的樹是單支(原文為:only onebranch),所以可以直接輸出模式cp:3。(此處默認的閾值為3)

對于項目m,其事務集為 {[f,c,a:2],[f,c,a,b:1]},g-list: [f:3,c:3,a:3],事務集根據g-list進行刪減項目得到新的事務集為{[f,c,a:2],[f,c,a:1]},則由新的事務集和g-list構造的fp-tree為:

挖掘FP-Tree

對上面的樹的挖掘和最開始的樹是一樣的,即分別對項目a、c、f進行挖掘。

1. 項目a:

輸出(am:3)模式同時調用"mine(f:3,c:3)|am" ,"mine(f:3,c:3)|am" 輸出(cam:3,fam:3)模式,以及調用"mine(f:3)|cam",這個調用輸出(fcam:3)模式 ;

2. 項目c:

輸出(cm:3)模式同時調用"mine(f:3)|cm","mine(f:3)|cm"輸出(fcm:3)

3. 項目f:

直接輸出模式(fm:3)

所以最原始的樹上面項目p生成的模式為:(cp:3),項目m生成的模式為:(am:3)(cam:3)(fam:3)(fcam:3)(cm:3)(fcm:3)(fm:3)。其他的項目按照上面同樣的規則進行生成頻繁項目集。



分享,快樂,成長


轉載請注明出處: http://blog.csdn.net/fansy1990


挖掘FP-Tree


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦?。。?/p>

發表我的評論
最新評論 總共0條評論