當前位置:文思屋>學習教育>畢業論文>

超市事務資料庫挖掘關聯規則的設計

文思屋 人氣:1.1W

摘要:現在全球經濟發展正在進入資訊經濟時代,各種形式的資訊大量地產生和收集導致了資訊爆炸,如何採用基於關聯規則的資料探勘技術發現超市事務資料庫中的關聯規則是本文所研究和探討的'重點。

超市事務資料庫挖掘關聯規則的設計

關鍵詞:資料探勘 電子商務 關聯規則

1引言
目前,在需要處理大資料量的科研領域中,資料探勘受到越來越多的關注。我們可以利用資料探勘技術從海量資料中發現有用資訊,幫助商家瞭解客戶以往的需求趨勢,並預測未來,從而給商家帶來巨大的利潤。在資料探勘領域,採用關聯規則在大型事務資料庫中進行資料探勘是一個重要的研究內容。關聯規則是美國IBM Almaden Research Center的Rabesh Agrawal等人於1993年首先提出的KDD研究中的一個重要課題。關聯規則挖掘的一般物件是事務資料庫,這種資料庫的主要應用在零售業,比如超級市場的銷售管理。關聯規則就是發現事務資料庫中不同商品(項)(Item,指事務中的內容,比如,麵包、牛奶等都是專案)之間是否存在某種關聯關係。通過這些規則找出顧客購買行為模式,如購買了某一商品對購買其他商品的影響。發現這樣的規則可以應用於商品貨架設計、貨存安排以及根據購買模式對使用者進行分類。
2關聯規則描述
目前關聯規則挖掘主要考慮支援度和置信度兩個閾值。設X是項集,T是資料庫DB中的任意一個記錄。X的支援度是指支援X的記錄數與全體記錄數的比,Support(X)=|{T| T