基于ERP系統(tǒng)的數(shù)據(jù)挖掘應(yīng)用研究
引言隨著全球經(jīng)濟(jì)環(huán)境的進(jìn)一步改變,企業(yè)的競(jìng)爭(zhēng)壓力也越來(lái)越大,而ERP(企業(yè)資源計(jì)劃)體現(xiàn)了當(dāng)今世界上最先進(jìn)的企業(yè)管理理論,并提供了企業(yè)信息化集成的最佳方案,因此已經(jīng)成為眾多企業(yè)追求管理革新與信息化建設(shè)
引言
隨著全球經(jīng)濟(jì)環(huán)境的進(jìn)一步改變,企業(yè)的競(jìng)爭(zhēng)壓力也越來(lái)越大,而ERP(企業(yè)資源計(jì)劃)體現(xiàn)了當(dāng)今世界上最先進(jìn)的企業(yè)管理理論,并提供了企業(yè)信息化集成的最佳方案,因此已經(jīng)成為眾多企業(yè)追求管理革新與信息化建設(shè)的必然選擇。一方面,隨著ERP系統(tǒng)的普及與廣泛應(yīng)用,必然會(huì)形成越來(lái)越多的數(shù)據(jù),如何從大量的甚至海量的數(shù)據(jù)中提取有用的知識(shí)以支持管理決策,已經(jīng)成為越來(lái)越重要的問(wèn)題;另一方面,數(shù)據(jù)挖掘技術(shù)利用數(shù)據(jù)庫(kù)系統(tǒng)、統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、可視化和信息科學(xué)等多學(xué)科技術(shù),研究從大量數(shù)據(jù)中如何提取或“挖掘”知識(shí),也逐漸從理論研究發(fā)展到了實(shí)際應(yīng)用。因此,將數(shù)據(jù)挖掘應(yīng)用于ERP系統(tǒng),分析利用ERP所形成的數(shù)據(jù),從而形成幫助決策的知識(shí),逐漸引起了研究者與企業(yè)的重視。
然而,由于數(shù)據(jù)挖掘源于多個(gè)學(xué)科,因此產(chǎn)生了大量的、各種不同類(lèi)型的數(shù)據(jù)挖掘系統(tǒng),盡管有普通的、全能的數(shù)據(jù)挖掘系統(tǒng)與通用的數(shù)據(jù)挖掘算法,但通用系統(tǒng)并不適合特定領(lǐng)域的挖掘任務(wù),因此需要針對(duì)特定應(yīng)用的數(shù)據(jù)挖掘進(jìn)行分析研究。
文中主要介紹ERP與數(shù)據(jù)挖掘的基本概念與發(fā)展,還分析了基于ERP的數(shù)據(jù)挖掘應(yīng)用所面對(duì)的問(wèn)題,討論數(shù)據(jù)挖掘在ERP中的兩個(gè)應(yīng)用框架的構(gòu)建。最后,比較并分析了兩個(gè)應(yīng)用框架的特點(diǎn)與優(yōu)缺點(diǎn)。
l 概念與定義
1.1 ERP的概念與發(fā)展
ERP的概念于20世紀(jì)90年代由美國(guó)Garter Group Inc咨詢(xún)公司首先提出,其理論與系統(tǒng)從MRPⅡ發(fā)展而來(lái),極大地?cái)U(kuò)展了業(yè)務(wù)管理的范圍及深度,管理范圍涉及到企業(yè)的所有供需過(guò)程。概括地說(shuō),ERP有如下定義:
定義:ERP是建立在信息技術(shù)的基礎(chǔ)上,利用現(xiàn)代企業(yè)的先進(jìn)管理思想,全面地集成了企業(yè)的所有資源信息,并為企業(yè)提供決策、計(jì)劃、控制與經(jīng)營(yíng)業(yè)績(jī)?cè)u(píng)估的全方位和系統(tǒng)化的管理平臺(tái)。
ERP不僅僅是信息系統(tǒng),更重要的是一種管理理論與管理思想,它代表了當(dāng)前在全球范圍內(nèi)應(yīng)用最廣泛、最有效的一種企業(yè)管理方法,這種管理方法已經(jīng)通過(guò)計(jì)算機(jī)軟件得到了體現(xiàn)。
ERP的核心管理思想就是實(shí)現(xiàn)對(duì)整個(gè)供應(yīng)鏈的有效管理,包括物流、資金流與信息流。基于ERP理論的信息系統(tǒng)主要包括生產(chǎn)計(jì)劃管理、質(zhì)量管理、設(shè)備管理、采購(gòu)管理、庫(kù)存管理、銷(xiāo)售管理、客戶關(guān)系管理、成本管理、財(cái)務(wù)管理幾個(gè)模塊。
隨著ERP應(yīng)用的深入發(fā)展,ERP的應(yīng)用范圍逐漸擴(kuò)大,并不再限于制造業(yè),已應(yīng)用到金融業(yè)、高科技產(chǎn)業(yè)、郵電與通信業(yè)、能源行業(yè)(電力、石油與天然氣、煤炭業(yè)等)、公共事業(yè)、商業(yè)與零售業(yè)、外貿(mào)行業(yè)、新聞出版業(yè)、咨詢(xún)服務(wù)業(yè),甚至于醫(yī)療保健業(yè)和賓館酒店等行業(yè),因此,美國(guó)生產(chǎn)庫(kù)存學(xué)會(huì)(American Production and Inventory Control Society,APICS)在2002年出版的《AFICS字典》(第10版)中對(duì)ERP系統(tǒng)的定義擴(kuò)展為:一種在制造、分銷(xiāo)或服務(wù)業(yè)公司中有效地計(jì)劃和控制為接收、制造、發(fā)運(yùn)和解決客戶訂單問(wèn)題所需的所有資源的方法。
從ERP的理論與實(shí)際應(yīng)用可以看到,為企業(yè)提供決策足ERP的重要目的與功能之一。
1.2 數(shù)據(jù)挖掘概述
隨著信息技術(shù)的發(fā)展,人們積累了越來(lái)越多的數(shù)據(jù),從大量的數(shù)據(jù)中獲得有價(jià)值的知識(shí)也越來(lái)越成為迫切的需求。因此,自20世紀(jì)90年代初以來(lái),數(shù)據(jù)挖掘或知識(shí)發(fā)現(xiàn)也越來(lái)越受到人們的重視。廣義的數(shù)據(jù)挖掘等同于知識(shí)發(fā)現(xiàn),而狹義的數(shù)據(jù)挖掘?qū)V钢R(shí)發(fā)現(xiàn)的一個(gè)基本步驟。作為知識(shí)發(fā)現(xiàn)的一個(gè)步驟,數(shù)據(jù)挖掘有以下定義:
定義2:數(shù)據(jù)挖掘就是從大量的數(shù)據(jù)中挖掘出有用的信息,即從大量的、不完全的、有噪音的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中發(fā)現(xiàn)隱含的、規(guī)律性的,人們事先未知的,但又是潛在有用的并且最終可理解的信息和知識(shí)的非平凡過(guò)程。
與傳統(tǒng)的數(shù)據(jù)分析手段(如查詢(xún)報(bào)表)相比,數(shù)據(jù)挖掘有以下幾個(gè)特點(diǎn):首先,數(shù)據(jù)挖掘處理的是大量或海量的數(shù)據(jù);其次,數(shù)據(jù)挖掘的目的是發(fā)現(xiàn)隱含的、事先未知的知識(shí);再次,數(shù)據(jù)挖掘更傾向于把任務(wù)交給程序自動(dòng)完成,也是人工智能的一種應(yīng)用;最后,數(shù)據(jù)挖掘是一個(gè)交叉學(xué)科,是高級(jí)的數(shù)據(jù)分析手段。
數(shù)據(jù)挖掘使用各種不同的算法來(lái)完成不同的任務(wù)。數(shù)據(jù)挖掘的任務(wù)一般可以分為兩類(lèi)BJ:描述和預(yù)測(cè)。描述性數(shù)據(jù)挖掘任務(wù)刻畫(huà)數(shù)據(jù)庫(kù)中數(shù)據(jù)的一般特性。預(yù)測(cè)性挖掘任務(wù)在當(dāng)前數(shù)據(jù)上進(jìn)行推斷,以進(jìn)行預(yù)測(cè)。最基本也是最重要的數(shù)據(jù)挖掘任務(wù)為:
1)關(guān)聯(lián):關(guān)聯(lián)分析發(fā)現(xiàn)關(guān)聯(lián)規(guī)則,這些規(guī)則展示了屬性與屬性之間的關(guān)系;
2)聚類(lèi):產(chǎn)生分組標(biāo)記,根據(jù)最大化類(lèi)內(nèi)相似性、最小化類(lèi)間相似性原則將數(shù)據(jù)分成不同的簇;
3)分類(lèi)/預(yù)測(cè):找出描述并區(qū)分?jǐn)?shù)據(jù)類(lèi)或概念的模型,以便能使用模型預(yù)測(cè)類(lèi)標(biāo)記未知的對(duì)象類(lèi)。數(shù)據(jù)挖掘還有序列發(fā)現(xiàn)、相關(guān)分析、孤立點(diǎn)分析等多種任務(wù)。
目前,數(shù)據(jù)挖掘作為知識(shí)發(fā)現(xiàn)的重要步驟與商業(yè)智能(BI)的核心功能,已經(jīng)應(yīng)用于金融、電信、體育分析、銷(xiāo)售等多個(gè)領(lǐng)域,但制造業(yè)應(yīng)用并不廣泛。
2 數(shù)據(jù)挖掘在ERP中的應(yīng)用框架
2.1 應(yīng)用問(wèn)題描述與分析
ERP系統(tǒng)涉及整個(gè)供應(yīng)鏈的管理,會(huì)產(chǎn)生大量的數(shù)據(jù),其重要目的之一是提供決策支持,因此,分析利用ERP系統(tǒng)積累的數(shù)據(jù),提高決策能力,越來(lái)越受到人們的重視。傳統(tǒng)的方法是提供報(bào)表功能,但報(bào)表功能處理海量數(shù)據(jù)力不從心,也無(wú)法更智能地發(fā)現(xiàn)隱含的知識(shí),因此,ERP系統(tǒng)越來(lái)越需要數(shù)據(jù)挖掘的應(yīng)用。但是,由于ERP最主要的應(yīng)用行業(yè)——制造業(yè)類(lèi)型復(fù)雜,各個(gè)生產(chǎn)管理環(huán)節(jié)形成的數(shù)據(jù)種類(lèi)繁多,設(shè)計(jì)通用的數(shù)據(jù)挖掘算法覆蓋所有的生產(chǎn)問(wèn)題和所有的管理環(huán)節(jié)是十分困難的。事實(shí)上,由于ERP積累的數(shù)據(jù)有著行業(yè)獨(dú)特的相關(guān)性,通用的數(shù)據(jù)挖掘算法是無(wú)效的,加之企業(yè)對(duì)數(shù)據(jù)挖掘這種新技術(shù)實(shí)施風(fēng)險(xiǎn)的考慮,因此,盡管大型的ERP系統(tǒng)包含數(shù)據(jù)挖掘的商業(yè)智能模塊,但總體上來(lái)看,數(shù)據(jù)挖掘在ERP中的應(yīng)用并不廣泛。
2.2 基于數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用框架
根據(jù)ERP系統(tǒng)的特點(diǎn),結(jié)合典型的數(shù)據(jù)挖掘系統(tǒng)結(jié)構(gòu),一種基于數(shù)據(jù)倉(cāng)庫(kù)的ERP系統(tǒng)數(shù)據(jù)挖掘應(yīng)用框架如圖1所示,標(biāo)記為應(yīng)用框架1。
ERP業(yè)務(wù)數(shù)據(jù)庫(kù)屬于數(shù)據(jù)庫(kù)技術(shù)中的操作型數(shù)據(jù)庫(kù),主要處理聯(lián)機(jī)事務(wù),關(guān)注多事務(wù)處理、數(shù)據(jù)的一致性與完整性等,重點(diǎn)不在于大數(shù)據(jù)量的查詢(xún)與分析。而數(shù)據(jù)倉(cāng)庫(kù)是分析型數(shù)據(jù)庫(kù),是一種數(shù)據(jù)的長(zhǎng)期存儲(chǔ),數(shù)據(jù)經(jīng)過(guò)組織在一致的模式下存放,通常是歷史數(shù)據(jù)的匯總,目的是為了支持決策。數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織、存取方法以及支持的主要功能等都是針對(duì)歷史數(shù)據(jù)的查詢(xún)與分析而設(shè)計(jì),因此數(shù)據(jù)倉(cāng)庫(kù)能更好地支持?jǐn)?shù)據(jù)挖掘。
圖1所示的應(yīng)用框架描述如下:
a)數(shù)據(jù)處理模塊:將ERP業(yè)務(wù)數(shù)據(jù)庫(kù)的數(shù)據(jù)經(jīng)過(guò)提取、轉(zhuǎn)換與加載等,轉(zhuǎn)換為符合數(shù)據(jù)倉(cāng)庫(kù)要求的數(shù)據(jù)。
b)數(shù)據(jù)挖掘引擎:用于執(zhí)行數(shù)據(jù)挖掘任務(wù),包括關(guān)聯(lián)規(guī)則、聚類(lèi)、分類(lèi)等。
c)知識(shí)庫(kù):領(lǐng)域知識(shí),用于指導(dǎo)數(shù)據(jù)挖掘執(zhí)行,也用于評(píng)估數(shù)據(jù)挖掘的結(jié)果模式。
d)模式評(píng)估:該模塊與數(shù)據(jù)挖掘引擎交互,也與用戶交互,并根據(jù)知識(shí)庫(kù)的相關(guān)知識(shí),評(píng)估數(shù)據(jù)挖掘結(jié)果的興趣度,過(guò)濾發(fā)現(xiàn)的模式。
基于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)挖掘應(yīng)用框架的特點(diǎn)是:數(shù)據(jù)挖掘過(guò)程與ERP業(yè)務(wù)過(guò)程分離,挖掘過(guò)程不影響實(shí)時(shí)操作,但分析對(duì)象也不是實(shí)時(shí)數(shù)據(jù)。
2.3 基于ERP業(yè)務(wù)數(shù)據(jù)庫(kù)的應(yīng)用框架
盡管數(shù)據(jù)倉(cāng)庫(kù)技術(shù)對(duì)數(shù)據(jù)挖掘有著重要作用,但是數(shù)據(jù)挖掘不限于僅分析數(shù)據(jù)倉(cāng)庫(kù)中的匯總數(shù)據(jù),它可以分析現(xiàn)存于ERP系統(tǒng)中的更細(xì)化的業(yè)務(wù)數(shù)據(jù),因此,基于ERP業(yè)務(wù)數(shù)據(jù)庫(kù)的數(shù)據(jù)挖掘應(yīng)用框架如圖2所示,標(biāo)記為應(yīng)用框架2。在這一框架中,數(shù)據(jù)挖掘不再是建立在數(shù)據(jù)倉(cāng)庫(kù)上的獨(dú)立系統(tǒng),而是作為ERP系統(tǒng)的一個(gè)高級(jí)模塊存在,它一方面是對(duì)數(shù)據(jù)挖掘分析對(duì)象的擴(kuò)展,另一方面也是日益重要的在線實(shí)時(shí)數(shù)據(jù)分析的要求。
圖2 基于ERP業(yè)務(wù)數(shù)據(jù)庫(kù)的數(shù)據(jù)挖掘應(yīng)用框架
在圖2所示的應(yīng)用框架中,ERP數(shù)據(jù)挖掘模塊直接處理分析業(yè)務(wù)數(shù)據(jù),同樣基于知識(shí)庫(kù)進(jìn)行模式評(píng)估,并與用戶交互。必要的數(shù)據(jù)預(yù)處理功能作為數(shù)據(jù)挖掘模塊內(nèi)部功能存在,直接提取處理ERP操作數(shù)據(jù)庫(kù)。事實(shí)上,大型的數(shù)據(jù)庫(kù)系統(tǒng)也越來(lái)越向提供智能分析與數(shù)據(jù)挖掘功能的方向發(fā)展,因此,在不建立數(shù)據(jù)倉(cāng)庫(kù)的情況下,利用數(shù)據(jù)挖掘技術(shù)直接對(duì)ERP業(yè)務(wù)數(shù)據(jù)進(jìn)行一定程度的分析也是可行的。
2.4 比較與分析
基于ERP的數(shù)據(jù)倉(cāng)庫(kù)的建立,是應(yīng)用框架1中的核心內(nèi)容,也是傳統(tǒng)的數(shù)據(jù)挖掘應(yīng)用模式在ERP系統(tǒng)中的應(yīng)用,即先建立數(shù)據(jù)倉(cāng)庫(kù),再進(jìn)行數(shù)據(jù)挖掘。這種模式將ERP系統(tǒng)與數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)結(jié)合,既發(fā)揮了ERP系統(tǒng)處理事務(wù)的能力,又發(fā)揮了數(shù)據(jù)倉(cāng)庫(kù)之上的數(shù)據(jù)挖掘技術(shù)的決策支持作用。但根據(jù)ERP系統(tǒng)的特點(diǎn),ERP業(yè)務(wù)數(shù)據(jù)庫(kù)中的數(shù)據(jù)已經(jīng)相對(duì)集中與規(guī)范,在企業(yè)沒(méi)有建立數(shù)據(jù)倉(cāng)庫(kù)時(shí),ERP系統(tǒng)同樣需要有效的數(shù)據(jù)分析與決策支持,因此,基于ERP業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)挖掘應(yīng)用框架也同樣具有重要意義。
兩個(gè)應(yīng)用框架的優(yōu)缺點(diǎn)比較分析如下:
(1)應(yīng)用框架1:基于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)挖掘應(yīng)用
應(yīng)用框架1的主要優(yōu)點(diǎn):
a)操作型數(shù)據(jù)庫(kù)與分析型數(shù)據(jù)庫(kù)分離,使操作事務(wù)與分析任務(wù)互不干擾,能夠保證數(shù)據(jù)挖掘進(jìn)行大量數(shù)據(jù)查詢(xún)時(shí)不影響業(yè)務(wù)操作性能;
b)數(shù)據(jù)倉(cāng)庫(kù)根據(jù)分析需要組織數(shù)據(jù)結(jié)構(gòu)、內(nèi)容與功能等,使數(shù)據(jù)挖掘更專(zhuān)注有效;
c)數(shù)據(jù)倉(cāng)庫(kù)可以整合不同數(shù)據(jù)源數(shù)據(jù),使數(shù)據(jù)挖掘不僅局限于ERP系統(tǒng),方便擴(kuò)充。
應(yīng)用框架1的主要缺點(diǎn):
a)需要建立數(shù)據(jù)倉(cāng)庫(kù),需要進(jìn)行數(shù)據(jù)清理和數(shù)據(jù)集成,會(huì)增加數(shù)據(jù)挖掘應(yīng)用的風(fēng)險(xiǎn)與成本;
b)數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)歷史數(shù)據(jù),與最新數(shù)據(jù)存在差異,因此分析結(jié)果有時(shí)間延遲。
(2)應(yīng)用框架2:基于ERP業(yè)務(wù)數(shù)據(jù)庫(kù)的數(shù)據(jù)挖掘應(yīng)用
應(yīng)用框架2的主要優(yōu)點(diǎn):
a)利用ERP系統(tǒng)數(shù)據(jù)庫(kù),不建立單獨(dú)數(shù)據(jù)倉(cāng)庫(kù),成本低;
b)基于業(yè)務(wù)數(shù)據(jù)的分析具有實(shí)時(shí)性,分析結(jié)果時(shí)問(wèn)延遲小;
c)數(shù)據(jù)挖掘作為ERP模塊,與ERP結(jié)合緊密,可以及時(shí)根據(jù)分析結(jié)果調(diào)整ERP業(yè)務(wù),優(yōu)化ERP流程與業(yè)務(wù)。
應(yīng)用框架2的主要缺點(diǎn):
a)與ERP使用同一數(shù)據(jù)庫(kù),復(fù)雜的分析與查詢(xún)會(huì)影響業(yè)務(wù)操作性能;
b)數(shù)據(jù)挖掘需要考慮數(shù)據(jù)預(yù)處理,挖掘算法計(jì)算代價(jià)大;
c)可擴(kuò)充性相對(duì)低,局限于僅對(duì)ERP數(shù)據(jù)的分析。進(jìn)一步比較兩個(gè)應(yīng)用框架的特點(diǎn),如表l所示。
圖2 基于ERP業(yè)務(wù)數(shù)據(jù)庫(kù)的數(shù)據(jù)挖掘應(yīng)用框架
在圖2所示的應(yīng)用框架中,ERP數(shù)據(jù)挖掘模塊直接處理分析業(yè)務(wù)數(shù)據(jù),同樣基于知識(shí)庫(kù)進(jìn)行模式評(píng)估,并與用戶交互。必要的數(shù)據(jù)預(yù)處理功能作為數(shù)據(jù)挖掘模塊內(nèi)部功能存在,直接提取處理ERP操作數(shù)據(jù)庫(kù)。事實(shí)上,大型的數(shù)據(jù)庫(kù)系統(tǒng)也越來(lái)越向提供智能分析與數(shù)據(jù)挖掘功能的方向發(fā)展,因此,在不建立數(shù)據(jù)倉(cāng)庫(kù)的情況下,利用數(shù)據(jù)挖掘技術(shù)直接對(duì)ERP業(yè)務(wù)數(shù)據(jù)進(jìn)行一定程度的分析也是可行的。
2.4 比較與分析
基于ERP的數(shù)據(jù)倉(cāng)庫(kù)的建立,是應(yīng)用框架1中的核心內(nèi)容,也是傳統(tǒng)的數(shù)據(jù)挖掘應(yīng)用模式在ERP系統(tǒng)中的應(yīng)用,即先建立數(shù)據(jù)倉(cāng)庫(kù),再進(jìn)行數(shù)據(jù)挖掘。這種模式將ERP系統(tǒng)與數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)結(jié)合,既發(fā)揮了ERP系統(tǒng)處理事務(wù)的能力,又發(fā)揮了數(shù)據(jù)倉(cāng)庫(kù)之上的數(shù)據(jù)挖掘技術(shù)的決策支持作用。但根據(jù)ERP系統(tǒng)的特點(diǎn),ERP業(yè)務(wù)數(shù)據(jù)庫(kù)中的數(shù)據(jù)已經(jīng)相對(duì)集中與規(guī)范,在企業(yè)沒(méi)有建立數(shù)據(jù)倉(cāng)庫(kù)時(shí),ERP系統(tǒng)同樣需要有效的數(shù)據(jù)分析與決策支持,因此,基于ERP業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)挖掘應(yīng)用框架也同樣具有重要意義。
兩個(gè)應(yīng)用框架的優(yōu)缺點(diǎn)比較分析如下:
(1)應(yīng)用框架1:基于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)挖掘應(yīng)用
應(yīng)用框架1的主要優(yōu)點(diǎn):
a)操作型數(shù)據(jù)庫(kù)與分析型數(shù)據(jù)庫(kù)分離,使操作事務(wù)與分析任務(wù)互不干擾,能夠保證數(shù)據(jù)挖掘進(jìn)行大量數(shù)據(jù)查詢(xún)時(shí)不影響業(yè)務(wù)操作性能;
b)數(shù)據(jù)倉(cāng)庫(kù)根據(jù)分析需要組織數(shù)據(jù)結(jié)構(gòu)、內(nèi)容與功能等,使數(shù)據(jù)挖掘更專(zhuān)注有效;
c)數(shù)據(jù)倉(cāng)庫(kù)可以整合不同數(shù)據(jù)源數(shù)據(jù),使數(shù)據(jù)挖掘不僅局限于ERP系統(tǒng),方便擴(kuò)充。
應(yīng)用框架1的主要缺點(diǎn):
a)需要建立數(shù)據(jù)倉(cāng)庫(kù),需要進(jìn)行數(shù)據(jù)清理和數(shù)據(jù)集成,會(huì)增加數(shù)據(jù)挖掘應(yīng)用的風(fēng)險(xiǎn)與成本;
b)數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)歷史數(shù)據(jù),與最新數(shù)據(jù)存在差異,因此分析結(jié)果有時(shí)間延遲。
(2)應(yīng)用框架2:基于ERP業(yè)務(wù)數(shù)據(jù)庫(kù)的數(shù)據(jù)挖掘應(yīng)用
應(yīng)用框架2的主要優(yōu)點(diǎn):
a)利用ERP系統(tǒng)數(shù)據(jù)庫(kù),不建立單獨(dú)數(shù)據(jù)倉(cāng)庫(kù),成本低;
b)基于業(yè)務(wù)數(shù)據(jù)的分析具有實(shí)時(shí)性,分析結(jié)果時(shí)問(wèn)延遲小;
c)數(shù)據(jù)挖掘作為ERP模塊,與ERP結(jié)合緊密,可以及時(shí)根據(jù)分析結(jié)果調(diào)整ERP業(yè)務(wù),優(yōu)化ERP流程與業(yè)務(wù)。
應(yīng)用框架2的主要缺點(diǎn):
a)與ERP使用同一數(shù)據(jù)庫(kù),復(fù)雜的分析與查詢(xún)會(huì)影響業(yè)務(wù)操作性能;
b)數(shù)據(jù)挖掘需要考慮數(shù)據(jù)預(yù)處理,挖掘算法計(jì)算代價(jià)大;
c)可擴(kuò)充性相對(duì)低,局限于僅對(duì)ERP數(shù)據(jù)的分析。進(jìn)一步比較兩個(gè)應(yīng)用框架的特點(diǎn),如表l所示。
圖2 基于ERP業(yè)務(wù)數(shù)據(jù)庫(kù)的數(shù)據(jù)挖掘應(yīng)用框架
在圖2所示的應(yīng)用框架中,ERP數(shù)據(jù)挖掘模塊直接處理分析業(yè)務(wù)數(shù)據(jù),同樣基于知識(shí)庫(kù)進(jìn)行模式評(píng)估,并與用戶交互。必要的數(shù)據(jù)預(yù)處理功能作為數(shù)據(jù)挖掘模塊內(nèi)部功能存在,直接提取處理ERP操作數(shù)據(jù)庫(kù)。事實(shí)上,大型的數(shù)據(jù)庫(kù)系統(tǒng)也越來(lái)越向提供智能分析與數(shù)據(jù)挖掘功能的方向發(fā)展,因此,在不建立數(shù)據(jù)倉(cāng)庫(kù)的情況下,利用數(shù)據(jù)挖掘技術(shù)直接對(duì)ERP業(yè)務(wù)數(shù)據(jù)進(jìn)行一定程度的分析也是可行的。
2.4 比較與分析
基于ERP的數(shù)據(jù)倉(cāng)庫(kù)的建立,是應(yīng)用框架1中的核心內(nèi)容,也是傳統(tǒng)的數(shù)據(jù)挖掘應(yīng)用模式在ERP系統(tǒng)中的應(yīng)用,即先建立數(shù)據(jù)倉(cāng)庫(kù),再進(jìn)行數(shù)據(jù)挖掘。這種模式將ERP系統(tǒng)與數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)結(jié)合,既發(fā)揮了ERP系統(tǒng)處理事務(wù)的能力,又發(fā)揮了數(shù)據(jù)倉(cāng)庫(kù)之上的數(shù)據(jù)挖掘技術(shù)的決策支持作用。但根據(jù)ERP系統(tǒng)的特點(diǎn),ERP業(yè)務(wù)數(shù)據(jù)庫(kù)中的數(shù)據(jù)已經(jīng)相對(duì)集中與規(guī)范,在企業(yè)沒(méi)有建立數(shù)據(jù)倉(cāng)庫(kù)時(shí),ERP系統(tǒng)同樣需要有效的數(shù)據(jù)分析與決策支持,因此,基于ERP業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)挖掘應(yīng)用框架也同樣具有重要意義。
兩個(gè)應(yīng)用框架的優(yōu)缺點(diǎn)比較分析如下:
(1)應(yīng)用框架1:基于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)挖掘應(yīng)用
應(yīng)用框架1的主要優(yōu)點(diǎn):
a)操作型數(shù)據(jù)庫(kù)與分析型數(shù)據(jù)庫(kù)分離,使操作事務(wù)與分析任務(wù)互不干擾,能夠保證數(shù)據(jù)挖掘進(jìn)行大量數(shù)據(jù)查詢(xún)時(shí)不影響業(yè)務(wù)操作性能;
b)數(shù)據(jù)倉(cāng)庫(kù)根據(jù)分析需要組織數(shù)據(jù)結(jié)構(gòu)、內(nèi)容與功能等,使數(shù)據(jù)挖掘更專(zhuān)注有效;
c)數(shù)據(jù)倉(cāng)庫(kù)可以整合不同數(shù)據(jù)源數(shù)據(jù),使數(shù)據(jù)挖掘不僅局限于ERP系統(tǒng),方便擴(kuò)充。
應(yīng)用框架1的主要缺點(diǎn):
a)需要建立數(shù)據(jù)倉(cāng)庫(kù),需要進(jìn)行數(shù)據(jù)清理和數(shù)據(jù)集成,會(huì)增加數(shù)據(jù)挖掘應(yīng)用的風(fēng)險(xiǎn)與成本;
b)數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)歷史數(shù)據(jù),與最新數(shù)據(jù)存在差異,因此分析結(jié)果有時(shí)間延遲。
(2)應(yīng)用框架2:基于ERP業(yè)務(wù)數(shù)據(jù)庫(kù)的數(shù)據(jù)挖掘應(yīng)用
應(yīng)用框架2的主要優(yōu)點(diǎn):
a)利用ERP系統(tǒng)數(shù)據(jù)庫(kù),不建立單獨(dú)數(shù)據(jù)倉(cāng)庫(kù),成本低;
b)基于業(yè)務(wù)數(shù)據(jù)的分析具有實(shí)時(shí)性,分析結(jié)果時(shí)問(wèn)延遲小;
c)數(shù)據(jù)挖掘作為ERP模塊,與ERP結(jié)合緊密,可以及時(shí)根據(jù)分析結(jié)果調(diào)整ERP業(yè)務(wù),優(yōu)化ERP流程與業(yè)務(wù)。
應(yīng)用框架2的主要缺點(diǎn):
a)與ERP使用同一數(shù)據(jù)庫(kù),復(fù)雜的分析與查詢(xún)會(huì)影響業(yè)務(wù)操作性能;
b)數(shù)據(jù)挖掘需要考慮數(shù)據(jù)預(yù)處理,挖掘算法計(jì)算代價(jià)大;
c)可擴(kuò)充性相對(duì)低,局限于僅對(duì)ERP數(shù)據(jù)的分析。進(jìn)一步比較兩個(gè)應(yīng)用框架的特點(diǎn),如表l所示。
由以上分析可以得出:基于數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用框架,適合于信息化應(yīng)用較成熟的大中型企業(yè),通過(guò)建立面向主題的、集成的、時(shí)變的與非易失的數(shù)據(jù)倉(cāng)庫(kù),通過(guò)數(shù)據(jù)清理與數(shù)據(jù)集成,能夠充分進(jìn)行數(shù)據(jù)挖掘與分析,為企業(yè)提供有效、全面的決策支持。基于ERP業(yè)務(wù)數(shù)據(jù)庫(kù)的數(shù)據(jù)挖掘應(yīng)用框架,適合于不具備建立成熟數(shù)據(jù)倉(cāng)庫(kù),但又需要進(jìn)行數(shù)據(jù)挖掘應(yīng)用的中小型企業(yè),盡管不能全面支持與實(shí)現(xiàn)數(shù)據(jù)挖掘各種算法,但在有限條件下可實(shí)現(xiàn)性高,靈活性大,也具有較高的應(yīng)用價(jià)值。隨著數(shù)據(jù)庫(kù)與中間件技術(shù)的發(fā)展,基于操作型數(shù)據(jù)庫(kù)的數(shù)據(jù)挖掘與分析也必將進(jìn)一步發(fā)展。
3 結(jié)束語(yǔ)
本文在介紹ERP與數(shù)據(jù)挖掘概念與定義的基礎(chǔ)上,描述了兩個(gè)數(shù)據(jù)挖掘在ERP中的應(yīng)用框架:基于數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用框架與基于ERP業(yè)務(wù)數(shù)據(jù)庫(kù)的應(yīng)用框架。從兩個(gè)應(yīng)用框架出發(fā),分析了它們的優(yōu)缺點(diǎn),并且從數(shù)據(jù)對(duì)象、及時(shí)性、有效性等多個(gè)方面,比較了兩個(gè)框架的特點(diǎn)。數(shù)據(jù)挖掘技術(shù)作為數(shù)據(jù)分析與決策支持實(shí)現(xiàn)的高級(jí)技術(shù),必將成為ERP應(yīng)用的一個(gè)重要內(nèi)容,隨著ERP系統(tǒng)與數(shù)據(jù)挖掘技術(shù)的進(jìn)一步發(fā)展,在ERP系統(tǒng)中的數(shù)據(jù)挖掘應(yīng)用必將為企業(yè)提供更快、更有效的決策支持服務(wù),也必將給企業(yè)帶來(lái)巨大的經(jīng)濟(jì)效益。
隨著全球經(jīng)濟(jì)環(huán)境的進(jìn)一步改變,企業(yè)的競(jìng)爭(zhēng)壓力也越來(lái)越大,而ERP(企業(yè)資源計(jì)劃)體現(xiàn)了當(dāng)今世界上最先進(jìn)的企業(yè)管理理論,并提供了企業(yè)信息化集成的最佳方案,因此已經(jīng)成為眾多企業(yè)追求管理革新與信息化建設(shè)的必然選擇。一方面,隨著ERP系統(tǒng)的普及與廣泛應(yīng)用,必然會(huì)形成越來(lái)越多的數(shù)據(jù),如何從大量的甚至海量的數(shù)據(jù)中提取有用的知識(shí)以支持管理決策,已經(jīng)成為越來(lái)越重要的問(wèn)題;另一方面,數(shù)據(jù)挖掘技術(shù)利用數(shù)據(jù)庫(kù)系統(tǒng)、統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、可視化和信息科學(xué)等多學(xué)科技術(shù),研究從大量數(shù)據(jù)中如何提取或“挖掘”知識(shí),也逐漸從理論研究發(fā)展到了實(shí)際應(yīng)用。因此,將數(shù)據(jù)挖掘應(yīng)用于ERP系統(tǒng),分析利用ERP所形成的數(shù)據(jù),從而形成幫助決策的知識(shí),逐漸引起了研究者與企業(yè)的重視。
然而,由于數(shù)據(jù)挖掘源于多個(gè)學(xué)科,因此產(chǎn)生了大量的、各種不同類(lèi)型的數(shù)據(jù)挖掘系統(tǒng),盡管有普通的、全能的數(shù)據(jù)挖掘系統(tǒng)與通用的數(shù)據(jù)挖掘算法,但通用系統(tǒng)并不適合特定領(lǐng)域的挖掘任務(wù),因此需要針對(duì)特定應(yīng)用的數(shù)據(jù)挖掘進(jìn)行分析研究。
文中主要介紹ERP與數(shù)據(jù)挖掘的基本概念與發(fā)展,還分析了基于ERP的數(shù)據(jù)挖掘應(yīng)用所面對(duì)的問(wèn)題,討論數(shù)據(jù)挖掘在ERP中的兩個(gè)應(yīng)用框架的構(gòu)建。最后,比較并分析了兩個(gè)應(yīng)用框架的特點(diǎn)與優(yōu)缺點(diǎn)。
l 概念與定義
1.1 ERP的概念與發(fā)展
ERP的概念于20世紀(jì)90年代由美國(guó)Garter Group Inc咨詢(xún)公司首先提出,其理論與系統(tǒng)從MRPⅡ發(fā)展而來(lái),極大地?cái)U(kuò)展了業(yè)務(wù)管理的范圍及深度,管理范圍涉及到企業(yè)的所有供需過(guò)程。概括地說(shuō),ERP有如下定義:
定義:ERP是建立在信息技術(shù)的基礎(chǔ)上,利用現(xiàn)代企業(yè)的先進(jìn)管理思想,全面地集成了企業(yè)的所有資源信息,并為企業(yè)提供決策、計(jì)劃、控制與經(jīng)營(yíng)業(yè)績(jī)?cè)u(píng)估的全方位和系統(tǒng)化的管理平臺(tái)。
ERP不僅僅是信息系統(tǒng),更重要的是一種管理理論與管理思想,它代表了當(dāng)前在全球范圍內(nèi)應(yīng)用最廣泛、最有效的一種企業(yè)管理方法,這種管理方法已經(jīng)通過(guò)計(jì)算機(jī)軟件得到了體現(xiàn)。
ERP的核心管理思想就是實(shí)現(xiàn)對(duì)整個(gè)供應(yīng)鏈的有效管理,包括物流、資金流與信息流。基于ERP理論的信息系統(tǒng)主要包括生產(chǎn)計(jì)劃管理、質(zhì)量管理、設(shè)備管理、采購(gòu)管理、庫(kù)存管理、銷(xiāo)售管理、客戶關(guān)系管理、成本管理、財(cái)務(wù)管理幾個(gè)模塊。
隨著ERP應(yīng)用的深入發(fā)展,ERP的應(yīng)用范圍逐漸擴(kuò)大,并不再限于制造業(yè),已應(yīng)用到金融業(yè)、高科技產(chǎn)業(yè)、郵電與通信業(yè)、能源行業(yè)(電力、石油與天然氣、煤炭業(yè)等)、公共事業(yè)、商業(yè)與零售業(yè)、外貿(mào)行業(yè)、新聞出版業(yè)、咨詢(xún)服務(wù)業(yè),甚至于醫(yī)療保健業(yè)和賓館酒店等行業(yè),因此,美國(guó)生產(chǎn)庫(kù)存學(xué)會(huì)(American Production and Inventory Control Society,APICS)在2002年出版的《AFICS字典》(第10版)中對(duì)ERP系統(tǒng)的定義擴(kuò)展為:一種在制造、分銷(xiāo)或服務(wù)業(yè)公司中有效地計(jì)劃和控制為接收、制造、發(fā)運(yùn)和解決客戶訂單問(wèn)題所需的所有資源的方法。
從ERP的理論與實(shí)際應(yīng)用可以看到,為企業(yè)提供決策足ERP的重要目的與功能之一。
1.2 數(shù)據(jù)挖掘概述
隨著信息技術(shù)的發(fā)展,人們積累了越來(lái)越多的數(shù)據(jù),從大量的數(shù)據(jù)中獲得有價(jià)值的知識(shí)也越來(lái)越成為迫切的需求。因此,自20世紀(jì)90年代初以來(lái),數(shù)據(jù)挖掘或知識(shí)發(fā)現(xiàn)也越來(lái)越受到人們的重視。廣義的數(shù)據(jù)挖掘等同于知識(shí)發(fā)現(xiàn),而狹義的數(shù)據(jù)挖掘?qū)V钢R(shí)發(fā)現(xiàn)的一個(gè)基本步驟。作為知識(shí)發(fā)現(xiàn)的一個(gè)步驟,數(shù)據(jù)挖掘有以下定義:
定義2:數(shù)據(jù)挖掘就是從大量的數(shù)據(jù)中挖掘出有用的信息,即從大量的、不完全的、有噪音的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中發(fā)現(xiàn)隱含的、規(guī)律性的,人們事先未知的,但又是潛在有用的并且最終可理解的信息和知識(shí)的非平凡過(guò)程。
與傳統(tǒng)的數(shù)據(jù)分析手段(如查詢(xún)報(bào)表)相比,數(shù)據(jù)挖掘有以下幾個(gè)特點(diǎn):首先,數(shù)據(jù)挖掘處理的是大量或海量的數(shù)據(jù);其次,數(shù)據(jù)挖掘的目的是發(fā)現(xiàn)隱含的、事先未知的知識(shí);再次,數(shù)據(jù)挖掘更傾向于把任務(wù)交給程序自動(dòng)完成,也是人工智能的一種應(yīng)用;最后,數(shù)據(jù)挖掘是一個(gè)交叉學(xué)科,是高級(jí)的數(shù)據(jù)分析手段。
數(shù)據(jù)挖掘使用各種不同的算法來(lái)完成不同的任務(wù)。數(shù)據(jù)挖掘的任務(wù)一般可以分為兩類(lèi)BJ:描述和預(yù)測(cè)。描述性數(shù)據(jù)挖掘任務(wù)刻畫(huà)數(shù)據(jù)庫(kù)中數(shù)據(jù)的一般特性。預(yù)測(cè)性挖掘任務(wù)在當(dāng)前數(shù)據(jù)上進(jìn)行推斷,以進(jìn)行預(yù)測(cè)。最基本也是最重要的數(shù)據(jù)挖掘任務(wù)為:
1)關(guān)聯(lián):關(guān)聯(lián)分析發(fā)現(xiàn)關(guān)聯(lián)規(guī)則,這些規(guī)則展示了屬性與屬性之間的關(guān)系;
2)聚類(lèi):產(chǎn)生分組標(biāo)記,根據(jù)最大化類(lèi)內(nèi)相似性、最小化類(lèi)間相似性原則將數(shù)據(jù)分成不同的簇;
3)分類(lèi)/預(yù)測(cè):找出描述并區(qū)分?jǐn)?shù)據(jù)類(lèi)或概念的模型,以便能使用模型預(yù)測(cè)類(lèi)標(biāo)記未知的對(duì)象類(lèi)。數(shù)據(jù)挖掘還有序列發(fā)現(xiàn)、相關(guān)分析、孤立點(diǎn)分析等多種任務(wù)。
目前,數(shù)據(jù)挖掘作為知識(shí)發(fā)現(xiàn)的重要步驟與商業(yè)智能(BI)的核心功能,已經(jīng)應(yīng)用于金融、電信、體育分析、銷(xiāo)售等多個(gè)領(lǐng)域,但制造業(yè)應(yīng)用并不廣泛。
2 數(shù)據(jù)挖掘在ERP中的應(yīng)用框架
2.1 應(yīng)用問(wèn)題描述與分析
ERP系統(tǒng)涉及整個(gè)供應(yīng)鏈的管理,會(huì)產(chǎn)生大量的數(shù)據(jù),其重要目的之一是提供決策支持,因此,分析利用ERP系統(tǒng)積累的數(shù)據(jù),提高決策能力,越來(lái)越受到人們的重視。傳統(tǒng)的方法是提供報(bào)表功能,但報(bào)表功能處理海量數(shù)據(jù)力不從心,也無(wú)法更智能地發(fā)現(xiàn)隱含的知識(shí),因此,ERP系統(tǒng)越來(lái)越需要數(shù)據(jù)挖掘的應(yīng)用。但是,由于ERP最主要的應(yīng)用行業(yè)——制造業(yè)類(lèi)型復(fù)雜,各個(gè)生產(chǎn)管理環(huán)節(jié)形成的數(shù)據(jù)種類(lèi)繁多,設(shè)計(jì)通用的數(shù)據(jù)挖掘算法覆蓋所有的生產(chǎn)問(wèn)題和所有的管理環(huán)節(jié)是十分困難的。事實(shí)上,由于ERP積累的數(shù)據(jù)有著行業(yè)獨(dú)特的相關(guān)性,通用的數(shù)據(jù)挖掘算法是無(wú)效的,加之企業(yè)對(duì)數(shù)據(jù)挖掘這種新技術(shù)實(shí)施風(fēng)險(xiǎn)的考慮,因此,盡管大型的ERP系統(tǒng)包含數(shù)據(jù)挖掘的商業(yè)智能模塊,但總體上來(lái)看,數(shù)據(jù)挖掘在ERP中的應(yīng)用并不廣泛。
2.2 基于數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用框架
根據(jù)ERP系統(tǒng)的特點(diǎn),結(jié)合典型的數(shù)據(jù)挖掘系統(tǒng)結(jié)構(gòu),一種基于數(shù)據(jù)倉(cāng)庫(kù)的ERP系統(tǒng)數(shù)據(jù)挖掘應(yīng)用框架如圖1所示,標(biāo)記為應(yīng)用框架1。
ERP業(yè)務(wù)數(shù)據(jù)庫(kù)屬于數(shù)據(jù)庫(kù)技術(shù)中的操作型數(shù)據(jù)庫(kù),主要處理聯(lián)機(jī)事務(wù),關(guān)注多事務(wù)處理、數(shù)據(jù)的一致性與完整性等,重點(diǎn)不在于大數(shù)據(jù)量的查詢(xún)與分析。而數(shù)據(jù)倉(cāng)庫(kù)是分析型數(shù)據(jù)庫(kù),是一種數(shù)據(jù)的長(zhǎng)期存儲(chǔ),數(shù)據(jù)經(jīng)過(guò)組織在一致的模式下存放,通常是歷史數(shù)據(jù)的匯總,目的是為了支持決策。數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織、存取方法以及支持的主要功能等都是針對(duì)歷史數(shù)據(jù)的查詢(xún)與分析而設(shè)計(jì),因此數(shù)據(jù)倉(cāng)庫(kù)能更好地支持?jǐn)?shù)據(jù)挖掘。
圖1所示的應(yīng)用框架描述如下:
a)數(shù)據(jù)處理模塊:將ERP業(yè)務(wù)數(shù)據(jù)庫(kù)的數(shù)據(jù)經(jīng)過(guò)提取、轉(zhuǎn)換與加載等,轉(zhuǎn)換為符合數(shù)據(jù)倉(cāng)庫(kù)要求的數(shù)據(jù)。
b)數(shù)據(jù)挖掘引擎:用于執(zhí)行數(shù)據(jù)挖掘任務(wù),包括關(guān)聯(lián)規(guī)則、聚類(lèi)、分類(lèi)等。
c)知識(shí)庫(kù):領(lǐng)域知識(shí),用于指導(dǎo)數(shù)據(jù)挖掘執(zhí)行,也用于評(píng)估數(shù)據(jù)挖掘的結(jié)果模式。
d)模式評(píng)估:該模塊與數(shù)據(jù)挖掘引擎交互,也與用戶交互,并根據(jù)知識(shí)庫(kù)的相關(guān)知識(shí),評(píng)估數(shù)據(jù)挖掘結(jié)果的興趣度,過(guò)濾發(fā)現(xiàn)的模式。
基于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)挖掘應(yīng)用框架的特點(diǎn)是:數(shù)據(jù)挖掘過(guò)程與ERP業(yè)務(wù)過(guò)程分離,挖掘過(guò)程不影響實(shí)時(shí)操作,但分析對(duì)象也不是實(shí)時(shí)數(shù)據(jù)。
2.3 基于ERP業(yè)務(wù)數(shù)據(jù)庫(kù)的應(yīng)用框架
盡管數(shù)據(jù)倉(cāng)庫(kù)技術(shù)對(duì)數(shù)據(jù)挖掘有著重要作用,但是數(shù)據(jù)挖掘不限于僅分析數(shù)據(jù)倉(cāng)庫(kù)中的匯總數(shù)據(jù),它可以分析現(xiàn)存于ERP系統(tǒng)中的更細(xì)化的業(yè)務(wù)數(shù)據(jù),因此,基于ERP業(yè)務(wù)數(shù)據(jù)庫(kù)的數(shù)據(jù)挖掘應(yīng)用框架如圖2所示,標(biāo)記為應(yīng)用框架2。在這一框架中,數(shù)據(jù)挖掘不再是建立在數(shù)據(jù)倉(cāng)庫(kù)上的獨(dú)立系統(tǒng),而是作為ERP系統(tǒng)的一個(gè)高級(jí)模塊存在,它一方面是對(duì)數(shù)據(jù)挖掘分析對(duì)象的擴(kuò)展,另一方面也是日益重要的在線實(shí)時(shí)數(shù)據(jù)分析的要求。
圖2 基于ERP業(yè)務(wù)數(shù)據(jù)庫(kù)的數(shù)據(jù)挖掘應(yīng)用框架
在圖2所示的應(yīng)用框架中,ERP數(shù)據(jù)挖掘模塊直接處理分析業(yè)務(wù)數(shù)據(jù),同樣基于知識(shí)庫(kù)進(jìn)行模式評(píng)估,并與用戶交互。必要的數(shù)據(jù)預(yù)處理功能作為數(shù)據(jù)挖掘模塊內(nèi)部功能存在,直接提取處理ERP操作數(shù)據(jù)庫(kù)。事實(shí)上,大型的數(shù)據(jù)庫(kù)系統(tǒng)也越來(lái)越向提供智能分析與數(shù)據(jù)挖掘功能的方向發(fā)展,因此,在不建立數(shù)據(jù)倉(cāng)庫(kù)的情況下,利用數(shù)據(jù)挖掘技術(shù)直接對(duì)ERP業(yè)務(wù)數(shù)據(jù)進(jìn)行一定程度的分析也是可行的。
2.4 比較與分析
基于ERP的數(shù)據(jù)倉(cāng)庫(kù)的建立,是應(yīng)用框架1中的核心內(nèi)容,也是傳統(tǒng)的數(shù)據(jù)挖掘應(yīng)用模式在ERP系統(tǒng)中的應(yīng)用,即先建立數(shù)據(jù)倉(cāng)庫(kù),再進(jìn)行數(shù)據(jù)挖掘。這種模式將ERP系統(tǒng)與數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)結(jié)合,既發(fā)揮了ERP系統(tǒng)處理事務(wù)的能力,又發(fā)揮了數(shù)據(jù)倉(cāng)庫(kù)之上的數(shù)據(jù)挖掘技術(shù)的決策支持作用。但根據(jù)ERP系統(tǒng)的特點(diǎn),ERP業(yè)務(wù)數(shù)據(jù)庫(kù)中的數(shù)據(jù)已經(jīng)相對(duì)集中與規(guī)范,在企業(yè)沒(méi)有建立數(shù)據(jù)倉(cāng)庫(kù)時(shí),ERP系統(tǒng)同樣需要有效的數(shù)據(jù)分析與決策支持,因此,基于ERP業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)挖掘應(yīng)用框架也同樣具有重要意義。
兩個(gè)應(yīng)用框架的優(yōu)缺點(diǎn)比較分析如下:
(1)應(yīng)用框架1:基于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)挖掘應(yīng)用
應(yīng)用框架1的主要優(yōu)點(diǎn):
a)操作型數(shù)據(jù)庫(kù)與分析型數(shù)據(jù)庫(kù)分離,使操作事務(wù)與分析任務(wù)互不干擾,能夠保證數(shù)據(jù)挖掘進(jìn)行大量數(shù)據(jù)查詢(xún)時(shí)不影響業(yè)務(wù)操作性能;
b)數(shù)據(jù)倉(cāng)庫(kù)根據(jù)分析需要組織數(shù)據(jù)結(jié)構(gòu)、內(nèi)容與功能等,使數(shù)據(jù)挖掘更專(zhuān)注有效;
c)數(shù)據(jù)倉(cāng)庫(kù)可以整合不同數(shù)據(jù)源數(shù)據(jù),使數(shù)據(jù)挖掘不僅局限于ERP系統(tǒng),方便擴(kuò)充。
應(yīng)用框架1的主要缺點(diǎn):
a)需要建立數(shù)據(jù)倉(cāng)庫(kù),需要進(jìn)行數(shù)據(jù)清理和數(shù)據(jù)集成,會(huì)增加數(shù)據(jù)挖掘應(yīng)用的風(fēng)險(xiǎn)與成本;
b)數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)歷史數(shù)據(jù),與最新數(shù)據(jù)存在差異,因此分析結(jié)果有時(shí)間延遲。
(2)應(yīng)用框架2:基于ERP業(yè)務(wù)數(shù)據(jù)庫(kù)的數(shù)據(jù)挖掘應(yīng)用
應(yīng)用框架2的主要優(yōu)點(diǎn):
a)利用ERP系統(tǒng)數(shù)據(jù)庫(kù),不建立單獨(dú)數(shù)據(jù)倉(cāng)庫(kù),成本低;
b)基于業(yè)務(wù)數(shù)據(jù)的分析具有實(shí)時(shí)性,分析結(jié)果時(shí)問(wèn)延遲小;
c)數(shù)據(jù)挖掘作為ERP模塊,與ERP結(jié)合緊密,可以及時(shí)根據(jù)分析結(jié)果調(diào)整ERP業(yè)務(wù),優(yōu)化ERP流程與業(yè)務(wù)。
應(yīng)用框架2的主要缺點(diǎn):
a)與ERP使用同一數(shù)據(jù)庫(kù),復(fù)雜的分析與查詢(xún)會(huì)影響業(yè)務(wù)操作性能;
b)數(shù)據(jù)挖掘需要考慮數(shù)據(jù)預(yù)處理,挖掘算法計(jì)算代價(jià)大;
c)可擴(kuò)充性相對(duì)低,局限于僅對(duì)ERP數(shù)據(jù)的分析。進(jìn)一步比較兩個(gè)應(yīng)用框架的特點(diǎn),如表l所示。
圖2 基于ERP業(yè)務(wù)數(shù)據(jù)庫(kù)的數(shù)據(jù)挖掘應(yīng)用框架
在圖2所示的應(yīng)用框架中,ERP數(shù)據(jù)挖掘模塊直接處理分析業(yè)務(wù)數(shù)據(jù),同樣基于知識(shí)庫(kù)進(jìn)行模式評(píng)估,并與用戶交互。必要的數(shù)據(jù)預(yù)處理功能作為數(shù)據(jù)挖掘模塊內(nèi)部功能存在,直接提取處理ERP操作數(shù)據(jù)庫(kù)。事實(shí)上,大型的數(shù)據(jù)庫(kù)系統(tǒng)也越來(lái)越向提供智能分析與數(shù)據(jù)挖掘功能的方向發(fā)展,因此,在不建立數(shù)據(jù)倉(cāng)庫(kù)的情況下,利用數(shù)據(jù)挖掘技術(shù)直接對(duì)ERP業(yè)務(wù)數(shù)據(jù)進(jìn)行一定程度的分析也是可行的。
2.4 比較與分析
基于ERP的數(shù)據(jù)倉(cāng)庫(kù)的建立,是應(yīng)用框架1中的核心內(nèi)容,也是傳統(tǒng)的數(shù)據(jù)挖掘應(yīng)用模式在ERP系統(tǒng)中的應(yīng)用,即先建立數(shù)據(jù)倉(cāng)庫(kù),再進(jìn)行數(shù)據(jù)挖掘。這種模式將ERP系統(tǒng)與數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)結(jié)合,既發(fā)揮了ERP系統(tǒng)處理事務(wù)的能力,又發(fā)揮了數(shù)據(jù)倉(cāng)庫(kù)之上的數(shù)據(jù)挖掘技術(shù)的決策支持作用。但根據(jù)ERP系統(tǒng)的特點(diǎn),ERP業(yè)務(wù)數(shù)據(jù)庫(kù)中的數(shù)據(jù)已經(jīng)相對(duì)集中與規(guī)范,在企業(yè)沒(méi)有建立數(shù)據(jù)倉(cāng)庫(kù)時(shí),ERP系統(tǒng)同樣需要有效的數(shù)據(jù)分析與決策支持,因此,基于ERP業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)挖掘應(yīng)用框架也同樣具有重要意義。
兩個(gè)應(yīng)用框架的優(yōu)缺點(diǎn)比較分析如下:
(1)應(yīng)用框架1:基于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)挖掘應(yīng)用
應(yīng)用框架1的主要優(yōu)點(diǎn):
a)操作型數(shù)據(jù)庫(kù)與分析型數(shù)據(jù)庫(kù)分離,使操作事務(wù)與分析任務(wù)互不干擾,能夠保證數(shù)據(jù)挖掘進(jìn)行大量數(shù)據(jù)查詢(xún)時(shí)不影響業(yè)務(wù)操作性能;
b)數(shù)據(jù)倉(cāng)庫(kù)根據(jù)分析需要組織數(shù)據(jù)結(jié)構(gòu)、內(nèi)容與功能等,使數(shù)據(jù)挖掘更專(zhuān)注有效;
c)數(shù)據(jù)倉(cāng)庫(kù)可以整合不同數(shù)據(jù)源數(shù)據(jù),使數(shù)據(jù)挖掘不僅局限于ERP系統(tǒng),方便擴(kuò)充。
應(yīng)用框架1的主要缺點(diǎn):
a)需要建立數(shù)據(jù)倉(cāng)庫(kù),需要進(jìn)行數(shù)據(jù)清理和數(shù)據(jù)集成,會(huì)增加數(shù)據(jù)挖掘應(yīng)用的風(fēng)險(xiǎn)與成本;
b)數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)歷史數(shù)據(jù),與最新數(shù)據(jù)存在差異,因此分析結(jié)果有時(shí)間延遲。
(2)應(yīng)用框架2:基于ERP業(yè)務(wù)數(shù)據(jù)庫(kù)的數(shù)據(jù)挖掘應(yīng)用
應(yīng)用框架2的主要優(yōu)點(diǎn):
a)利用ERP系統(tǒng)數(shù)據(jù)庫(kù),不建立單獨(dú)數(shù)據(jù)倉(cāng)庫(kù),成本低;
b)基于業(yè)務(wù)數(shù)據(jù)的分析具有實(shí)時(shí)性,分析結(jié)果時(shí)問(wèn)延遲小;
c)數(shù)據(jù)挖掘作為ERP模塊,與ERP結(jié)合緊密,可以及時(shí)根據(jù)分析結(jié)果調(diào)整ERP業(yè)務(wù),優(yōu)化ERP流程與業(yè)務(wù)。
應(yīng)用框架2的主要缺點(diǎn):
a)與ERP使用同一數(shù)據(jù)庫(kù),復(fù)雜的分析與查詢(xún)會(huì)影響業(yè)務(wù)操作性能;
b)數(shù)據(jù)挖掘需要考慮數(shù)據(jù)預(yù)處理,挖掘算法計(jì)算代價(jià)大;
c)可擴(kuò)充性相對(duì)低,局限于僅對(duì)ERP數(shù)據(jù)的分析。進(jìn)一步比較兩個(gè)應(yīng)用框架的特點(diǎn),如表l所示。
圖2 基于ERP業(yè)務(wù)數(shù)據(jù)庫(kù)的數(shù)據(jù)挖掘應(yīng)用框架
在圖2所示的應(yīng)用框架中,ERP數(shù)據(jù)挖掘模塊直接處理分析業(yè)務(wù)數(shù)據(jù),同樣基于知識(shí)庫(kù)進(jìn)行模式評(píng)估,并與用戶交互。必要的數(shù)據(jù)預(yù)處理功能作為數(shù)據(jù)挖掘模塊內(nèi)部功能存在,直接提取處理ERP操作數(shù)據(jù)庫(kù)。事實(shí)上,大型的數(shù)據(jù)庫(kù)系統(tǒng)也越來(lái)越向提供智能分析與數(shù)據(jù)挖掘功能的方向發(fā)展,因此,在不建立數(shù)據(jù)倉(cāng)庫(kù)的情況下,利用數(shù)據(jù)挖掘技術(shù)直接對(duì)ERP業(yè)務(wù)數(shù)據(jù)進(jìn)行一定程度的分析也是可行的。
2.4 比較與分析
基于ERP的數(shù)據(jù)倉(cāng)庫(kù)的建立,是應(yīng)用框架1中的核心內(nèi)容,也是傳統(tǒng)的數(shù)據(jù)挖掘應(yīng)用模式在ERP系統(tǒng)中的應(yīng)用,即先建立數(shù)據(jù)倉(cāng)庫(kù),再進(jìn)行數(shù)據(jù)挖掘。這種模式將ERP系統(tǒng)與數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)結(jié)合,既發(fā)揮了ERP系統(tǒng)處理事務(wù)的能力,又發(fā)揮了數(shù)據(jù)倉(cāng)庫(kù)之上的數(shù)據(jù)挖掘技術(shù)的決策支持作用。但根據(jù)ERP系統(tǒng)的特點(diǎn),ERP業(yè)務(wù)數(shù)據(jù)庫(kù)中的數(shù)據(jù)已經(jīng)相對(duì)集中與規(guī)范,在企業(yè)沒(méi)有建立數(shù)據(jù)倉(cāng)庫(kù)時(shí),ERP系統(tǒng)同樣需要有效的數(shù)據(jù)分析與決策支持,因此,基于ERP業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)挖掘應(yīng)用框架也同樣具有重要意義。
兩個(gè)應(yīng)用框架的優(yōu)缺點(diǎn)比較分析如下:
(1)應(yīng)用框架1:基于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)挖掘應(yīng)用
應(yīng)用框架1的主要優(yōu)點(diǎn):
a)操作型數(shù)據(jù)庫(kù)與分析型數(shù)據(jù)庫(kù)分離,使操作事務(wù)與分析任務(wù)互不干擾,能夠保證數(shù)據(jù)挖掘進(jìn)行大量數(shù)據(jù)查詢(xún)時(shí)不影響業(yè)務(wù)操作性能;
b)數(shù)據(jù)倉(cāng)庫(kù)根據(jù)分析需要組織數(shù)據(jù)結(jié)構(gòu)、內(nèi)容與功能等,使數(shù)據(jù)挖掘更專(zhuān)注有效;
c)數(shù)據(jù)倉(cāng)庫(kù)可以整合不同數(shù)據(jù)源數(shù)據(jù),使數(shù)據(jù)挖掘不僅局限于ERP系統(tǒng),方便擴(kuò)充。
應(yīng)用框架1的主要缺點(diǎn):
a)需要建立數(shù)據(jù)倉(cāng)庫(kù),需要進(jìn)行數(shù)據(jù)清理和數(shù)據(jù)集成,會(huì)增加數(shù)據(jù)挖掘應(yīng)用的風(fēng)險(xiǎn)與成本;
b)數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)歷史數(shù)據(jù),與最新數(shù)據(jù)存在差異,因此分析結(jié)果有時(shí)間延遲。
(2)應(yīng)用框架2:基于ERP業(yè)務(wù)數(shù)據(jù)庫(kù)的數(shù)據(jù)挖掘應(yīng)用
應(yīng)用框架2的主要優(yōu)點(diǎn):
a)利用ERP系統(tǒng)數(shù)據(jù)庫(kù),不建立單獨(dú)數(shù)據(jù)倉(cāng)庫(kù),成本低;
b)基于業(yè)務(wù)數(shù)據(jù)的分析具有實(shí)時(shí)性,分析結(jié)果時(shí)問(wèn)延遲小;
c)數(shù)據(jù)挖掘作為ERP模塊,與ERP結(jié)合緊密,可以及時(shí)根據(jù)分析結(jié)果調(diào)整ERP業(yè)務(wù),優(yōu)化ERP流程與業(yè)務(wù)。
應(yīng)用框架2的主要缺點(diǎn):
a)與ERP使用同一數(shù)據(jù)庫(kù),復(fù)雜的分析與查詢(xún)會(huì)影響業(yè)務(wù)操作性能;
b)數(shù)據(jù)挖掘需要考慮數(shù)據(jù)預(yù)處理,挖掘算法計(jì)算代價(jià)大;
c)可擴(kuò)充性相對(duì)低,局限于僅對(duì)ERP數(shù)據(jù)的分析。進(jìn)一步比較兩個(gè)應(yīng)用框架的特點(diǎn),如表l所示。
由以上分析可以得出:基于數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用框架,適合于信息化應(yīng)用較成熟的大中型企業(yè),通過(guò)建立面向主題的、集成的、時(shí)變的與非易失的數(shù)據(jù)倉(cāng)庫(kù),通過(guò)數(shù)據(jù)清理與數(shù)據(jù)集成,能夠充分進(jìn)行數(shù)據(jù)挖掘與分析,為企業(yè)提供有效、全面的決策支持。基于ERP業(yè)務(wù)數(shù)據(jù)庫(kù)的數(shù)據(jù)挖掘應(yīng)用框架,適合于不具備建立成熟數(shù)據(jù)倉(cāng)庫(kù),但又需要進(jìn)行數(shù)據(jù)挖掘應(yīng)用的中小型企業(yè),盡管不能全面支持與實(shí)現(xiàn)數(shù)據(jù)挖掘各種算法,但在有限條件下可實(shí)現(xiàn)性高,靈活性大,也具有較高的應(yīng)用價(jià)值。隨著數(shù)據(jù)庫(kù)與中間件技術(shù)的發(fā)展,基于操作型數(shù)據(jù)庫(kù)的數(shù)據(jù)挖掘與分析也必將進(jìn)一步發(fā)展。
3 結(jié)束語(yǔ)
本文在介紹ERP與數(shù)據(jù)挖掘概念與定義的基礎(chǔ)上,描述了兩個(gè)數(shù)據(jù)挖掘在ERP中的應(yīng)用框架:基于數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用框架與基于ERP業(yè)務(wù)數(shù)據(jù)庫(kù)的應(yīng)用框架。從兩個(gè)應(yīng)用框架出發(fā),分析了它們的優(yōu)缺點(diǎn),并且從數(shù)據(jù)對(duì)象、及時(shí)性、有效性等多個(gè)方面,比較了兩個(gè)框架的特點(diǎn)。數(shù)據(jù)挖掘技術(shù)作為數(shù)據(jù)分析與決策支持實(shí)現(xiàn)的高級(jí)技術(shù),必將成為ERP應(yīng)用的一個(gè)重要內(nèi)容,隨著ERP系統(tǒng)與數(shù)據(jù)挖掘技術(shù)的進(jìn)一步發(fā)展,在ERP系統(tǒng)中的數(shù)據(jù)挖掘應(yīng)用必將為企業(yè)提供更快、更有效的決策支持服務(wù),也必將給企業(yè)帶來(lái)巨大的經(jīng)濟(jì)效益。
責(zé)任編輯:和碩涵
免責(zé)聲明:本文僅代表作者個(gè)人觀點(diǎn),與本站無(wú)關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)讀者僅作參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。
我要收藏
個(gè)贊
-
現(xiàn)貨模式下谷電用戶價(jià)值再評(píng)估
2020-10-10電力現(xiàn)貨市場(chǎng),電力交易,電力用戶 -
PPT | 高校綜合能源服務(wù)有哪些解決方案?
2020-10-09綜合能源服務(wù),清潔供熱,多能互補(bǔ) -
深度文章 | “十三五”以來(lái)電力消費(fèi)增長(zhǎng)原因分析及中長(zhǎng)期展望
2020-09-27電力需求,用電量,全社會(huì)用電量
-
PPT | 高校綜合能源服務(wù)有哪些解決方案?
2020-10-09綜合能源服務(wù),清潔供熱,多能互補(bǔ) -
深度文章 | “十三五”以來(lái)電力消費(fèi)增長(zhǎng)原因分析及中長(zhǎng)期展望
2020-09-27電力需求,用電量,全社會(huì)用電量 -
我國(guó)電力改革涉及的電價(jià)問(wèn)題
-
電化學(xué)儲(chǔ)能應(yīng)用現(xiàn)狀及對(duì)策研究
2019-08-14電化學(xué)儲(chǔ)能應(yīng)用 -
《能源監(jiān)測(cè)與評(píng)價(jià)》——能源系統(tǒng)工程之預(yù)測(cè)和規(guī)劃
-
《能源監(jiān)測(cè)與評(píng)價(jià)》——能源系統(tǒng)工程之基本方法
-
貴州職稱(chēng)論文發(fā)表選擇泛亞,論文發(fā)表有保障
2019-02-20貴州職稱(chēng)論文發(fā)表 -
《電力設(shè)備管理》雜志首屆全國(guó)電力工業(yè) 特約專(zhuān)家征文
2019-01-05電力設(shè)備管理雜志 -
國(guó)內(nèi)首座蜂窩型集束煤倉(cāng)管理創(chuàng)新與實(shí)踐
-
人力資源和社會(huì)保障部:電線電纜制造工國(guó)家職業(yè)技能標(biāo)準(zhǔn)
-
人力資源和社會(huì)保障部:變壓器互感器制造工國(guó)家職業(yè)技能標(biāo)準(zhǔn)
-
《低壓微電網(wǎng)并網(wǎng)一體化裝置技術(shù)規(guī)范》T/CEC 150
2019-01-02低壓微電網(wǎng)技術(shù)規(guī)范