將尿布與啤酒兩種看似不相干的商品擺放在一起,竟能大幅增加其銷(xiāo)售額。
沃爾瑪公司在對(duì)顧客的購(gòu)物行為進(jìn)行分析時(shí)發(fā)現(xiàn),“跟尿布一起購(gòu)買(mǎi)最多的商品竟是啤酒。”針對(duì)這一現(xiàn)象,沃爾瑪對(duì)消費(fèi)數(shù)據(jù)進(jìn)行了調(diào)查分析。分析的結(jié)果揭示了隱藏在“尿布與啤酒”背后的美國(guó)人的消費(fèi)行為傾向——美國(guó)的太太們經(jīng)常叮囑她們的丈夫?yàn)樾『①I(mǎi)尿布,一些年輕的父親下班后到超市購(gòu)買(mǎi)嬰兒尿布時(shí),其中30%~40%的人同時(shí)也會(huì)為自己購(gòu)買(mǎi)啤酒。既然尿布與啤酒放在一起會(huì)增加購(gòu)買(mǎi)的機(jī)會(huì),于是沃爾瑪開(kāi)始將眾多門(mén)店的尿布與啤酒并排擺放,結(jié)果是兩類(lèi)商品的銷(xiāo)售量均大大增長(zhǎng)。
上面的例子,源于《財(cái)富》雜志報(bào)道的沃爾瑪案例,從這一例子中,人們看到了對(duì)消費(fèi)者行為模式的準(zhǔn)確把握。實(shí)際上,沃爾瑪能夠找到這樣的規(guī)律,是基于對(duì)原始交易數(shù)據(jù)進(jìn)行深入分析的結(jié)果,而這都要?dú)w功于一項(xiàng)特殊的工作——數(shù)據(jù)挖掘。
所謂數(shù)據(jù)挖掘,是指尋找隱藏在海量數(shù)據(jù)中有價(jià)值的信息,進(jìn)而支持決策的過(guò)程。“挖掘”的目標(biāo)包括趨勢(shì)、特征及相關(guān)性等多個(gè)方面的信息。
在計(jì)算機(jī)與信息技術(shù)普及的今天,人們的消費(fèi)需求、行為和習(xí)慣都可以化為海量的用戶數(shù)據(jù),進(jìn)而被銀行、電信運(yùn)營(yíng)商、信用卡公司等機(jī)構(gòu)進(jìn)行“挖掘”。而這樣的數(shù)據(jù)挖掘成果,正逐步為公眾所分享。
例如,在網(wǎng)上購(gòu)買(mǎi)一本小說(shuō)時(shí),不少網(wǎng)站都會(huì)自動(dòng)推薦相關(guān)度極高的另一本書(shū)籍;查詢電話話費(fèi)時(shí),電信運(yùn)營(yíng)商也往往根據(jù)用戶通話數(shù)據(jù),給出更省錢(qián)的套餐作為參考。這些都是數(shù)據(jù)挖掘呈現(xiàn)的效應(yīng),一方面給企業(yè)帶來(lái)了更好的營(yíng)銷(xiāo)方式,另一方面也讓用戶享受到了便利。
商業(yè)支撐
除了較早介入該領(lǐng)域的電信運(yùn)營(yíng)商和銀行之外,數(shù)據(jù)挖掘正被應(yīng)用在零售、金融服務(wù)、制造業(yè)、電話銷(xiāo)售、保險(xiǎn)等更多行業(yè)中。
在商業(yè)領(lǐng)域,數(shù)據(jù)挖掘尤其具有巨大的潛在價(jià)值。通過(guò)分析用戶消費(fèi)行為和交易紀(jì)錄,數(shù)據(jù)挖掘可用于幫助企業(yè)回答較為復(fù)雜的問(wèn)題。比如大客戶的特征是什么?應(yīng)該給這些客戶提供什么樣的促銷(xiāo)手段?客戶在1個(gè)月內(nèi)再次購(gòu)買(mǎi)的可能性有多大?什么樣的產(chǎn)品與花錢(qián)最多的客戶相聯(lián)系?
時(shí)下火爆的團(tuán)購(gòu)網(wǎng)站們,也將數(shù)據(jù)挖掘視為重要的運(yùn)營(yíng)支撐。團(tuán)購(gòu)網(wǎng)站的高管們常常把各種數(shù)據(jù)掛在嘴邊。在簡(jiǎn)單同化的網(wǎng)站頁(yè)面背后,很多公司正在數(shù)據(jù)挖掘上暗自角力,以求通過(guò)更加科學(xué)有效的方式精準(zhǔn)匹配消費(fèi)需求,在眾多商家中遴選最合適的商品,進(jìn)而更好地控制用戶粘性。
實(shí)際上,在互聯(lián)網(wǎng)領(lǐng)域,最早利用數(shù)據(jù)挖掘技術(shù)的是電子商務(wù)公司。尤其是B2C網(wǎng)站,比如,通過(guò)“啤酒-尿布”案例中體現(xiàn)的關(guān)聯(lián)性規(guī)則和相應(yīng)算法,商家可向買(mǎi)過(guò)商品的用戶推薦第二件最可能消費(fèi)的商品。
“目前國(guó)內(nèi)數(shù)據(jù)挖掘做的比較好的是淘寶,這與公司的重視程度有很大關(guān)系。”劉毅向《財(cái)經(jīng)國(guó)家周刊》記者說(shuō)。
劉毅出身統(tǒng)計(jì)學(xué)專(zhuān)業(yè),從事數(shù)據(jù)挖掘工作多年,早前曾在網(wǎng)絡(luò)游戲公司網(wǎng)龍從事數(shù)據(jù)挖掘工作,如今在艾瑞咨詢創(chuàng)新研發(fā)部進(jìn)行數(shù)據(jù)產(chǎn)品研發(fā)。
“我看過(guò)淘寶數(shù)據(jù)魔方,個(gè)人認(rèn)為,它展現(xiàn)出來(lái)的結(jié)果還是冰山一角,更多是一些報(bào)表分析。”劉毅表示,淘寶每日
把交易數(shù)據(jù)做成數(shù)據(jù)倉(cāng)庫(kù),并根據(jù)淘寶品類(lèi)和關(guān)鍵詞設(shè)置等維度進(jìn)行展現(xiàn),但目前也僅限于這些。
據(jù)悉,淘寶網(wǎng)每日
產(chǎn)生約7000G容量的數(shù)據(jù)。3月31日,淘寶網(wǎng)對(duì)外宣布,面向全球開(kāi)放淘寶數(shù)據(jù),商家、企業(yè)及消費(fèi)者將在未來(lái)分享到來(lái)自淘寶網(wǎng)的海量原始數(shù)據(jù)。
劉毅認(rèn)為,對(duì)于像當(dāng)當(dāng)、卓越這樣的B2C網(wǎng)站來(lái)說(shuō),更需要深入進(jìn)行數(shù)據(jù)挖掘工作。一個(gè)類(lèi)似數(shù)據(jù)魔方的報(bào)表只限于日常運(yùn)營(yíng)的需要,想要更深入地了解客戶,使其獲得更好的體驗(yàn),或許還是自己做數(shù)據(jù)挖掘更有用。
數(shù)據(jù)挖掘流程
具體到數(shù)據(jù)挖掘的流程,大致可分為“總體規(guī)劃——數(shù)據(jù)倉(cāng)庫(kù)——數(shù)據(jù)挖掘”的三個(gè)步驟。由于數(shù)據(jù)挖掘人員需要具有不同的知識(shí)結(jié)構(gòu),因此通常一個(gè)數(shù)據(jù)挖掘團(tuán)隊(duì)在5人左右。
首先,由負(fù)責(zé)總體規(guī)劃的人員提出需求,即要做哪些方面的分析。接下來(lái),有專(zhuān)門(mén)的人員負(fù)責(zé)收集來(lái)自不同數(shù)據(jù)源的海量數(shù)據(jù),以統(tǒng)一的形式整合在數(shù)據(jù)倉(cāng)庫(kù)里,同時(shí)設(shè)置多個(gè)維度,形成針對(duì)不同主題的結(jié)構(gòu)化數(shù)據(jù)。
此時(shí),數(shù)據(jù)挖掘人員才開(kāi)始登場(chǎng),根據(jù)對(duì)業(yè)務(wù)的深入理解,在不斷的測(cè)試和計(jì)算過(guò)程中,形成合理的挖掘模型。同時(shí),對(duì)于挖掘得出的結(jié)果,還需要有對(duì)業(yè)務(wù)特別熟悉的人員反復(fù)驗(yàn)證。幾次下來(lái),數(shù)據(jù)模型基本固定,就可以按照例行的周期從數(shù)據(jù)倉(cāng)庫(kù)提取分析數(shù)據(jù),進(jìn)行數(shù)據(jù)挖掘工作了。
例如游戲公司要預(yù)測(cè)哪些玩家會(huì)在下周流失,可在數(shù)據(jù)倉(cāng)庫(kù)中設(shè)置在線情況、充值情況、活動(dòng)參與情況等多個(gè)維度,通過(guò)相應(yīng)算法進(jìn)行挖掘工作。一旦發(fā)現(xiàn)玩家諸如上線時(shí)間變短,或者“打怪”不積極等行為,就會(huì)進(jìn)行標(biāo)記,同時(shí)了解他們對(duì)哪些類(lèi)型的活動(dòng)或任務(wù)感興趣。接下來(lái),運(yùn)營(yíng)部門(mén)會(huì)根據(jù)標(biāo)記向玩家發(fā)送相應(yīng)活動(dòng)信息等,以維持用戶粘性。
而在歐美銀行業(yè)的應(yīng)用中,通常是從客戶的年齡、受教育程度、收入狀況、信用記錄等資料入手,“挖掘”出相應(yīng)的社會(huì)、經(jīng)濟(jì)和消費(fèi)特征,進(jìn)而對(duì)客戶進(jìn)行分群和檔案管理,區(qū)分大眾消費(fèi)群體和高端群體。具體到信用卡用戶分析,還會(huì)考量持卡人用款數(shù)量、用卡頻率、是否按時(shí)還款等因素,進(jìn)而確定發(fā)放信用卡的人群、信用額度、風(fēng)險(xiǎn)及防范等問(wèn)題。
另外,數(shù)據(jù)挖掘結(jié)果還可以整合成為營(yíng)銷(xiāo)策略,在識(shí)別客戶行為優(yōu)化服務(wù),調(diào)整產(chǎn)品以符合客戶需求,以及尋找新客戶等方面,成為企業(yè)決策的好幫手。
多種技術(shù)的應(yīng)用
上述三步流程是一個(gè)相對(duì)比較完整的數(shù)據(jù)挖掘過(guò)程,在要求不高、數(shù)據(jù)量不大的情況下,數(shù)據(jù)挖掘和數(shù)據(jù)分析的結(jié)果差別不是很大,很容易被混淆。
“現(xiàn)在數(shù)據(jù)挖掘的概念炒得很火,但是很多人做的只是針對(duì)數(shù)據(jù)的一個(gè)簡(jiǎn)單統(tǒng)計(jì)分析,按照標(biāo)準(zhǔn)的數(shù)據(jù)挖掘流程去運(yùn)行的公司仍是少數(shù)。”劉毅說(shuō)。
當(dāng)然,要更好地實(shí)現(xiàn)數(shù)據(jù)挖掘的效果,還需要數(shù)據(jù)統(tǒng)計(jì)團(tuán)隊(duì)和調(diào)研團(tuán)隊(duì)的進(jìn)一步配合。在進(jìn)行數(shù)據(jù)挖掘之前,先要統(tǒng)計(jì)分析具體情況。而數(shù)據(jù)挖掘的結(jié)果,有時(shí)候也無(wú)法回答“為什么”這樣的問(wèn)題,解答這些問(wèn)題還需要后續(xù)的調(diào)研工作作為補(bǔ)充。
比如要評(píng)價(jià)某個(gè)活動(dòng)的效果,需要在做數(shù)據(jù)挖掘之前,先由統(tǒng)計(jì)人員分析市場(chǎng)參與度有多大,有怎樣的特征規(guī)律等。而在“挖掘”出不同群體的行為偏好,對(duì)應(yīng)以不同營(yíng)銷(xiāo)手段和個(gè)性化服務(wù)后,還要進(jìn)行跟蹤調(diào)研,通過(guò)問(wèn)卷形式了解活動(dòng)效果,以及何種活動(dòng)愿意參加等問(wèn)題。
數(shù)據(jù)統(tǒng)計(jì)、數(shù)據(jù)挖掘、結(jié)果調(diào)研三者作用疊加,方能構(gòu)成一個(gè)完整的市場(chǎng)調(diào)查鏈條。
在劉毅看來(lái),數(shù)據(jù)挖掘是一種結(jié)合多種專(zhuān)業(yè)技術(shù)的應(yīng)用,但其本身并不能提供因果關(guān)系,只是呈現(xiàn)出某個(gè)結(jié)果,告訴人們發(fā)生這個(gè)行為的概率是多少。
“數(shù)據(jù)挖掘不是一個(gè)無(wú)所不能的魔法。”劉毅表示,“你可以通過(guò)工具從數(shù)據(jù)中發(fā)掘出各種假設(shè),但它并不幫你查證、確認(rèn)這些假設(shè),也不幫你判斷這些假設(shè)對(duì)你的價(jià)值。”
據(jù)了解,目前國(guó)內(nèi)也有專(zhuān)門(mén)從事數(shù)據(jù)挖掘的第三方公司,例如華院分析技術(shù)(上海)有限公司、北京華通人商用信息有限公司等。不過(guò)有研究者認(rèn)為,第三方公司存在對(duì)客戶業(yè)務(wù)理解不深入的問(wèn)題,同時(shí)由于要抽取客戶自己的數(shù)據(jù)進(jìn)行分析,涉及到公司運(yùn)營(yíng)機(jī)密問(wèn)題,很難拿到合適的數(shù)據(jù),所以很多項(xiàng)目到最后的效果并不好。