施曉光
【摘? 要】針對(duì)互聯(lián)網(wǎng)業(yè)務(wù)數(shù)據(jù)量大、用戶畫(huà)像在用戶消費(fèi)行為模型構(gòu)建中使用較少的問(wèn)題,利用用戶畫(huà)像技術(shù),通過(guò)用戶的自然屬性、使用屬性、消費(fèi)行為屬性、充值行為屬性建立用戶畫(huà)像模型。通過(guò)跟蹤單個(gè)用戶ARPU值的變化軌跡,用戶畫(huà)像報(bào)告生成,用戶ARPU的宏觀關(guān)聯(lián)性分析介紹了用戶畫(huà)像模型的使用。通過(guò)高危用戶的挽留實(shí)驗(yàn),從實(shí)踐的角度證實(shí)了模型的用途。此模型的使用有效地反應(yīng)了業(yè)務(wù)的經(jīng)營(yíng)狀況,可以全景展示業(yè)務(wù)視圖,為提升用戶ARPU值提供了策略制定依據(jù)。
【關(guān)鍵詞】用戶畫(huà)像;模型構(gòu)建;關(guān)聯(lián)分析
中圖分類(lèi)號(hào):TN929.5
文獻(xiàn)標(biāo)志碼:A? ? ? 文章編號(hào):1006-1010(2019)04-0070-05
[Abstract]?In view of large amounts of Internet data and few uses of user portrait in user consumption behavior model, the user portrait technology is used to build user portrait model based on natural property, usage attribute, consumption behavior attribute and charge behavior attribute. By tracking the changing trajectory of ARPU value for a single user, the user portrait report is generated. The macro correlation analysis of users ARPU introduces the use of user portrait model. Through the retention experiment of high-risk users, the use of the model is validated from the aspect of practice. The use of the model effectively reflects the operation state of business, comprehensively displays the business view and provides a strategic basis to enhance users ARUPU value.
[Key words]user portrait; modeling; association analysis
1? ?引言
移動(dòng)通信技術(shù)的快速發(fā)展和應(yīng)用不僅提升了用戶使用通信媒體的便利性,也產(chǎn)生了大量的用戶信息,而如何完善這些用戶信息,進(jìn)而根據(jù)用戶的使用規(guī)律有效地配置資源,做到效益最大化是一項(xiàng)迫在眉睫的事情。用戶畫(huà)像作為真實(shí)用戶的虛擬代表,是建立在一系列真實(shí)數(shù)據(jù)之上的用戶模型。關(guān)于用戶畫(huà)像的使用遍布各個(gè)行業(yè)[1],為了對(duì)“知乎”網(wǎng)站PM2.5話題下1 303位用戶進(jìn)行實(shí)證分析,構(gòu)建了基于用戶基本屬性、社交屬性、興趣屬性和能力屬性四個(gè)維度的動(dòng)態(tài)用戶畫(huà)像模型[2]。趙剛等人在入侵檢測(cè)技術(shù)中引入了用戶畫(huà)像技術(shù),提出基于用戶畫(huà)像的入侵檢測(cè)模型,實(shí)現(xiàn)入侵檢測(cè)粒度的細(xì)化,將大數(shù)據(jù)技術(shù)引入網(wǎng)絡(luò)安全領(lǐng)域,發(fā)掘其潛在研究及使用價(jià)值,使入侵檢測(cè)技術(shù)具有大數(shù)據(jù)特性。用戶畫(huà)像在通信領(lǐng)域的應(yīng)用也非常的普遍,尤其是在分析用戶的運(yùn)動(dòng)軌跡方面[3],有顯示移動(dòng)用戶的頻繁活動(dòng)規(guī)律、周期性行為及出行方式的移動(dòng)用戶行為畫(huà)像模型,可用來(lái)分析移動(dòng)用戶群體行為及用戶間交互行為[4]。通過(guò)時(shí)空關(guān)聯(lián)分析的方法提出了一套通信用戶停留分析的方法,分析用戶的軌跡行為。通過(guò)用戶畫(huà)像技術(shù)分析用戶的消費(fèi)行為的模型不是很多。
本文利用用戶畫(huà)像技術(shù),通過(guò)用戶的自然屬性、使用行為屬性消費(fèi)行為屬性、充值行為屬性建立用戶畫(huà)像模型。在跟蹤單個(gè)用戶的ARPU值的變化軌跡,生成用戶畫(huà)像報(bào)告,在用戶ARPU的宏觀性關(guān)聯(lián)性分析方面闡述了此畫(huà)像模型的應(yīng)用,為提升用戶ARPU值提供策略制定依據(jù)。
2? ?用戶畫(huà)像模型構(gòu)建
在本文中,一切研究目的都是圍繞著提升用戶ARPU值,所以建模的目的就是為了發(fā)現(xiàn)各個(gè)屬性對(duì)ARPU值的影響。圖1為本文的建模思路:
整個(gè)用戶畫(huà)像建模思路為:首先整理數(shù)據(jù),并拆分為自然屬性、使用行為屬性、消費(fèi)行為屬性、充值行為屬性四個(gè)數(shù)據(jù)集;然后分別對(duì)每個(gè)數(shù)據(jù)集進(jìn)行定義,構(gòu)建用戶畫(huà)像模型;最后則是介紹此用戶畫(huà)像模型的應(yīng)用。
2.1? 數(shù)據(jù)收集與處理
本文選擇的數(shù)據(jù)集為某電信運(yùn)營(yíng)商近半年線上用戶的消費(fèi)行為數(shù)據(jù)和繳費(fèi)數(shù)據(jù)。此數(shù)據(jù)包含60萬(wàn)用戶5個(gè)月的屬性行為、消費(fèi)行為、繳費(fèi)行為數(shù)據(jù),在數(shù)據(jù)收集的過(guò)程中,根據(jù)數(shù)據(jù)的類(lèi)別進(jìn)行了拆分處理,整理后的數(shù)據(jù)集如圖2所示。
2.2? 用戶畫(huà)像模型構(gòu)建
(1)用戶自然屬性
在本文中,基于用戶數(shù)據(jù)收集成本與隱私的保護(hù),主要考慮了用戶的年齡、性別、所屬區(qū)縣、星級(jí)、受教育程度對(duì)用戶ARPU的影響力,通常受教育程度越高的用戶產(chǎn)生的ARPU會(huì)偏高一些。定義函數(shù)Natu(i)表示用戶i的自然屬性對(duì)用戶ARPU的影響力:
(2)用戶使用行為屬性
本文探討的使用行為屬性包含套餐、時(shí)長(zhǎng)、合約與否。在本文的數(shù)據(jù)集中,用戶的套餐會(huì)有基本的月租費(fèi),用戶ARPU由基本的月租費(fèi)和套餐外收入組成,月租費(fèi)越高,對(duì)應(yīng)的用戶ARPU相應(yīng)也會(huì)增加。在網(wǎng)時(shí)間越長(zhǎng),用戶的使用習(xí)慣會(huì)逐漸形成,用戶的ARPU值便會(huì)趨于一個(gè)穩(wěn)定值。定義函數(shù)App(i)表示用戶i的使用行為屬性對(duì)用戶ARPU的影響力:
其中,Pro(i)表示用戶使用的套餐對(duì)用戶ARPU的影響力;Star(i)表示目前用戶的所屬星級(jí)對(duì)用戶ARPU的影響力;Long(i)表示用戶在網(wǎng)時(shí)長(zhǎng)對(duì)用戶ARPU的影響力;Nat(i)表示用戶目前合約與否對(duì)用戶ARPU的影響力。
(3)用戶消費(fèi)行為屬性
目前用戶使用通信服務(wù),通常體現(xiàn)在用戶撥打電話、發(fā)送短信、使用流量三個(gè)方面。相應(yīng)地,反映出來(lái)的數(shù)據(jù)為語(yǔ)音通話時(shí)長(zhǎng)、短信條數(shù)、流量值。其中語(yǔ)音通話時(shí)長(zhǎng)又分為市話和長(zhǎng)途、來(lái)話與去話;短信分為發(fā)送短信和接收短信;流量的區(qū)分按網(wǎng)絡(luò)制式可分為2G、3G、4G流量,按使用范圍又可分為本地流量和長(zhǎng)途流量等。針對(duì)不同的產(chǎn)品、不同的人群,用戶消費(fèi)行為的側(cè)重點(diǎn)也不一樣,年輕人通常使用流量比較多,老年人則較習(xí)慣撥打電話。在不同時(shí)期,用戶消費(fèi)行為的三個(gè)方面對(duì)用戶ARPU值的影響比重又有變化。前幾年用戶移動(dòng)端上網(wǎng)沒(méi)有完全普及的時(shí)候,用戶使用短信和通話對(duì)用戶ARPU的影響比較大,現(xiàn)在則是流量對(duì)用戶ARPU的影響比較大。本文定義了函數(shù)Con(i)表示用戶i的消費(fèi)行為屬性對(duì)用戶ARPU的影響力:
(4)用戶充值行為屬性
用戶的充值行為與用戶的ARPU是相輔相成的,用戶ARPU值越大,用戶的充值行為則越頻繁,充值金額則越大;用戶的充值屬性越明顯,用戶則越穩(wěn)定,則越容易成為穩(wěn)定客戶。在本文中,我們著重考慮用戶的充值行為對(duì)用戶ARPU的影響。定義了函數(shù)Pay(i)表示用戶i的充值行為屬性對(duì)用戶ARPU的影響力:
3? ?用戶畫(huà)像模型應(yīng)用
本文構(gòu)建的用戶畫(huà)像模型包含了與用戶ARPU值直接關(guān)聯(lián)的各種屬性,同時(shí)數(shù)據(jù)集的體量也是非常大的,包含了60萬(wàn)線上用戶的屬性信息。這對(duì)于充分發(fā)掘此畫(huà)像模型的應(yīng)用提供了強(qiáng)有力的基礎(chǔ)。在本文中,從單個(gè)用戶ARPU的變化規(guī)律、用戶畫(huà)像報(bào)告和用戶ARPU的宏觀性關(guān)聯(lián)分析方面介紹此用戶畫(huà)像模型的應(yīng)用。
3.1? 單個(gè)用戶的ARPU變化規(guī)律
企業(yè)整體的收入是由單個(gè)用戶產(chǎn)生的收入累加起來(lái)的,所以分析好每一個(gè)用戶的ARPU值變化則顯得尤為重要。本文選擇了某一個(gè)用戶近五個(gè)月的ARPU值與消費(fèi)行為數(shù)據(jù)進(jìn)行舉例闡述,如表1所示:
從表1、圖3、圖4可以看出,用戶的套餐月租費(fèi)遠(yuǎn)小于用戶的ARPU,這表明用戶目前的套餐不適于用戶的使用方式;ARPU值和流量的下降,則表明用戶有離網(wǎng)的傾向。綜上,需要協(xié)助用戶選擇合適的套餐,做好用戶的挽留工作。
3.2? 用戶畫(huà)像報(bào)告
用戶畫(huà)像報(bào)告對(duì)用戶進(jìn)行全景視圖展示,本文可以從各個(gè)視角進(jìn)行用戶畫(huà)像報(bào)告,比如年齡、性別、區(qū)局、套餐等。現(xiàn)在從用戶ARPU值高于平均ARPU和低于平均ARPU的角度來(lái)介紹用戶畫(huà)像模型的使用。圖5和圖6展示了高于平均ARPU和低于ARPU的組成情況。
3.3? 用戶ARPU的宏觀性關(guān)聯(lián)分析
從圖7至圖9可以看出,用戶近5個(gè)月的收入呈現(xiàn)上升的變化趨勢(shì),用戶的收入增加由新增用戶的收入和存量用戶的收入組成。新增收入在201804賬期呈現(xiàn)了下降趨勢(shì),而存量收入在201804賬期上升明顯。由此可見(jiàn),用戶收入的上升是由存量用戶的收入增加引起的,這表明存量用戶的維系工作做的比較到位,而新增用戶的發(fā)展則需要加強(qiáng)。
4? ?實(shí)驗(yàn)結(jié)果
利用本文構(gòu)建的用戶畫(huà)像模型,提取了1 025條高危用戶,本文定義的高危用戶指的是連續(xù)三個(gè)月用戶ARPU值都持續(xù)下降,并且流量、語(yǔ)音、短信使用很少的用戶。圖10為本批用戶的年齡分布:
不同年齡段的用戶有不同的使用習(xí)慣與需求,通過(guò)圖10可以看出,用戶著重分布在30歲以下,這也說(shuō)明30歲以下的年輕人更容易流失。所以本文制定策略時(shí)著重考慮年輕人,依據(jù)目前年輕人都比較喜歡玩網(wǎng)游的特點(diǎn),采用微信推廣與短信通知的方式推薦用戶參加公司的“充值送流量”活動(dòng)。策略實(shí)施后的平均ARPU變化如圖12所示:
5? ?結(jié)束語(yǔ)
移動(dòng)通信技術(shù)的迅猛發(fā)展產(chǎn)生了大量的用戶數(shù)據(jù),如何從大量的數(shù)據(jù)中提取有益于提高效益的信息是非常重要的。本文利用用戶畫(huà)像技術(shù),從用戶自然屬性、使用行為屬性、消費(fèi)行為屬性和充值行為屬性方面構(gòu)建了用戶畫(huà)像模型,并從單個(gè)用戶的ARPU變化規(guī)律、用戶畫(huà)像報(bào)告和用戶ARPU的宏觀性關(guān)聯(lián)分析方面探討了用戶畫(huà)像模型的使用。通過(guò)高危用戶的挽留實(shí)驗(yàn),從實(shí)踐的角度證實(shí)了模型的用途。此模型的使用直觀明了地反映了用戶的全景視圖及收入變化的原因,為企業(yè)制定決策提供了依據(jù)。
參考文獻(xiàn):
[1] 陳志明,胡震云. UGC網(wǎng)站用戶畫(huà)像研究[J]. 計(jì)算機(jī)系統(tǒng)應(yīng)用, 2017(26): 24-25.
[2] 趙剛,姚興仁. 基于用戶畫(huà)像的異常行為檢測(cè)模型[J]. 技術(shù)研究, 2017(7): 18-24.
[3] 黃文彬,徐山川,吳家輝,等. 移動(dòng)用戶畫(huà)像構(gòu)建研究[J]. 現(xiàn)代情報(bào), 2016(10): 54-61.
[4] 席巖,張乃亮,王磊,等. 基于大數(shù)據(jù)的用戶畫(huà)像方法研究[J]. ICTC, 2017(10): 37-41.
[5] 馬亮,陶利濤,謝駿凱. 基于客戶畫(huà)像的客戶訴求管理[J]. 電力需求側(cè)管理, 2016(10): 98-100.
[6] 王憲朋. 基于視頻大數(shù)據(jù)的用戶畫(huà)像構(gòu)建[J]. 網(wǎng)絡(luò)與融合, 2017(4): 20-21.
[7] 裴國(guó)才. 基于用戶畫(huà)像的電信精準(zhǔn)營(yíng)銷(xiāo)模型研究[J]. 信息通信, 2017(12): 240-243.
[8] 何雪海,黃明浩,宋飛. 網(wǎng)絡(luò)安全用戶行為畫(huà)像方案設(shè)計(jì)[J]. 通信技術(shù), 2017(4): 789-794.
[9] 陳秀敏,許向東,黃毅華,等. 基于數(shù)據(jù)挖掘的4G用戶投訴預(yù)測(cè)[J]. 移動(dòng)通信, 2017(12): 32-34.
[10] 齊帥,單桂華,田東,等. 基于基站數(shù)據(jù)挖掘個(gè)人駐留規(guī)律[J]. 計(jì)算機(jī)系統(tǒng)應(yīng)用, 2017(6): 176-180.