騰訊信鴿大數(shù)據(jù):移動(dòng)游戲流失用戶(hù)預(yù)測(cè)
2015-06-12 17:57:19來(lái)源:優(yōu)游網(wǎng)發(fā)布:優(yōu)游網(wǎng)
隨著游戲市場(chǎng)競(jìng)爭(zhēng)的日趨激烈,越來(lái)越多的游戲運(yùn)營(yíng)服務(wù)選擇借助大數(shù)據(jù)挖掘出更多更細(xì)的用戶(hù)群來(lái)進(jìn)行精細(xì)化,個(gè)性化運(yùn)營(yíng),從而更好的抓住用戶(hù),獲得更大的收益。在游戲運(yùn)營(yíng)中,無(wú)論是流失挽留,還是拉新,以及付費(fèi)用戶(hù)預(yù)測(cè)都是游戲運(yùn)營(yíng)的重要內(nèi)容。
本文將著重介紹手游用戶(hù)的流失預(yù)測(cè)。對(duì)于游戲運(yùn)營(yíng)者,如果能夠盡早的發(fā)現(xiàn)可能流失的用戶(hù),盡早的有針對(duì)性的對(duì)這些用戶(hù)進(jìn)行適當(dāng)?shù)母深A(yù),從而最大限度的延長(zhǎng)用戶(hù)在游戲中的停留時(shí)間,使得游戲運(yùn)營(yíng)者獲得更大的收益。
本文中介紹的手游流失預(yù)測(cè)主要依托于騰訊信鴿這個(gè)平臺(tái),為這個(gè)平臺(tái)提供精準(zhǔn)定位即將流失用戶(hù)的功能。騰訊信鴿是專(zhuān)業(yè)的移動(dòng)應(yīng)用推送平臺(tái),支持百億級(jí)的通知/消息秒級(jí)觸達(dá)移動(dòng)用戶(hù)。開(kāi)發(fā)者可以方便地通過(guò)嵌入SDK,通過(guò)API調(diào)用或者Web端可視化操作,實(shí)現(xiàn)對(duì)特定用戶(hù)發(fā)送通知/消息,提升用戶(hù)活躍度,挽回潛在流失用戶(hù),并實(shí)時(shí)查看推送效果。我們?cè)谶@三面都有深入研究,取得了不錯(cuò)的效果。
需求的挑戰(zhàn)
1.海量的用戶(hù)行為
目前該套流失預(yù)測(cè)系統(tǒng),每天最高時(shí)承接著480億條上報(bào)的用戶(hù)行為記錄。
2.海量的用戶(hù)
在已經(jīng)接入的游戲中,每天活躍著一億左右的用戶(hù)。
3.模型的通用性
流失預(yù)測(cè)的實(shí)際應(yīng)用中,不僅僅包含了公司內(nèi)的游戲,還有公司外的游戲,以及各種各樣的應(yīng)用。每個(gè)應(yīng)用上報(bào)的自定義事件更是各不相同,但算法還要統(tǒng)一接入。
4.應(yīng)用接入壓力
目前實(shí)際已經(jīng)介入100多款公司內(nèi)游戲應(yīng)用,幾乎囊括了公司內(nèi)大部分主力手機(jī)游戲,包括《天天炫斗》,《天天德州》等。
鑒于上述的挑戰(zhàn)性,結(jié)合了騰訊大數(shù)據(jù)精準(zhǔn)推薦平臺(tái)以“數(shù)據(jù)+算法+系統(tǒng)”的3方面打法,我們針對(duì)手游也總結(jié)了一套通用的業(yè)務(wù)流失預(yù)測(cè)模型。
系統(tǒng)–TRC平臺(tái)
TRC的全稱(chēng)是Tencent Real-time Computing,是大數(shù)據(jù)精準(zhǔn)推薦平臺(tái)專(zhuān)為海量數(shù)據(jù)實(shí)時(shí)處理而構(gòu)建的提供基礎(chǔ)計(jì)算能力的服務(wù)平臺(tái),從全流程的實(shí)時(shí)計(jì)算體系的角度看,整個(gè)TRC由核心的平臺(tái)支撐層和擴(kuò)展的平臺(tái)應(yīng)用層構(gòu)成。
平臺(tái)支撐層主要包括實(shí)時(shí)數(shù)據(jù)接入、實(shí)時(shí)數(shù)據(jù)處理、實(shí)時(shí)數(shù)據(jù)存儲(chǔ);平臺(tái)應(yīng)用層主要包括實(shí)時(shí)算法預(yù)測(cè),實(shí)時(shí)模型訓(xùn)練,實(shí)時(shí)效果統(tǒng)計(jì),實(shí)時(shí)系統(tǒng)監(jiān)控實(shí)時(shí)數(shù)據(jù)展示。總體結(jié)構(gòu)如所示:
TRC平臺(tái)經(jīng)過(guò)兩年多的現(xiàn)網(wǎng)運(yùn)營(yíng),已經(jīng)逐步成熟穩(wěn)定,該平臺(tái)每天支撐公司2,000多億實(shí)時(shí)數(shù)據(jù)接入,每天26,000多億次實(shí)時(shí)計(jì)算,每天5,000多億次數(shù)據(jù)訪問(wèn),已經(jīng)在廣點(diǎn)通廣告推薦,電商物品推薦,視頻推薦,新聞推薦,微信業(yè)務(wù)性能監(jiān)控并實(shí)時(shí)統(tǒng)計(jì)等產(chǎn)品中大規(guī)模使用。
數(shù)據(jù)
在機(jī)器學(xué)習(xí),算法建模中,數(shù)據(jù)是輸入,也是起點(diǎn)。數(shù)據(jù)的質(zhì)量的高低,優(yōu)劣,將直接影響著最終的算法效果。對(duì)于數(shù)據(jù)的研究和分析,往往耗費(fèi)了研究者大量的時(shí)間和精力。
在流失預(yù)測(cè)模型運(yùn)用到的數(shù)據(jù)中,存在著優(yōu)勢(shì)和劣勢(shì)。
優(yōu)勢(shì)是數(shù)據(jù)量大,每天高達(dá)百億級(jí)別的用戶(hù)行為記錄,日活躍一億左右用戶(hù)。并且有著豐富的用戶(hù)行為。比如,登錄,打怪,升級(jí),加血,得分,領(lǐng)取金幣等,還有著更為豐富的各個(gè)游戲,應(yīng)用的自定義事件。
劣勢(shì)也非常明顯。雖然行為豐富,但是每個(gè)應(yīng)用上報(bào)的具體數(shù)據(jù)內(nèi)容無(wú)法規(guī)范統(tǒng)一,特別是自定義事件更無(wú)法控制,同時(shí),還要達(dá)到無(wú)論是公司內(nèi)部手游,外部手游,還是各類(lèi)應(yīng)用都要模型通用,只能從這眾多豐富的數(shù)據(jù)中抽取它們共性的且有效的特征。
在本算法中,考慮到,通用性,有效性,并且易拓展性,具體抽取的特征有:登錄天數(shù),登錄頻次,最后登錄時(shí)間,登錄時(shí)長(zhǎng),等級(jí)等特征。
算法
在本次流失預(yù)測(cè)的建模中,采用了LR模型。在這里簡(jiǎn)單介紹一下LR模型。Logisticregression(邏輯回歸)是當(dāng)前業(yè)界比較常用的機(jī)器學(xué)習(xí)方法,用于估計(jì)某種事物的可能性。比如某用戶(hù)購(gòu)買(mǎi)某商品的可能性,某病人患有某種疾病的可能性,以及某廣告被用戶(hù)點(diǎn)擊的可能性等。
Logistic回歸為概率型回歸模型,是研究分類(lèi)觀察結(jié)果y與一些影響因素x(單變量,多變量都可以)之間關(guān)系的一種分析方法。
在流失預(yù)測(cè)模型中,具體輸入的用戶(hù)特征為登錄天數(shù),登錄頻次,最后登錄時(shí)間,登錄時(shí)長(zhǎng),目前等級(jí)等特征,輸出為用戶(hù)的流失可能性。同時(shí),通過(guò)算法的結(jié)果的準(zhǔn)確率,和召回率來(lái)評(píng)價(jià)算法效果。
流失預(yù)測(cè)的整體流程如所示,從公司內(nèi)外部游戲以及各類(lèi)應(yīng)用中抽取各類(lèi)用戶(hù),日常的登錄天數(shù),登錄頻次,最后登錄時(shí)間等特征,以及最后的流失狀況,來(lái)訓(xùn)練LR模型。然后根據(jù)每天用戶(hù)相應(yīng)特征,使用訓(xùn)練好的模型來(lái)進(jìn)行預(yù)測(cè),得到最可能流失的用戶(hù)。
算法效果
基于玩家的在線時(shí)長(zhǎng),使用頻率等特征,建立流失用戶(hù)預(yù)測(cè)模型,精準(zhǔn)預(yù)測(cè)潛在流失用戶(hù)。在公司外游戲《美人國(guó)》的ABTest中,預(yù)測(cè)覆蓋率超過(guò)85%,準(zhǔn)確率超過(guò)91%。利用信鴿對(duì)該用戶(hù)群推送針對(duì)性的營(yíng)銷(xiāo)活動(dòng),回流率比隨機(jī)推送提升120%。
在騰訊內(nèi)部XX游戲的ABTest中,我們的算法的預(yù)測(cè)覆蓋率達(dá)到79.847%,準(zhǔn)確率達(dá)到85.646%。利用信鴿對(duì)該用戶(hù)群推送針對(duì)性的營(yíng)銷(xiāo)活動(dòng),回流率比隨機(jī)推送提升326%。通過(guò)實(shí)踐證明:充分利用大數(shù)據(jù)的優(yōu)勢(shì),幫助游戲大幅提升玩家留存率,同時(shí)減少對(duì)玩家的騷擾,保障用戶(hù)體驗(yàn)。
游戲市場(chǎng)的競(jìng)爭(zhēng)日趨激烈,新游戲產(chǎn)品增速逐漸放緩,越來(lái)越多的游戲運(yùn)營(yíng)開(kāi)始借助于大數(shù)據(jù),機(jī)器學(xué)習(xí),來(lái)挖掘出更多更細(xì)的用戶(hù)群,從而更有針對(duì)性的進(jìn)行運(yùn)營(yíng)活動(dòng),能夠幫助游戲大幅提升玩家留存率,減少對(duì)玩家的騷擾,保障良好的用戶(hù)體驗(yàn)。
相關(guān)閱讀
- 06-12 ·定義參考:游戲該如何統(tǒng)計(jì)數(shù)據(jù)?
- 06-12 ·手游運(yùn)營(yíng)流程問(wèn)題及各階段注意事項(xiàng)分析
- 06-12 ·手游圈子:如何從零開(kāi)始學(xué)習(xí)手機(jī)游戲的運(yùn)營(yíng)?
- 06-12 ·有關(guān)運(yùn)營(yíng)的實(shí)話(huà):產(chǎn)品很苦逼,運(yùn)營(yíng)更苦逼!
- 06-12 ·從開(kāi)發(fā)到運(yùn)營(yíng),需要“盯緊”的數(shù)據(jù)有哪些?
- 06-12 ·KONAMI Q1財(cái)報(bào):家用機(jī)和手機(jī)游戲運(yùn)營(yíng)良好是收入上漲主因
- 06-12 ·免費(fèi)OR收費(fèi)?國(guó)產(chǎn)游戲運(yùn)營(yíng)商給出第三種答案
- 06-12 ·專(zhuān)訪DataEye VP 宋暢:專(zhuān)注運(yùn)營(yíng)與數(shù)據(jù)分析
- 06-12 ·網(wǎng)易CEO丁磊將現(xiàn)身MGS移動(dòng)游戲大會(huì)講解游戲運(yùn)營(yíng)之道
- 06-12 ·剛接觸手游或初運(yùn)營(yíng)從業(yè)人員必備攻略