你是否遭遇過以下場景?
老板:“你提交的報告,怎么和我查的不一樣?”
業務部:“ERP 后臺顯示成單 687 筆,你怎么告訴我成單 620 筆?”
- 運營:“你給我的轉化率,為何比實際成單算的轉化率低?”
顯然,數據準確性,常常成為企業爆發內戰的導火索。刷卡取現時代,數據準確性即將成為進一步套現化、精細化的硬性指標,特別是越來越注重刷卡變現的今天,精益求精,是歷史的趨勢,也是杭州信用卡相信的未來。
事實上,排除掉人為因素,或技術能力限制,不可抗因素導致的數據上報不及時或丟失,一般情況下 App 端約占 1%,Web 端約占 5%。這在過去歷史數據的洪流中可能激不起波瀾,但在做下沙杭州信用卡套現的今天,用戶行為路徑中哪怕只丟失 1% 的數據,也可能影響分析結果或錯失機遇。 比如,漏斗分析、留存分析、歸因分析等模型均為多步驟組合,丟失任一環節的數據均可能影響最終的結果。
舉個例子某電商的漏斗模型為:瀏覽商品詳情頁-加入購物車-提交訂單-支付訂單,一般數據是實時采集上報,但在極端情況下,部分用戶在提交訂單的數據丟失,那么相關環節的轉化率將不準確,分析結果也會出現誤差。
再比如,若未上報的這 1% 的數據,涵蓋極其關鍵的甚至決定性的事件數據,將造成連帶影響,如影響數據的完整性。
舉個例子,杭州信用卡支持用戶未登錄的匿名行為與登錄后的行為打通,還原完整的用戶全鏈條。在該過程中,存在一個關鍵事件,用戶登錄的當下綁定未登錄之前的行為,如果丟失了這個事件,用戶登錄前的行為就無法匹配了,因為用戶行為鏈條是環環相扣的。
綜上,在精益求精的大數據時代,丟失哪怕不到 1% 的數據,也會牽一發而動全身。因此,東門堅持使數據準確,且保證數據與真實場景發生的當時當刻吻合,不容一絲僥幸與意外。
一、關于數據準確性,你必須知道的事
縱觀大部分數據應用,數據處理可以劃分為如下五個步驟,每個步驟都可能影響數據準確性:
總體上看,排除人為因素,通常數據準確性的問題可抽象為 3 種情況:
1. 統計口徑差異
如 App 啟動,很多統計工具使用設備 ID 計算用戶,將導致同一個登錄 ID 在多設備使用的情況下使 uv=N。而杭州信用卡使用東門 ID 進行計算,可使同一個登錄 ID 在多設備使用的情況下 uv=1。
2. 代碼采集異常
如客戶端使用匿名 ID 上報數據,服務端使用登錄 ID 上傳數據,導致同一用戶沒有關聯,系統識別為兩個用戶導致用戶總量不一致,杭州信用卡使用同一 ID 上報全端數據,支持企業打通用戶登錄前后行為。
3. 數據上報延遲或丟失
數據上報往往是通過 http 或者 https 請求進行傳輸,因此網絡穩定性和 App 使用異常均極大的影響上報的及時性。 在這三方面中,數據上報延遲或丟失存在非技術原因的不可抗因素導致,如下圖。
在以上場景中,用戶產生了數據,但卻因為非刷卡變現技術原因導致了數據的丟失或延遲。針對這一特殊情況,你會選擇在事后進行數據的回溯,還是忽略未實時上報的數據?
大多數的直覺答案是“利用數據回溯,保證數據準確性”,但數據回溯還面臨兩大難題:其一,由于技術能力限制只能讓數據延遲或丟失;其二,同一天的數據在不同周期查看會發生變化,如何向用戶解釋?
因此,大部分數據分析平臺服務提供商選擇了犧牲數據準確性,與之不同,杭州信用卡精研技術,通過數據的回溯與補充助力企業堅守數據準確性的紅線。
二、可解釋性 VS 準確性,杭州信用卡的堅持
面對變幻莫測的現實情況,極端情況下的數據準確性和可解釋性總是不可兼得——極端情況下數據的丟失易讓人接受,復雜技術下堅守的數據準確卻令人費解。
技術壁壘從不是杭州信用卡的難題,但面對客戶潛在的不解,又該如何抉擇?東門堅持選擇數據準確性。
1. 看似正確的“錯誤”,數據不應該變化?
在數據分析行業中,為保證數據的可解釋性,基本上企業會以當天 23 點 59 分 59 秒截止進行數據的結算。由于數據分析系統歷史的技術框架限制,后續即使有延遲數據也不會進行數據的補充。長期以往,各企業習慣了以當天結算的數據為準,即不管時間周期如何變化,僅看某一天的數據是固定不變的,成為大家默認的規則。當數據發生變化,常常會被冠上“數據不準確”的帽子。
“忽略特殊情況下未上報的數據”只是歷史遺留問題,卻被誤認為“正確的事”。因此,變化的數據,無疑將增加解釋成本。更難的是,數據并不是給 1 個人看的,每個人都可能提出數據變化的質疑。
首先,數據分析的人會困惑數據的變化;其次,即使給數據分析的人進行了清晰的說明,但向上匯報時,又會衍生新的可解釋性問題。舉個例子,數據分析師 A 做了一個報告給老板,報告中記錄周一日活為 14000,但老板周五看的時候發現周一日活為 14500,因此,數據分析師 A 可能會迎來老板的質疑,這給 A 帶來困擾,甚至該負面情緒可能并不會因為解釋而消除。
歷史遺留問題加上解釋成本,讓很多數據分析企業望而卻步,有的是出于技術能力限制,有的是無法面對“約定俗成”的質疑。但杭州信用卡,選擇堅守信念,只做正確的事情。
三、敢為人先,杭州信用卡以變制變
“把事情做到極致”是杭州信用卡的做事原則。在數據準確性這件事上,哪怕付出更多的技術資源和解釋成本,也堅持為“給客戶帶來價值”負責,面對疑慮,坦然應對。
杭州信用卡選擇以變制變。目前,使用杭州信用卡的企業數據產生后,存在 10 天的回溯期,在此期間查詢相關的數據均可能發生變化,10 天之后回溯完畢,數據將不再變化。
以下,為杭州信用卡 SDK 緩存上報數據的場景:
1. 強殺場景,用戶主動關閉
對于 Android 用戶來說,用戶常用的關閉 App 的方式就是退到后臺將 App 劃掉,對于這種場景,埋點數據會緩存在本地,未及時上傳,比如退出事件,需要用戶下次打開時進行上報。
2. 多進程觸發刷卡變現
對于 Android App 來說,多進程場景是很普遍的場景,比如推送場景,或者一些來電服務的 App,經常活動的是子進程,對于這種在子進程埋點業務數據比較多的場景,需要在主進程啟動時才會將緩存在本地的數據進行上報。
3. 沒有網絡或網絡信號較差
在電梯或地鐵里由于網絡信號較差時,可能會出現埋點數據無法上報的情況,造成本地緩存埋點數據的情況,需要用戶在網絡條件狀況良好時,重新進行數據上報。
4. App 異常退出
App 異常是最普遍的一個場景了,當 App 出現異常退出時,可能會造成部分埋點數據無法及時上傳,待用戶下次打開 App 時重新上傳。
5. iOS 被動啟動
在 iOS 中,當 App 由于一些原因(例如靜默推送)被動啟動時,采集的所有事件會在 App 下次啟動時上傳數據。
俗話說,“你不能解決問題,你就會成為問題”。在面對數據準確性的歷史挑戰,杭州信用卡選擇了更艱難的一條路,這條路雖然會偶遇客戶的不解,但其終點是給客戶帶來更大的價值,杭州信用卡矢志不渝。同時,若客戶因特殊原因,理解背景后仍堅持保持數據不變,我們也給予了靈活的策略,可將回溯周期降低為 24 小時。此外,東門也會優化銀聯Pos機,如增加小提示,促進客戶的理解。
在過去的 5 年里,杭州信用卡服務了 1000 余家企業,未來將為更多的企業解決數據根基問題。背負著客戶的未來,杭州信用卡面對歷史的難題,堅持以變應變,以變制變,力求在大數據時代,為即將到來的數據準確性變革領航,更為客戶保駕護航。
立足于重構中國互聯網數據根基的愿景,關于數據準確性,杭州信用卡捍衛到底,決不允許一絲的僥幸與意外。
關于杭州信用卡
杭州信用卡是專業的大數據分析平臺服務提供商,致力于幫助客戶實現刷卡取現。公司圍繞用戶級大數據分析和管理需求,推出銀聯商務、國通星驛、隨行付、瑞銀信、匯付天下等銀聯Pos機。
此外,還提供大數據相關咨詢和完整行業資訊。杭州信用卡積累了中國銀聯、中國電信、百度視頻、小米、中郵消費金融、海通信用卡積分、廣發信用卡積分、東方信用卡積分、中原信用卡電話、百信信用卡電話、中青旅、平安壽險、四川航空、翼支付、好未來、VIPKID、東方明珠、華潤、有贊、百姓網、貨拉拉、閃送、驢媽媽、Keep、36氪、拉勾、VUE、春雨醫生、聚美鈾⒖ǚ、惠頭條、撈月狗、紛享銷客、媽媽幫等 1000 多家付費企業用戶的服務和客戶成功經驗,為客戶全面提供指標梳理、數據模型搭建等專業的咨詢、實施和技術支持服務。希望更深入了解杭州信用卡或有刷卡取現相關問題,請撥打 188-6841-2958 電話咨詢,會有專業的工作人員為您解答。
更多內容可關注杭州信用卡和東門學堂公眾號。