大数据如何预测上市公司的业绩?
PMCAFF(www.pmcaff.com):最大互聯網產品社區,是百度,騰訊,阿里等產品經理的學習交流平臺。定期出品深度產品觀察,互聯產品研究首選。
近日PMCAFF產品社區聯合 Advance AI 舉辦了大咖分享會活動,本期活動邀請了Advance AI 創始人&CEO陳斕杰、閃銀合伙人壽棟、宜信大數據創新中心姨搜技術負責人侯松、京東數據羅盤產品負責人陳宣武以及百觀Lab創始人陳沐五位嘉賓,他們分享了關于大數據風控和產品應用的那些事兒。以下為分享實錄:
Advance AI 創始人&CEO陳斕杰,以下簡稱杰
▍您對Fintech(金融科技)行業有什么看法?
杰:Fintech和互聯網金融有一定的區別。在我看來互聯網金融更多解決的是連接問題,包括大家講的P2P。但是金融本質上在于資源的有效配置,歸根到底是要以價值為導向去決定很多要素和流動性分配的問題。
金融科技在上市的每一個子領域里都有不同的應用場景。舉兩個簡單的例子,第一個是量化,其實就是股權或者債權類二級交易市場里用機器方式快速抓取波動因素,然后看歷史上之前發生的事件和金融資產定價間的邏輯關系,再用這個邏輯對新生的事件做判斷,然后產生一個超額的交易。
第二個例子是消費信貸。消費信貸里科技主要被用作對用戶進行一個很細致的畫像。但過去的定價落后遲鈍并且不準確,因為過去幾年電商和O2O發展可以為中國的用戶把自己各方面的真實的情況反饋到一個集中盆地點,使得這件事情發生了顛覆。
大數據和不同消費場景的出現給新的金融公司創造了機會,能夠在互聯網的平臺之上實現一個高速、準確的資產的定價。因此我的觀點是今天的Fintech是互聯網金融的2.0甚至3.0時代,而且浪潮會繼續往前走,更多數據的出現能夠對Fintech行業產生促進作用。
▍為什么選擇東南亞市場作為切入點?
杰:宏觀來講金融市場的發展是由流動性來決定的。如今全球的流動性是美元區在經過08、09年金融危機以后長期保持零利率,甚至像日本出現負利率之后,慢慢進入正態化的一個階段。像東南亞這種地方的利率環境會有快速上漲,而且它的波動會高于在美國本土市場的波動性。
選擇東南亞市場一方面是因為利率上升導致東南亞市場上利率環境對于提供錢的人來講更有吸引力,另一方面因為基礎設施的落后導致套利空間相當巨大,這兩個因素疊加的結果讓我們覺得是一個很好的時間節點。
▍在遙遠陌生的環境里怎么尋找一個市場的機會?
杰:看一個金融市場的大小,一方面在于人口多少,另一方面看利率環境。如果大家都在做一個市場的時候,你會發現利率環境越多人和資本涌進,利率是下降的。P2P做的一件很重要的事情是把中國從建國以來長期存在的,就是對利率本身的管制做了一個變相突破,解決了監管方面的問題。
在很多非社會主義國家你要認識到其實銀行是一個逐利性特別強的機構,在東南亞這樣的國土上,那些地方銀行沒有能力布點。反過來給我們創造機會,你可能真正做成支付寶在中國的地位。我們最近在那邊投資了一家公司,是那邊的滴滴+美團+支付寶,聽上去很神奇。因為在印尼交通很糟糕,而摩托車可以送人、送貨、送外賣、快遞,甚至還可以到家服務。所以一個摩托車平臺在那邊成為了最大的O2O平臺,然后現在也在逐步推進支付業務。
仔細思考你會發現它整個市場雖然總量沒那么大,但是橫切的子領域非常長非常多,整個鏈條吃下來利潤是遠遠大于中國市場現存的機會的。
閃銀合伙人 壽棟,以下簡稱棟。
▍東南亞的金融市場環境如何?
棟:印尼有2.6億人口,70%的人沒有銀行帳戶,信用卡大概只有300萬張,當然里面還有一些重復的,平均算下來也是非常非常小的滲透率。印尼整個征信其實也是非常原始的,因為真正在央行有征信的人口的比率是非常小的。再加上它本身信用卡滲透率又那么低,所以它在央行有合法的征信的比率就更低了。
▍征信的方式在東南亞市場是否可行?存在哪些問題?
棟:閃銀在中國通過征信的方式切入市場,這套商業模式理論上講是可以復制到印尼的。但是印尼也有很大的問題,主要是數據很少。印尼的電商也有,但是它們出生比較晚,可以理解為現在在階段上來講就是03、04年的時候,印尼電商從人口上來講可能只有900萬左右。
印尼整個支付環境也是非常原始,很多人都采用貨到付款的方式。物流環境也比較糟糕,因為印尼一萬多個島嶼,很多島之間只能通過坐船的方式才能到,某種程度上限制了電商的發展。
但同時它的潛力也是非常大的。因為整體來講印尼的年輕人口比例比中國大很多。印尼差不多30歲以下的人口占到50%以上。而越南因為戰爭的原因所以導致年輕人占60%以上的人口,這整體來講是很好的市場,年輕人更容易接受新的事物,包括貸款、社交網絡等等,不管越南還是印尼市場大家都很喜歡玩社交網絡,像臉書網在越南和印尼的市場占有率都非常高。
宜信大數據創新中心姨搜技術負責人侯松,以下簡稱松
▍如何理解大數據風控?
松:關于如何理解風控。首先是信貸產品一般大概可以分成五個部分,產品設計、市場營銷、風控策略、客戶管理、客戶服務。風控是比較核心的地位,保證了產品核心資產的安全,但是它并不是一個獨立的,它和其他部分都有非常緊密的聯系。產品設計和市場營銷決定什么人能進來,人群又決定我們用什么樣的風控策略,另外我們還需要把風控策略的結果或者邏輯簡要地和客戶進行溝通。風控策略最主要的部分就是中間的預測模型,它來自于我們對數據對平臺的理解。
▍基于數據如何做風控?
松:我們知道風險來自于哪才能嘗試用數據找到風險。風險包括欺詐風險和信用風險。欺詐風險又分為第三方欺詐和主動賴帳。信用風險包括財務收入、支出管理、不良嗜好。
我們會通過數據嘗試找出個人的風險點在哪。比如個人信貸有一個特點就是它是數量非常多,申請多而且分散,人群復雜額度也非常小。這個特點就決定我們可以用統計模型對這部分人進行分析。
定性整理+定量分析。一般情況下我們是無法直接用裸數據的,需要拼裝出合適的特征變量才能制作模型。比如說信用卡,信用卡的每一條記錄有時間、地點和金額。這些數據不太好直接使用,我們需要進行一些梳理,把它加工成變量,然后還可以進行簡單特征變量的組合。到底哪些特征變量是有用的,目前來看沒有特別理想的方式。更多時候是與大家對一個數據的理解和認識有關。一般來說都需要長時間的積累才會對數據有比較好的感知。
最后就可以根據數據建立模型應用,一般會使用各種復雜的機器學習算法來建立。
▍大數據風控應用在哪些真實場景中?
松:第一個是小額短期的借貸場景,第二個是審核流程的拆分創新。這兩個案例在我們公司里面都是兩個真實的產品,并不是我虛構出來的。
小額短期借貸場景:這個產品的特點就是額度特別小,一千或者兩三千。它的期限特別短,只有30天或者半個月,或者更短的是一周。然后時效性強,有時甚至是一個小時以內就需要錢,過了一兩個小時可能就不要了。
審核流程的拆分創新:傳統的做法是,收集各種資料結束后直接告訴客戶是批了還是拒了。我們所做的創新是把流程拆分開。客戶可以先提供手機號、身份證、銀行卡號之類,我們可以進行一次審批,看審批結果什么樣,如果是特別好的可能就通過了。如果說不行,還有第二步,第二步可以提供淘寶交易記錄,可以用一個包含淘寶交易記錄的模型再審一次,看得出來結果是什么樣。還是不行的話還有其他各種類型的資料。這樣可以給用戶更多的選擇空間,并且能夠更快地完成審核,提高了用戶體驗。
▍大數據風控的未來在哪兒?
松:我對大數據風控的未來有以下幾點看法
一、由降低風險,到控制風險,再到利潤最大化。信貸的獲客成本是比較大的,不同的渠道風險不一樣成本也不一樣,所以可以通過對于不同渠道或者不同來源的客戶進行不同級別的風險定義,來達到每一個渠道,或者說整體的利潤的最大化。
二、更加自動化、系統化和體系化
三、對不同數據的價值的理解和使用方法進一步細化。過去幾年互聯網金融或者更細得說互聯網借貸對各種各樣的數據的使用越來越多了,接下來這個路線肯定會走下去,使用場景會進一步細化,對價值的判斷會更準確。
四、數據的價值其實并不僅限于貸款中審批的管理,其實可以前移或者后移,會在獲客、預審批、貸后管理、失聯修復等環節起到作用。
京東數據羅盤產品負責人陳宣武,以下簡稱武
▍電商平臺的商家如何去做風險控制?
武:關于電商的庫存、備貨我們是有一些小技巧去控制的。
做一個生產計劃的時候我們會定一個生產目標。首先我們先在數據系統里獲取行業的銷售占比,這個數據其實可以跟自身店鋪的結合起來去用。我這里做得比較簡單,就是做了一個平均,我們得出這個計劃銷售占比就能計算出每個類目是怎樣的銷售目標。
第二種方法就是購物車數據,商家可以拿加購件數來預測自己在某個倉要備多少貨。購物車里面的轉化率是非常高的,像有一些類目甚至可以達到80%左右,所以當商家知道我們的購物車里邊有這么多商品,他的商品有被這么多人添加了購物車,他就可以拿這個預算未來銷售應該是多少。像京東平臺一些比較大的商家,像小狗電器等等都會通過這個數據去看我應該在接下來幾天內把貨備到哪個倉里,這是非常簡單的小技巧。
下一個方法是上新。上新品其實風險挺大,如果我們上得快了我們需要投入推廣成本多,如果某一些新品推廣不是太好極有可能產生積壓,可能會對銷售有所影響。如果上新慢會缺少刺激點,難留老客戶。
我們會根據復購數據(復購率、復購周期)來控制上新風險。第一個是上新之前,根據訪客的峰值時間點提前把貨安排到各個倉里。第二個預測上新時間,1號到7號、7號到15號,每個時間段究竟應該上新多少件,應該上新多少新款。第三個就是上新的時候考慮區域的分布。比如說服裝是受季節性影響特別大的,南方可能比較早進入夏季,像北邊通常冷的時間會持續長一些,通常我們做上新的時候就會優先部署,這樣一個是上新有節奏,另外一個是可以減少物流方面的成本。
百觀Lab創始人陳沐,以下簡稱沐
▍如何通過大數據分析預測上市公司的業績?
沐:針對電商數據的做法是從網頁端把銷售量抓下來,單筆銷售量抓下來之后,全站收入所有的商品,每一個站數據抓下來,基本上就可以檢測到他的流水。我們就實時檢測流水,上市公司是每個季度發表它的業績的,所以我們可以提前兩三周的時候就可以預測到這個上市公司的業績狀況。
另外我們做一點社交媒體,比如推特網等等,國內就是微博。我們可以通過分發渠道抓取數據來預測業績。像支撐新浪估值支撐的KPI就是日活、月活,另外還有廣告賣了多少,它的CPA、CPM是什么。這樣就可以知道怎么算新浪的估值。
再比如攜程,可以抓取它每一個酒店上一次訂單的時間,通過這個可以知道每個酒店的訂單頻率,進而推算出每個酒店一個月之內,一個季度之內的定單量是多少,然后再看轉化率就大概知道這個酒店的營業狀況是什么樣,一個季度是什么樣的。本質上就是把它的訂單付費單量抓下來之后做一些模型來測算出它整個線上線下合起來的訂單量。
本文由PMCAFF產品社區(www.pmcaff.com)原創發布,未經許可,禁止轉載。
▲點擊圖片閱讀
薪資漲幅60%,直通一線互聯網公司的秘密......
▲點擊圖片閱讀
18億用戶、10萬條電源線、4200萬月活......創業者的底限究竟在哪里?
▲點擊圖片閱讀
網貸新規“13禁”,平臺洗牌剩10家?
總結
以上是生活随笔為你收集整理的大数据如何预测上市公司的业绩?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 18亿用户、10万条电源线、4200万月
- 下一篇: 一款让你“乐词不疲”的背单词神器