数据要素市场的组织形式和估值框架
點擊上方藍字關注我們
數據要素市場的組織形式和估值框架
鄒傳偉
上海萬向區塊鏈股份公司,上海 200085
?摘要:數據要素市場的組織形式和估值框架是當前政府管理和行業發展需要回答的兩個重要問題。針對這兩個問題,提出不是只有所有權清晰的數據要素才能參與市場配置,數據要素事實上的控制權更為重要;然后分析了數據要素市場與金融系統之間存在的同構關系,并從金融系統的組織形式推測數據要素市場的組織形式;最后提出數據要素估值框架DataRank,以有效反映數據要素價值的主觀性、時變性和外部性等特點。
關鍵詞:?數據要素?;?產權界定?;?有效配置?;?組織形式?;?數據估值
論文引用格式:
鄒傳偉. 數據要素市場的組織形式和估值框架[J]. 大數據, 2021, 7(4): 28-36.
ZOU C W. Organizational forms and valuation framework of data factor market[J]. Big Data Research, 2021, 7(4): 28-36.
1 引言
2020年4月,中共中央、國務院發布《關于構建更加完善的要素市場化配置體制機制的意見》,提出加快培育數據要素市場。2021年3月,北京國際大數據交易所成立?!秱€人信息保護法(草案)》和《數據安全法》分別于2020年10月和2021年6月公布。數據要素的有效配置是數字經濟發展的關鍵,也是理解個人隱私保護、互聯網平臺競爭、大型科技企業監管和金融科技發展的關鍵,對于AI發展也至關重要。數據要素市場應采取什么樣的組織形式?數據要素適用什么樣的估值框架?這是當前政府管理和行業發展中迫切需要回答的兩個重要問題。
在數據要素市場的組織形式方面,戴炳榮等人提出了數據資產的標準化思路以及數據資產管理的通用過程框架;葉雅珍等人研究了數據資產的特點和需具備的條件,提出了數據資產化基本框架,包括數據資源確權、數據價值確認與質量管控、數據裝盒入庫、貨幣計價與評估、數據資產折舊和增值的管理5個步驟;英國開放數據研究所(Open Data Institute,ODI)提出了數據信托的概念;汪靖偉等人提出了基于區塊鏈的數據市場框架,基于該框架實現了一個數據市場測試系統,并證實了該框架的可行性和安全性。在數據要素的估值框架方面,上海德勤資產評估有限公司和阿里研究院,以及Bennett Institute for Public Policy]分別綜述了數據要素估值的主要方法,包括成本法、收入法、市場法和問卷測試法等,但他們認為這些方法都有缺陷;董祥千等人提出了基于利潤最大化的數據資產價值評估模型,為參與者進入市場提供了理論參考依據。在數據要素市場的發展政策方面,于施洋等人分析了我國深化數據要素市場化配置面臨的挑戰;國家工業信息安全發展研究中心提出了數據要素及數據要素市場的邊界,梳理了國內外數據要素市場的發展現狀。
2 數據要素產權界定和有效配置
產權是一個基本的經濟學概念。產權指一種可執行的社會架構,該架構決定經濟資源如何被使用或擁有,包括:第一,使用經濟資源的權利;第二,從經濟資源中獲得收益的權利;第三,將經濟資源轉移給他人、改變經濟資源、放棄經濟資源,以及損毀經濟資源的權利。產權可以細分為所有權、占有權、支配權、使用權、收益權和處置權等“權利束”。Mas-Colell A等人指出,產權界定是任何要素有效配置的前提。
然而,因為數據要素的特殊屬性,數據要素產權界定的難度大于其他生產要素。Mas-Colell A等人從兩個維度對不同產品提出了分類標準。第一個維度是非競爭性,指在一個人消費某種產品時,不會減少其他人對該產品的消費。第二個維度是非排他性,指在一個人付費消費某種產品時,不能排除其他沒有付費的人消費這一產品,或者排除成本很高。按照這個分類,很多數據具有非競爭性和非排他性,屬于公共產品,可以由任何人為任何目的而自由使用、改造和分享。一些數據具有非競爭性和排他性,屬于準公共產品,比如收費媒體信息終端。只有很少的數據像一般產品那樣具有競爭性和排他性。
在實踐中,產權界定是法律和技術共同作用下的產物,一般先由法律確定產權的制度框架,再由技術來保證這些制度框架的可執行性。例如,股東權益由公司法保障,在執行中則離不開股權登記、托管、交易、結算和信息披露等方面的技術。數據要素也是如此。歐盟的《通用數據保護條例》(general data protection regulation,GDPR)引入了個人數據產權的精細維度,包括訪問權利、修改權利、刪除或被遺忘權利、可攜帶權利、有限授權和最小化采集原則、個人數據跨境傳輸條件以及數據控制者的告知義務等。我國的《數據安全法》和《個人信息保護法(草案)》的發布也出于類似目的。密碼學技術是數據安全的重要保障,基于可驗證計算、同態加密和安全多方計算等使數據“可用不可見”。
不同產權特征的數據要素適用不同的配置機制。例如,作為公共產品的數據一般由政府部門提供。再如,在互聯網平臺經濟中,如果數據來自互聯網平臺對用戶特征和行為的觀察和記錄,那么其所有權就很難界定。用戶實際上用自己的注意力和個人數據來換取互聯網平臺提供的資訊和社交服務(很多時候看似免費提供,實際上卻不是)。這一模式在全球正面臨越來越大的爭議。2020年12月,歐盟委員會發布《數字市場法案》草案,要求數字經濟“守門人”不得基于“核心平臺服務”整合個人數據。又如,在專利保護制度下,專利所有權是清晰的,既可以對外授權使用,也可以交易轉讓。
針對數據要素配置機制,需要避免兩個認識誤區。第一個認識誤區為,數據要素的市場化配置等同于數據要素像股票那樣進行市場交易。后文將指出,數據要素有多種市場化配置機制,市場交易只是其中的一種,而且很多數據要素不適合進行市場交易。第二個認識誤區為,只有所有權清晰的數據要素才能參與市場配置。前文已指出,很多數據要素(特別是個人數據)難以清晰地界定所有權。根據產權的定義,數據要素的產權最終體現為對數據要素的有效控制,也就是控制誰(who)能在何種條件下(what)以何種方式(how)使用數據要素,這也是數據要素有效配置的前提。
3 數據要素市場組織形式
下面先討論數據要素市場與金融系統之間的同構關系,再根據金融系統的組織形式推測數據要素市場的組織形式。
3.1 數據要素市場與金融系統之間的同構關系
金融系統的基本功能是融通資金。在任何社會和任何時間點,都存在兩類經濟主體。第一類經濟主體由于支出少于收入而積累了盈余資金,被稱為資金提供者。第二類經濟主體由于支出超過收入而面臨資金短缺,被稱為資金需求者。資金需求者往往擁有生產性投資機會,但缺乏實施投資計劃所需的資金。金融系統將資金從資金提供者引導到資金需求者,幫助后者實施投資計劃,有助于合理配置資本,提高經濟社會效率。金融系統也會幫助消費者合理安排購買時機,改善消費者的生活福利。金融系統有兩種融資模式。第一種是直接融資模式,體現為以股票和債券市場為代表的金融市場。通過金融市場,資金提供者自己決定將資金配置給哪些資金需求者,資金提供者直接享有收益并承擔風險。第二種是間接融資模式,體現為以商業銀行為代表的金融機構。金融機構從資金提供者處歸集資金后,決定將資金配置給哪些資金需求者,再將相關收益和風險返還給資金提供者。
與金融系統類似,數據要素市場也存在兩類經濟主體,一類是數據提供者,另一類是數據需求者。數據要素市場的基本功能是促進數據要素從數據提供者流向數據需求者,以實現數據要素的有效配置。資金具有競爭性和排他性,能清晰界定產權,金融交易往往伴隨著資金所有權的變更,在產權特征上與數據要素有很大差異。盡管如此,數據要素與資金在若干關鍵特征上相似:第一,都可以在流通和使用中產生價值;第二,都可以積累,在物理上不會消減或腐化;第三,大部分數據要素和大部分資金以數字形態存在。
數據提供者存在3種可能的類別。第一,數據主體(data subject),指數據描述的對象。數據主體可以是個人,這就涉及隱私保護問題。隱私保護問題不是排斥共享個人信息,而是要有效控制共享過程,在保護和共享個人數據之間做好平衡。數據主體也可以是非人格化的,比如來自工業領域、物聯網設備、市政網絡和交通網絡等的數據。第二,數據所有者(data owner),這主要針對所有權清晰的數據。第三,數據控制者(data controller),數據控制者決定誰能使用數據,在什么條件下使用,以及如何使用等。一般而言,數據要素市場上的數據提供者主要是數據控制者,數據所有者可以被視為一類特殊的數據控制者。但對于個人數據,還要考慮數據主體的制約。在這些制約下,數據需求者對數據的使用往往要遵循附加條件,數據提供者也不一定要向數據需求者讓渡自己對數據的控制權。例如,數據可以一直由數據提供者保存在本地,數據需求者給出數據分析工具,數據提供者按要求運行分析工具后,再把結果返還給數據需求者。
基于以上討論,數據要素市場與金融系統之間的同構關系見表1。因此,將金融系統的融資模式“遷移”到數據要素市場,有助于理解數據要素市場的組織形式。
3.2 對數據要素市場組織形式的推測
前文已指出,只有小部分所有權清晰的數據要素才適合進行市場交易,大部分數據要素需要經過中介機構的聚合、加工和集中管理后,才能更好地從最終的提供者流向最終的需求者。因此,數據要素市場在整體架構上將是分布式的,本質上是一個分散的、非標準化的并能適應多樣化需求的場外市場,只有小部分標準化程度高的數據要素才適合進行集中化交易。這個分布式市場會將中介機構作為核心節點,如數據銀行和數據信托。但是不管數據要素市場演化出何種組織形式,都可以借鑒金融系統的融資模式來理解。
3.2.1 數據交易市場
數據交易市場類似金融領域的直接融資模式。數據需求者直接從數據提供者處獲得數據,兩者之間具有直接經濟關系。數據提供者有較強的自主性,可自行決定把數據提供給哪些數據需求者。
與金融市場存在集中化市場和場外市場一樣,數據交易市場也有集中化市場和場外市場之分,前者適用于標準化程度較高的數據交易,后者適用于個性化、點對點的數據交易。由于數據類型和特征的多樣性,以及數據價值缺乏客觀的計量標準,目前并不存在一個集中化、流動性好的數據交易市場。另類數據市場(alternative data market)可被視為場外的數據交易市場。在這個市場中存在大量的另類數據提供商,已發展出咨詢中介、數據聚合商和技術支持中介等作為連接數據需求者(主要是投資基金)和數據提供者之間的橋梁。
3.2.2 數據銀行
在開放銀行生態中,銀行持有客戶數據,并在客戶授權下通過應用程序接口(application programming interface, API)對外共享;不同銀行的客戶數據不同,但同一客戶的數據可以通過API匯總。因為不同銀行介入個人數據市場的程度和管理能力不同,個人數據在銀行之間通過API流動,在市場機制的作用下最終流向能最大化數據價值并保證數據安全的銀行。這些銀行將在開放銀行生態中居于樞紐地位——從其他銀行、金融機構和互聯網平臺等處匯集個人數據,并對外提供數據產品。這就是數據銀行的概念。
數據銀行有助于解決數據要素供需匹配中的兩大問題。第一,數據銀行被作為分散的數據提供者和數據產品的最終消費者之間的橋梁。數據銀行可聚合從各個渠道得到的原始數據,處理和分析后以數據產品的形式提供給數據需求者。第二,數據銀行代表數據提供者與數據需求者進行交易,能發揮專業優勢,實現規模效應。數據銀行可獲取數據經營收益,但也要承擔相關風險。
3.2.3 數據信托
數據信托是一個在歐盟和英國很受重視的概念。英國開放數據研究所提出數據保管人(data steward)的概念。數據保管人決定誰在何種條件下可以使用數據,以及誰能從對數據的使用中獲益。一般情況下,收集并持有數據的機構承擔數據保管人角色。在數據信托下,收集并持有數據的機構(即委托人)允許一個獨立機構(即受托人)來決定如何為一個事先確定的目標(這里包含受益人的利益)而使用和分享數據。因此,數據信托扮演數據保管人角色。數據信托中的受托人一方面有權決定如何使用和分享數據,以釋放數據中蘊含的價值,另一方面要確保其決定符合數據信托的設立目標以及受益人的利益。
ODI認為,數據信托具有以下好處。第一,作為一個獨立機構,數據信托的受托人能平衡不同委托人在誰能使用數據以及如何使用數據等方面相互沖突的觀點和經濟激勵;第二,數據信托可以幫助多個委托人更好地開放、共享和使用數據;第三,數據信托有助于降低數據保管和分享等方面的成本以及對專業技能的要求;第四,數據信托為初創公司和其他商業機構使用數據并開展創新工作提供了新機會;第五,數據信托能“民主化”數據使用和分享方面的決策權,使人們對自身數據有更大話語權;第六,數據信托有助于數據收益的分配更廣泛、更平等且符合倫理道德。
4 DataRank:數據要素市場的估值框架
數據要素價值在微觀層面體現為,滿足好奇心,提高認知能力和決策水平,最終體現為福利提升;在宏觀層面體現為,提高全要素生產率,發揮乘數效應。但數據要素價值的以下特征使數據要素估值面臨很大挑戰。第一,主觀性。同樣的數據對于不同人的價值大相徑庭,主要原因包括分析方法不同、面對的場景和問題不同,以及所處的政策和制度框架不同。第二,時變性。一些數據具有時效性,數據折舊是一個普遍現象,即數據會隨時間流逝而貶值。一些數據有期權價值,盡管現在價值不大,但以后可能價值很大。第三,外部性。同一數據對個人和社會的價值可以不同。數據與數據結合的價值可以不同于它們各自的價值之和。數據要素估值框架應考慮上述特征。為此,筆者提出了DataRank估值框架。
4.1 DataRank估值框架的基本思路
DataRank估值框架的基本思路如下。第一,數據要素價值有很多影響維度,需要一個綜合指標以起到類似充分統計量的作用,并作為數據要素估值的基準點;第二,鑒于數據要素價值的主觀性,綜合指標最好基于客觀的、可觀察的數據要素特征以及數據流通和使用情況;第三,綜合指標應該沒有量綱,有助于按統一尺度評估不同數據要素的價值,但又應該與經市場評估或交易形成的數據要素的貨幣價值有強關聯;第四,鑒于數據要素價值的時變性,綜合指標要動態反映數據要素特征以及流動和使用情況的變化,其與貨幣價值之間的關系還要反映數據要素市場的供需情況和成交價格的變化;第五,鑒于數據要素價值的外部性,綜合指標應該反映不同數據要素組合使用的情況。
DataRank估值框架借鑒了谷歌PageRank算法的做法。不管數據要素市場采取何種組織形式,站在數據需求者的角度,其面臨的問題都是如何從多個可選的數據要素中挑出最適合自己的。這個問題與互聯網用戶在網上檢索信息是類似的。在一定意義上,可以將數據要素市場比照為互聯網,將DataRank估值框架比照為搜索引擎。數據需求者說明自己想要的數據要素特征后(可被比照為互聯網用戶提交搜索查詢),DataRank估值框架會篩選出符合要求的數據要素及相關的綜合指標。
4.2 數據要素標簽和標簽得分
對于數據要素單元,DataRank估值框架根據以下維度提取影響數據要素價值的主要因素,這些因素被稱為數據要素標簽。第一,數據類型,如衣食住行等方面的行為數據,以及金融資產和交易數據;第二,數據涉及的樣本分布、時間范圍和變量類型等;第三,數據容量,如樣本數、變量數、時間序列長度和占用的存儲空間等;第四,數據質量,如樣本是否有代表性,數據是否符合事先定義的規范和標準,觀察的顆粒度、精度和誤差,以及數據完整性(如數據是否缺失)等;第五,數據的時效性;第六,數據來源,有些數據來自第一手觀察,有些數據屬于第二手數據,還有些數據從其他數據推導而來。數據可以來自受控實驗和抽樣調查,也可以來自互聯網、社交網絡、物聯網和工業互聯網等。數據可以由人產生,也可以由機器產生。數據可以來自線上,也可以來自線下。
假設共提煉出p個標簽。對于每個數據要素單元,用表示它在每個標簽上的得分。這些得分是從價值維度較為客觀地對數據要素單元的概括。不管是數據要素標簽的數量和類型,還是每個數據要素單元在每個標簽上的得分,都可以根據數據要素市場的發展情況動態調整。在數據要素市場上,這些標簽也被數據需求者用于說明自己的需求,并檢索數據要素單元。
4.3 DataRank值和標簽權重
用表示某一時刻數據要素標簽的權重。標簽權重是針對整個數據要素市場而言的,適用于所有數據要素單元。假設當前數據要素市場上有n個數據要素單元,第i個數據要素單元的標簽得分是,定義其DataRank值為:
在數據要素市場剛開始運行的時候,要對標簽權重進行初始賦值。隨著數據要素市場的運行,各數據要素單元的DataRank值將動態調整,標簽權重由線性回歸來調整估計,其中dr為因變量,為自變量,為待估計參數,ε為隨機干擾項:
通過式(2)估計出的主要用于對剛進入市場的數據要素單元的DataRank值進行初始賦值。
4.4 DataRank值動態調整
DataRank估值框架的核心特點是,數據要素單元被調用的情況將反映為其DataRank值的動態調整。在其他條件相同的情況下,某一數據要素單元被調用得越多,其DataRank值上調得也越多。在多個數據要素單元被一起調用時,DataRank估值框架能考慮數據要素單元之間的協同效應。在其他條件相同的情況下,一個數據要素單元與另一個DataRank值高的數據要素單元一起調用,能提高自身的DataRank值。因此,DataRank估值框架不是試圖一勞永逸地給出數據要素單元的估值,而是在一個動態過程中不斷評估,并充分考慮數據要素單元在數據要素市場上的表現。接下來討論兩種DataRank值動態調整機制。
4.4.1 按數據調用情況調整
假設用戶在一次調用中,同時調用了n*個數據要素單元,編號為ik,k=1,2,…,n*。用表示因這次調用對數據要素單元ik的DataRank值的上調:
其中,λ表示調用獎勵系數。
用戶每次調用數據都要參考DataRank值進行付費,通過調用“刷單”來提高某一數據要素單元的DataRank值,會付出比較高的成本。這樣能保障DataRank估值框架不會被操縱。
4.4.2 按數據要素單元之間的聯系調整
借鑒PageRank算法,把每個數據要素單元視為一個節點。如果兩個數據要素單元曾被一起調用過,就認為它們之間存在一條邊,并且這條邊有權重。比如,考慮某一數據要素單元a,它與數據要素單元b、c和d分別一起調用過5次、2次和3次。那么,從a到b、c和d的有向邊的權重就分別是0.5、0.2和0.3。這樣,數據要素單元之間的聯系就構成了一個有向圖。如果賦予有向邊的權重以概率含義,那么數據要素單元之間的調用關系就可以用馬爾可夫過程來描述,而有向邊的權重就是轉移概率。按照與PageRank算法類似的方法,分析這個馬爾可夫過程的穩態分布,就能得到各數據要素單元的DataRank值。
4.5 從DataRank值到貨幣價值
可以根據數據要素市場的成交記錄,擬合DataRank值與貨幣價值之間的函數關系,作為接下來數據要素市場化配置的價格參考。成交記錄也可以用于DataRank值動態調整。比如,在式(3)中,可以將調用獎勵系數λ與成交金額關聯,成交金額越高,λ越大;在有向圖中,可以根據成交金額加權確定有向邊的權重。
5 結束語
本文研究了數據要素市場的組織形式和估值框架這兩個影響當前數據要素市場發展的重要問題,核心結論如下。
第一,并非只有所有權清晰的數據要素才能參與市場配置,很多數據要素(特別是個人數據)雖然難以清晰界定所有權,但也可以參與市場配置。實際上,數據要素的控制權更重要,它是數據要素有效配置的前提。對數據要素的控制是通過法律和技術的結合來實現的。數據要素有多種市場化配置機制,市場交易只是其中的一種,而且很多數據要素不適合進行市場交易。數據要素市場與金融系統之間存在同構關系,可以從金融系統的組織形式推測數據要素市場的組織形式。數據要素市場在整體架構上將是分布式的,但會有一些中介機構作為核心節點,包括數據銀行和數據信托等。這些中介機構會聚合、加工并集中管理數據,使數據更好地從最終的提供者流向最終的需求者。
第二,數據要素估值需要考慮數據要素價值的主觀性、時變性和外部性等特點?,F有的成本法、收入法、市場法和問卷調查法等都存在局限。本文參考谷歌的PageRank算法,提出了數據要素估值框架DataRank。在DataRank估值框架下,先提煉出影響數據要素價值的主要標簽,再結合數據要素單元的標簽得分和當前標簽權重,對數據要素單元賦予DataRank值,然后根據數據要素單元被調用的情況動態調整DataRank值,這反過來又能促成標簽權重的更新,從而形成一個自適應、不斷更新迭代的過程。DataRank值基于客觀的、可觀察的數據要素特征以及數據流通和使用情況計算,有助于按照統一尺度評估不同數據要素的價值,并且可以作為基準點,幫助數據要素市場參與者評估數據要素單元的貨幣價值。
作者簡介
鄒傳偉(1982-),男,博士,上海萬向區塊鏈股份公司副研究員、首席經濟學家,主要研究方向為金融科技、商業銀行、固定收益證券、資產管理和金融監管等。
聯系我們:
Tel:010-81055448
? ? ? ?010-81055490
? ? ? ?010-81055534
E-mail:bdr@bjxintong.com.cn?
http://www.infocomm-journal.com/bdr
http://www.j-bigdataresearch.com.cn/
轉載、合作:010-81055537
大數據期刊
《大數據(Big Data Research,BDR)》雙月刊是由中華人民共和國工業和信息化部主管,人民郵電出版社主辦,中國計算機學會大數據專家委員會學術指導,北京信通傳媒有限責任公司出版的期刊,已成功入選中國科技核心期刊、中國計算機學會會刊、中國計算機學會推薦中文科技期刊,并被評為2018年、2019年國家哲學社會科學文獻中心學術期刊數據庫“綜合性人文社會科學”學科最受歡迎期刊。
關注《大數據》期刊微信公眾號,獲取更多內容
總結
以上是生活随笔為你收集整理的数据要素市场的组织形式和估值框架的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: web安全之点击劫持攻击(clickja
- 下一篇: 在Windows系统中安装WAMP