数据正在以产业的形态不断壮大,那么数据产业的不断成熟带来了哪些影响?这篇文章里,作者认为数据商品化将是未来的趋势之一,而“人”这一实体所产生的行为等信息可能会被打包成商品、被标准化出售。具体如何理解?一起来看看作者的拆解。
大数据的今天不得不思考的一个问题是,随着大数据的飞速发展,数据会以产业的形态不断壮大。当数据产业不断成熟后对社会会有怎样的影响和改变?
从我的观点出发,不久的未来是卖人的时代,当然并不是人又再次沦为奴隶,而是“人”这个实体的行为等信息会打包成商品被标准化出售。
人行为的标准化即行为产生数据后的标准化。当数据标准化,必然就会催生数据的市场交易。因此想让数据更有效的流动,数据商品化是必然的趋势。
我之前花费很大的经历去研究数据的交易交换,探究机制和可行性。会发现数据标准化在当前并不是一件难事,最难的应该是数据的溯源和确权,并如何让用户接受自己被“卖”的事实。这一套机制深究下去会发现其难度不次于市场的诞生,或者经济体系的形成。不过区块链的出现或许可以化繁为简或者加快这个过程。
无论是什么物品的交换,这终究是商业的本质和市场的起源(之前有写过一篇《从商业本质到数据起源》)。无非数据是一个相对敏感的话题。因为它涉及的还不只是个人的利益,还有隐私。
隐私是一个相对无价的东西,当然无价有两层含义:无法用金钱衡量或者是无价值。不同的人对自己隐私的理解或认知是不同的,甚至李彦宏曾经说过:“中国人愿意用隐私交换便捷性”。这点我不做任何评论,但是目前隐私是一个没办法用价值衡量的东西,因人而异。
因此数据的定价就可以等价于对隐私的定价。如果一个东西难以定价怎么办?那么我们就想让它自身所能发挥的价值或者市场认可的价值来自我定价。这或许很符合市场经济,根据市场供需来定价。那么我们就需要去构建一个数据经济市场,由数据价值变现来决定数据定价。经济体系就会涉及到货币的产生、市场的形成和商业的闭环。
人的行为数据标准化:即人的行为固化成标准的数据结构。最常见的就是标签,即通过行为给人打上的特征标签。标准化的行为数据流也可以。当然非标数据也有很多利用价值,但从商品化的角度来说会更难定价或更难评估和使用。
数据商品化和商品数据化的概念是不一样的,商品数据化更多的是为了可量化和更精准。可量化即可分析和易运营,更精准即易解释,并且实体更偏向商品。而数据商品化主体更偏向站在社会利好的角度来说数据商品化可以提升数据的使用效率、全局数据的准确性和一致性。
宏观角度当全局个体的信息都对称集中在一起时,会相对容易辨别出个体数据的准确性,这是数据流通的优势;从微观角度个体数据散落在各处,目前真实的应用场景难以站在全局的角度,因此确保各处孤立的数据准确性尤为重要:一方面“人”的实体信息作为商品准确性是其质量的保证,另一方面数据准确性可以提升信息效率改善信息爆炸的现状。
GDPR(《通用数据保护条例》,下文统称GDPR)先进之处和令人钦佩的不只是明确了数据的隐私安全,还阐述了数据准确的必要性。
第二章第五节中有对数据准确性的描述:
accurate and, where necessary, kept up to date; every reasonable step must be taken to ensure that personal data that are inaccurate, having regard to the purposes for which they are processed, are erased or rectified without delay (‘accuracy’);
“准确,并在必要时保持最新;在考虑到处理目的情况下必须采取合理的方式,确保处理不准确的个人资料时,及时删除或改正;”(自己理解翻译,如有不对之处请指正,谢谢!)
Ps:GDPR法规细则可详见 https://gdpr-info.eu/
当数据标准化后,随着需求的强烈会逐步商品化,而数据商品化后暗含着人被商品化并可标准化售卖,转眼变为了一个“卖人”的生意。当然并不是人的实体,而是人的属性所带来的附加价值。换个角度来说,这比人被奴役更痛苦。因为人无法击败对你无形的压榨。绝大多数人的感触是:知道自身数据的隐私必然重要,但并没有真切感受到哪方面受到威胁和侵害,因此难以发现并追溯。
商业一直在解决信息流、物流和资金流之间的流通关系,而互联网重点在解决商业的信息不对称和信息流通。社会中最难也最重要的信息是每个“人”的实体信息,且难以对称。难以信息对称的最大阻碍是合理性,因此数据商品化的唯一途径需要用户授权。
社会中“人”的个体数量如此庞大,从资本化的角度考虑,如果想以数据商品的形态流通变现就要像项目众筹一样,你所需的商品或服务就是群体中每个人的信息数据,而得到授权的过程其实就是个体作为股东入资的过程,项目所获取的收益需要与这些个体(股东)分成才可能会得到个体的准许。而这一步需要后续国家待完善的法律支持,只有环境和条件成熟,数据商品才能真正的流通起来发挥最大价值。
目前大数据的重心在于数据治理,逐步推进数据资产化进程,自从17年底国内发布首个《数据资产管理实践白皮书》后1年内中国信息通信院把白皮书更新到了3.0,明显看出无论从政府导向还是企业应用的数据资产化进程在加快。
我们来看一下资产的定义:
资产是指由企业过去的交易或事项形成的、由企业拥有或者控制的、预期会给企业带来经济利益的资源。不能带来经济利益的资源不能作为资产,是企业的权利。
这之中有一句话非常重要:“不能带来经济利益的资源不能作为资产”。当然经济利益可能是通过数据服务间接提升的收益,但当数据沉淀为资产后必然的趋势就是商品化。商品化是资产流通最便利的方式,也是获益的最直接手段并且对于企业来说流动资产是笔最大的财富。
《数据资产管理实践白皮书3.0》中提到:“数据资产变现对外共享租售”,意味着数据态度更加开放。不过由于目前国内的数据知识体系框架并不完善,无论是从基础设施、人才储备、条例约束还是政策指导等都没有完善和明确的方向,因此即使态度开放还依然需要夯实基础和持续的方向探索。
数据商品化带来的数据交换、流通是必然的趋势,BAT互联网巨头们也是把握这个趋势,收口数据只进不出,牢牢地抓住手中的数据资源形成资源垄断,并且通过庞大的数据池形成虹吸效应吸纳更多的外部数据进入。
某种程度来说BAT的行为或阻碍了数据流通的发展进程。从经济学的角度来讲,巨头对某个产业的垄断会极大影响这个产业的发展。有两个方面:一是想继续保持垄断来维持利益最大化;二是垄断中难以激发创新。因为中小企业由于需要巨大的成本投入来打破准入门槛导致望而却步,垄断企业由于自身局限性导致创新乏力。
有一点需要说明是,数据商品化不仅仅涵盖以人为维度相关的信息数据,这个主体维度很广泛,主数据和交易数据等涉及到的主体维度都可以。只不过最为重要的并且上文也提到社会中最难信息对称也最隐晦的是每个“人”的信息数据,因此商品化和交换流动性价值最大的是以人相关的信息数据。
而其它维度的数据很多都可以通过技术手段解决,如:爬虫、计算模拟等。并且会有产生数据的主体维度和使用场景不同带来的不同数据含义导致应用的误导性,如:A企业商品的销量产生逻辑复杂多变难以解释和追溯,如果以此数据直接应用于B企业并不一定会带来指导作用,甚至有可能是误导性的。并且这些数据的主体维度相对分散难统一,因此“人”为主体的数据商品化相对来说无论从可解释性、唯一性和可用性都比较强。
对于数据商品化我先浅谈于此,我相信随着数据产业的规范和发展,卖“人”一定会合理化且具备合规性。当你更清楚的知道并了解自己如何被“卖”,卖的用途是什么,并且能从“卖”自己的收入分成中获益,这对大家来说才是公平的。