至于要保存什么数据以及如何保存它们的业务和技术方法都非常直接明了,即把存储方案设计为保存所有对业务来说有利可图的数据或者所有能够增加股东价值的数据,并删除其他的数据。首先让我们来看看致使数据膨胀最常见的原因,然后再分析让数据存储成本与存储中存放数据的价值相匹配的方法。
至于要保存什么数据以及如何保存它们的业务和技术方法都非常直接明了,即把存储方案设计为保存所有对业务来说有利可图的数据或者所有能够增加股东价值的数据,并删除其他的数据。首先让我们来看看致使数据膨胀最常见的原因,然后再分析让数据存储成本与存储中存放数据的价值相匹配的方法。1.期权价值
所有的期权对我们来说都具有某些价值。这种价值是由我们相信最终我们会行使这个期权从而带来个人利益的概率决定的。它可以是个概率公式, 既计算了行使期权的可能性,又计算了行使期权可能带来的好处。显然,我们不能说期权的价值是“无穷大”的,否则我们就相当于在说这个期权能给股东带来无穷大的价值。如果确实如此,我们就应该公开我们的财务信息,然后静观我们的股价大升了。你认为发生这种情况的机会有多大?答案是,如果你公布了这些信息,股价可能不会有显著地上涨,至少不会是由于你公布了这些数据而显著地上涨。
我们数据的期权价值并不是无穷大的,因而我们应该开始问自己这样的问题,过去我们多久使用一次这些数据来进行有价值的决策?在那个决策中用到的数据存放了多久?我们最终究竟创造了多少价值,而维护数据的成本又是多少?净利润是多少?
记住,我们所说的并不是要刷新系统中的所有数据,也不主张从系统中删除所有数据。如果你的平台存放的是一些毫无意义的数据,那么它很可能无法运行。我们只是想说明,你应该评估和质疑自己存储的数据,以确保你保存的数据的确是有价值的(我们将在本章后面的小节中讨论它),并且在给数据存储方案定价和设计架构时,要时刻考虑到数据的价值。如果你过去从未利用过某个数据来做决策,那么很可能你以后也不会用到它。即使是你开始利用它了,你也可能不会用到该数据的所有元素。因此,你应该判断哪些数据具有真正的价值、哪些数据是有价值的但应该用成本较低的存储解决方案存放,以及哪些数据是可以被删除的。
2.竞争优势
这是我们保留数据最喜欢使用的原因之一。这个原因最容易说,而且也最难反驳。它的基本思路是,你会比所有其他竞争对手占有优势,因为他们没有保留所有的数据。你做出了更好的决策,你的客户可以访问更多的数据,你就能够在自己的市场领域中胜出。你甚至可以做个市场调研,说明你的方法是受客户欢迎的。
让我们首先来谈谈市场调研。如果你问你的客户,他们是否认为能够永远使用那些“小工具”这点很重要,你认为答案会是什么呢?尽管不同行业会有差别,但你得到的反馈信息很有可能都是肯定的。这其中至少有两个原因。一个原因是,相对于竞争对手的平台,他们已经习惯于使用你的平台了,你已经给了他们一个为什么要使用你的平台的理由。另个原因是, 你让他们能够无限地使用数据,却没有增加他们的花费,至少没有给他们带来成本的问题。因此,在没有相关花费的情况下,他们当然喜欢无限期地使用数据了。
另方面,如果我们问人们愿意为几乎无限的存储付多少钱呢?我们的答案可能就会完全不同了。如果我们问为什么我们的客户要使用我们的产品而不是竞争对手的产品,而且一定要他们给出一个答案,答案又会如何呢?我们猜想,也许你会发现,人们第一一反应想到的不是 无限的存储。因此,这里正确的问题是要确定随着时间的流逝( 如10年或者1年),“无限的”数据存储有多少增量价值。存储了20年的数据与存储了10年有什么差别?我们猜想,随着保留年限的增长,每一年增加的价值都会比上一年的要少。例如,保存了19年的数据可能比保存了20年的更有价值,保存了1年的数据可能比保存了2年的更有价值。随着保存年限增长,数据的价值就会开始下降,甚至会降为0,而相对于存储的数据量来说,我们的成本会增加。现在看来,对存储有限制的公司,很可能比对存储没有限制的公司有竞争优势。究竟是什么优势?那就是更多的利润!
当然,前面的对比都是假设了存储的定价近似,所有的存储解决方案都是平等的,对所有类型的访问的响应时间都需要符合同样的服务水平协议,等等。当我们认识到有些数据具有巨大的价值,有些数据价值较小,而有些数据根本没有价值之后,我们就可以决定对有价值的数据采取一一种成本分层的存储方案,而对价值很小或者没有价值的数据,就删除它们。我们还可以转换或者压缩数据,以确保用非常低的成本保留大部分价值。
可能您还想看