数据是很昂贵的。看到这句话,你的第-反应可能是,大容量存储器成本正在稳定下降,而且自从有了云存储服务后,数据存储几乎成了免费的。但免费与几乎免费显然不是一回事,许多几乎免费的东西事实上都证明非常昂贵。随着存储的价格逐渐降低,我们不再那么关心究竞使用了多少存储空间,从而通常会使我们的存储用量显著增加。如果存储的价格下降了50%,那么我们很可能不会由于减少了运营成本,而把这减少的50%的价格转换成股东价值,而是会利用两倍的存储空间,因为官“便宜”了。
数据是很昂贵的。看到这句话,你的第-反应可能是,大容量存储器成本正在稳定下降,而且自从有了云存储服务后,数据存储几乎成了免费的。但免费与几乎免费显然不是一回事,许多几乎免费的东西事实上都证明非常昂贵。随着存储的价格逐渐降低,我们不再那么关心究竞使用了多少存储空间,从而通常会使我们的存储用量显著增加。如果存储的价格下降了50%,那么我们很可能不会由于减少了运营成本,而把这减少的50%的价格转换成股东价值,而是会利用两倍的存储空间,因为官“便宜”了。的存储情理越多,这些棚外支出可能居需顺系统管理员米从作数据,成者从需要产能规刘员为增 不过,存情的初始成本并非是你所存情的数据相致的唯成本。 你所存储的数据越多,需娶随着存储规模的增长,憎理存储的复南度也会增加。长作规划,甚至居需发购买软件作用,以使你能够康权化自己的存储环境儿重加容易地管理它。
此外,随着存储规横的增长,存储所需的电力和空间的成水出会增加。你也许会说,大规概非活动做盘阵列存储(MAID)的市现已经减少了这些成本,成者你还想倒了成木更低的解决方常,如云存储服务。如果你已经把自已不常切同的数据存放在了这样的存储设备上,我们还是市常费同的。似事实是,如果你只运行一个大规模阵州,成本会比运行10个大规模阵列低,存储在云端的数据越少,成本也就越低。在MAID解决方案中,那些做盘会时常运转,它们清耗电力只是为了确认它们在正常运作。此外,你还眼为插人的配电装w (电源插座)付钱,成者为了插头和电源需安价挤配供应商支付月和成年和。最后,你还要付钱建造个设备,以便提供最大的用电量,这个最大用电量是用活动的取动器的百分比计算出来的你也可以付钱给别人(同样地,可以果川挤配供应商)来替你提供这些。当然,如果你不使川MAID驱动器,那么运行个总是在运转的系统所需电量的成木更高。如果你使用的是云服务,你仍然需要人员和流程来了解存储放在哪里,以便确保你能够正确地访问它。
还不止于此呢!如果数据驻留在数据库中,而它正是你为客户执行交易的数据库,那么当要查询的数据:大小增加时,该数据的每个直询的时间都会增加。我们这里讨论的不是物理存储的成本,而是完成查询的时间成本。如果你采用了合适的索引进行查询,可能会使在询该数据的时间不会随着数据火小面呈线性增长(可能是log:N,其中N是数据儿素的数量),但即使如此,它还是会随着数据大小的增加而增加。在具有16个元素的元树中遍历和查找几素所需的成本虽然不是在具有8个元素的二元树中做这些操作的网倍,但成本仍然是增加了。在遍历数据的步骤中,这种成本的增加表现为每个用户查询需要更多的处理器时间,这就意昧着在给定的时间中,所他处理的事情就少了。假设我们有8个元素,要找到我们查询的项目,平均需要1.5个少骤。再假设对于16个元素,要找到我们查询的项,平均需娶2个步骤。那么操作16个元素所需的处理时间就比操作8个元素所需的时间多了33%。虽然这样看起来已经很好地利用了扩展方法,但它花费的时间仍然多了。它不只是在数据库I花费的时间增加了。即使是以异步方式执行,应川服务器等待查询完成的时间可能也会增加,而你的客户等待页面载人的时间也会增加。
让我们假设我们的峰值利用时间是下年点到下午2点。如果每个春询平均都需要多花费339%的时间来完成,而且我们在峰值流量时期可以100%利用我们的系统,那么婴不降低响应用户的速度,处理相当于原来(8个元素)数据网倍( 16个元素)的数据量,我们就需要增加33%的系新的查向都坤风起来,等待运行时间校长的查询完成,从而使用户体验变禁,或者增加产他,限 统。换句话说,我们或者让每个查询都多花费33%的时间来完成, 考虑则产储的限制,这样会使户体验就会开始变差。虽然你也许会说,采用更快的处理器,更好的爆存以及更快的存储,都有 制对用户的影响。当然, 在4种情况下,如果不采用我们的分解数据的技术,川助于提高用户体险,但它们都不会改变一个事实,即与数据较少的系统相比,数据越惠,处那数据所需的时间就一定越多。如果你认为再没有其他与存储相关的成本了,那么你就又错了。毫无疑问,你需要不时地备
份你的存储,很可能是备份到一个相隔离的存储设备上。 随着数据量的增长,你需要执行完整备份的工作最也会增长。不止于此,你还要对每个完整的备份都反复地执行这些工作。你的许多数据很可能都不会改变,但即使如此,你也会反复地重写它们。虽然增量备份(即只备份被改变的数据)有助于解决这个问题,但你通常还是需要定期地执行完整的备份,这样就不必对一个陈年的完整备份执行多次增趾备份了。如果你只有一个完整 备份,然后只依靠增量备份来恢复存储设备的某.一部分,那么你的恢复时间目标(从存储故障中恢复所需的时间)一定要设得足够长了。希望我们已经使你走出了存储是免费的这个误区。也许存储的价格是在下降,但它只是你存储信息、数据和知识所需付出的成本中的一一部分。
数据的六项成本你所存储的数据量增加,会导致下列成本增加;
●存储数据的存储成本
●管理存储的人员和软件
●使存储能够运行的电力和空间
●确保提供适当的电力设备的资金
●遍历数据的处理能力
●备份时间和成本
数据并不只是物理存储而已,有时我们在这里列出的其他成本可能还会超过真正的存储成本。
可能您还想看