[原文来自:www.ii77.com]
众多惨痛的云事故告诉了我们一个几乎无法规避的现实,那就是云也会宕机,也会丢失数据…. [本文来自:www.ii77.com]
【CSDN 编者按】近两日,因腾讯云损坏了北京一家创业公司的文件系统元数据,导致后者的业务经营、甚至融资进程,都受到影响而引发了业内关于云安全的探讨。
对此,在继公开声明之后,腾讯云官方于昨晚发文进行技术复盘,对“人为/运维失误”进行了细节还原,其表示:“该故障缘起于因磁盘静默错误导致的单副本数据错误,再加上数据迁移过程中的两次不规范的操作,导致云盘的三副本安全机制失效,并最终导致客户数据完整性受损。”
现在很多企业的数据,都选择上云。然而,即便是国内知名云服务商,也免不了掉链子。
作为用户,该如何尽量避免这种情况呢?而此事件一出我们便颇感疑惑,难道没有备份吗?许多人说,“这事儿对云服务是灾难,关键业务和数据的备份还是要自己做,这个成本是必须付的。”
鉴于此,深圳市木浪云数据有限公司联合创始人 & CEO、多备份在线备份云服务创始人陈元强,给 CSDN 投稿来为大家详细介绍云故障的背景、云的本质以及使用云的攻略,深度剖析为什么业务上云了还要再做云备份!
以下为正文:
背景
我们先来回顾下几起大的云故障。
2017年3月,国内某著名云..发生大规模的安全软件缺陷,导致大批用户云主机文件被异常删除,业务中断......
2017年4月,全球知名的云..发生大规模存储故障,导致大量全球知名业务中断。
2018年8月,国内某知名云..发生严重故障,直接导致某创新公司数据全部丢失,公司面临前所唯有的业务停摆威胁......
以上是云..自身原因引起的灾难性故障......
其实还有外部因素导致的问题:
2017年5月,全球爆发的Wannacry勒索病毒,给网络带来了未有的挑战,云..也不能完全幸免,
2018年1月,Intel 芯片设计缺陷,给整个IT架构带来灾难性影响,云..性能和安全受到极大的挑战。
2018年8月,Wannacry病毒再次感染爆发,直接使得..的知名芯片制造企业三大生产线全先停产,直接损失超过3%,达到人民币17.4亿。
实际上,除了我们看到的公有云这些严重故障外,几乎每天都能听到,发生在企业内部的私有云,因为各种原因,包含软件缺陷、人员,电力异常等导致的业务中断、数据丢失。企业正常的生产受到极大的影响,损失无法估量。
这些内部、外部因素叠加在一起,实际上带来了几乎无法规避的现实: 云也会宕机,也会丢失数据….
云的本质
在IOE(IBM, Oracle,EMC)时代,IT专家们为了最大程度规避岗位风险,通过采用业界最知名,最大牌的服务器(小型机)、存储硬件操作系统、应用软件,同时引入最大牌的备份软件来组成自己的企业级数据中心方案。如下(示意图1):
示意图1
当然这种架构维护成本相当高,一般的企业难以招架,也只有少数的大企业或有实力的机构才有能力采用。
随着各行业竞争加剧,企业需要更高效、性价比更高的IT方案,提高效率,降低成本。这时候,云计算出现了。
什么是云计算:
简单点,就是把原先分散的资源集中放在一起,需要多少,就从资源池里面提供多少。
这里资源重点指的是计算能力、存储能力、以及网络连接能力,如下(示意图2)。
示意图2
比如:
10家企业,每家原来采购花费了100万,共计1000万,每家实际平均只用了30万的,共计300万,实际资源还剩余了700万没有用到。
用了云计算以后,云计算..企业一次性投入1000万建设公共云..,每家实际30万,可以服务33家企业。当然好处,不止于直接的成本降低,还有运维管理效率的提升。
当然了,这几年开放架构性能每年翻倍,价格还不断降低,这花掉的1000万大部分是买的比原来小型机时代更便宜的开放架构的硬件,实际上通过集群连接技术,计算和读写数据能力丝毫不亚于小型机的能力。
可以说云计算是非常理想的去IOE方案,但也仅仅是在资源的组合利用和调度方面,这是目前云计算核心解决的问题。云计算目前相对成熟的服务,就是计算和存储。
在数据可靠性存储方面,我们再剖析看看构成云的核心要素块存储、对象存储。通常,我们用云计算,文件之类的数据一般就是存储在块存储或对象存储之上。数据库之类的数据,一般上规模云..,底层也是基于分布式存储架构。
这几种上层存储服务底层都是以分布式存储为主要提供形式。
基本的数据读写逻辑是:
数据以分块的方式,写入到多个存储节点的底层磁盘。写入什么样的数据,存储是不会感知到的。也就是说正确的数据,被破坏的数据同样会被写入到存储底层。同时,因为各种磁盘电气特性或系统各种复杂的内存一致性策略等,写入的时候,还会有是否真的写入,或者写正确到磁盘上的区别(当然这不仅是分布式系统一家的情况,传统的存储也会类似)。
分布式存储(云存储),能否解决的问题列表:
问题 | 能否解决数据存储安全性 |
数据被人为删除或改写 | 不能 |
数据被病毒勒索加密 | 不能 |
少数节点故障,能否找回数据 | 能 |
异常断电 | 有条件情况下,能保证数据正确 |
上层数据被删除 | 不能 |
上层软件缺陷导致数据丢失 | 不能 |
存储软件自身缺陷,数据丢失风险 | 不完全能,部分能解决 |
灾难,导致机房整体故障 | 不能 |
如果出现上面列表,本该解决的,却不能解决,那还会有其他因素综合影响。
正因为有以上问题,云..提供方,通常会引入一些备份机制,如快照,灾备数据中心等技术。但很遗憾的是,一般的快照最多也只能解决..体系内的问题。系统整体风险,还需要谋求独立于..的第三方解决方案。灾备数据中心对于一般技术水平的企业还是难于驾驭。
这些..底层的容灾设计机制,需要完全信任依赖于厂家的承诺实现。
企业上云,目前主要分成几类:
公有云 | 私有云 |
云主机服务 | 虚拟化 |
云数据库服务 | 超融合云.. |
容器云服务 | OpenStack私有云 |
云存储服务 | 容器云 |
其他服务 |
以上所有类型,底层都离不开分布式存储技术(云存储),都会遇到几乎核心的几类风险。
综上所述,云的本质在于解决资源的充分共享和调度,其安全性需要引入外部的各类服务来保证。对于如何正确上云,需要充分理解云这把利器和与生而来的风险。
最佳实践
今天上午9:30 ,中国铁塔股份有限公司正式在港交所主板挂牌交易,股份代号“0788”,IPO发行价1.26港元,发行431.14亿股, 是本年度全球最大的IPO,中国铁塔香港目前公开发售已超额认
看点: 华为2年前就有音箱团队,被内部数次否定,还从腾讯挖墙脚。 上周,在华为消费者业务半年度业绩报告中,华为消费者业务CEO余承东告诉智东西,他们也正在做智能音箱,并
导语 近日,运营商世界网独家获悉,杭州电信凭借着3.55亿元的增量收入,在中国电信地级市分公司增量收入排名中位居第四名,领先于南京、南宁、武汉等城市。 据运营商世界网了
公众号“向小田”(xiangxt1984)是财经专栏作家向小田的自媒体,关注产业金融、资本市场、互联网科技、VC/PE等领域。 科技巨头大战智能语音市场,到底为了什么? 文 | 向小田 现在
913 VR .com 眼见即为真实 (点击底部“ 阅读原文 ”,了解更多 VR 最新资讯) 来源| 913VR 作者| VRの酱 越来越多垂直行业高要求的需求需要有技术背景的团队来支撑,这是一种趋势,
铁血丹心,英雄本色 由中国海军承办的国际军事比赛—2018海上登陆赛,于7月29日至8月11日在石狮举行。来自俄罗斯、伊朗、委内瑞拉、苏丹等参赛国的代表队,就“障碍赛”“求生赛
有个小阳台的卧室,住着舒服多了!
爱猫成痴的人, 总是甘愿为奴,殷勤伺候, 哪怕自己只有小小的蜗居之所, 也要为它留出一方舒适的地盘。 不知道有多少人的家里, 能够实现和谐的“人猫共处”呢? 听说上海徐
每个空间都有属于它的故事,在有限空间里,创造出无限的生活灵感!
木色系 一抹温润木色平衡空间色彩也带来更多自然质朴气息美的一塌糊涂不信?
本文内容来自网友供稿,如有信息侵犯了您的权益,请联系反馈核实
Copyright 2024.爱妻自媒体,让大家了解更多图文资讯!