云存储技术解析:无存储 不智能

2017-05-17 02:07:22来源: 热度:

随着无人驾驶、机器人送餐等人工智能(AI)应用逐渐进入大众生活,再加上资本热潮的助推,AI的发展备受瞩目。不过,要真正实现AI从概念到落地,还必须具备足够的数据、足够的计算能力和足够的行业应用三个条件,而云计算恰好能满足这些要求。

当下,AI正与云计算进行深度融合,未来会变得更加智能,但在智能化的背后是对海量数据存储的刚性需求。据不完全统计,单是一辆无人驾驶汽车每秒产生的数据容量就在1G左右,相当于每秒发送20万封纯文本电子邮件或上传100张高清数码照片。因此,没有大容量和超稳定的存储系统,这一切都将无从谈起。无存储,不智能。为了更加清晰的了解云存储技术的实现过程,UCloud存储研发部将对云存储——对象存储(UFile)技术进行深度解析。

对象存储UFile概念

对象存储(UFile)是为互联网应用提供非结构化文件存储的服务;相对于传统硬盘存储,UFile具有存储无上限、支持高并发访问、成本更低等优势;解决业务架构的文件存储问题,有效降低海量文件的存储成本,支持热点数据的高并发访问,提升终端用户访问体验。

单地域UFile存储架构六大集群

 

  • ULB(UCloud Load Balancer) 实现外网的对接及接入层的负载均衡与容灾处理,该模块通过定期向接入层模块端口发送心跳以检测接入层模块的可用性,发现异常模块及时进行剔除;

  • 接入层提供文件访问服务,该模块为无状态设计,因此可以平行扩容及缩容;

  • 索引层保存文件对象的元数据信息,包括对象名称、对象大小、创建时间、存储位置等;

  • 存储层是实际存储文件数据的模块集群,主要实现文件数据的多份分布及高可靠存储;

  • 数据处理层主要实现UFile图片及数据处理,包括图片的实时裁剪、缩放、旋转、水印、格式转换、信息获取等操作,客户还可以使用自己的通用计算镜像对数据进行处理;

  • 名字服务主要实现索引层及数据处理层模块的容灾剔除,以上3个集群的模块会定期在名字服务注册自身服务,当其中有部分模块因机器异常或者网络中断导致无法提供服务时,名字服务会将该机器从名字中剔除,并且通知接入层,从而实现后台模块的容灾剔除。

重点设计解析

UFile索引层设计

UFile索引层为一套分布式KV存储系统,其主要目标是保证UFile对象元数据的高性能、高可靠、高可用及可扩展的存储,其主要分成两层架构:

  • 索引接入集群解决索引存储集群的管理及元数据的分布,这一层模块为无状态设计,通过名字服务实现异常状态的容灾剔除;

  • 索引存储集群实现对象元数据的分布式存储,每个对象元数据将存储3份,保证数据的可靠性及高可用性,同时对象存储采用SSD(固态硬盘)作为存储介质,也保证了元数据存储的高并发低延时访问特性。另外,该模块采用固定集群规模的方式进行管理,每个集群支撑的存储量、访问量固定,存储可实现以集群为单位的水平扩容,保障业务不断增长情况下的高性能稳定访问支持。

 

UFile存储层设计

存储层包括三种类型模块集群:

  • 存储节点,该模块按照固定大小的集群(称为“Set”)进行组织和管理,每个集群支撑的存储量及访问量规格固定,同时该模块可根据存储量需求横向进行无限扩展,从而满足客户无存储量上限的数据存储需求。每个对象数据在存储层存储三份数据,通过对异常情况的及时处理和坏盘的及时修复,保证数据极高的可靠性(99.99999999%);

  • SetMaster,该模块进行Set状态的管理,接入集群通过SetMaster决定上传对象数据的存储集群,并执行数据的存储操作;

  • OsdMaster,该模块每个Set有一套,实现Set内部的存储路由管理,并对各块磁盘的状态进行监控,及时剔除异常磁盘。
     

UFile存储路由算法设计

UFile存储集群采用去中心化设计,数据存储采用固定的路由算法进行存储,由于存储集群的规模为固定,因此路由表也为固定,这就保证了存储系统的简单性及稳定性。下面详细介绍UFile数据存储层的路由算法设计。

第一步,在存储集群上线时,每个集群的OsdMaster将磁盘信息进行组织,生成一个存储路由表,该路由表的每个项目对应3块分布在不同机架及存储机器上的磁盘,对象数据将按照路由表指定的位置进行存储。

第二步,每个存储在UFile上的对象数据将被切分成若干个4MB的数据块,称为分片。UFile为每个对象分配一个单集群内部唯一的对象ID,对象ID与分片编号拼接获得分片ID,通过字符串哈希算法获得哈希值,并在路由表中找到该分片存储的3块磁盘位置,由UFile接入模块将该分片数据提交到3块磁盘上。

第三步,当单块磁盘出现异常时,OsdMaster会发现这一情况,并将该磁盘标记为异常状态,当接入层写入此数据时,会只写入两份数据,待磁盘修复后,再从这两份数据中拷贝一份数据到已修复磁盘,恢复数据的多份高可靠存储。在出现一个哈希表项中有2块磁盘不可使用的情况时,为保证数据安全性,该存储集群将不允许写入操作,写入操作会被切换到其他集群提供服务,从而保证UFile读写的高可用性。

UFile功能优势

海量存储

存储空间无上限,无需考虑存储空间扩容问题,单文件最大支持5TB,适用于音视频、图片分享等UGC类应用海量文件存储。

高并发

支持高并发访问,突破传统磁盘I/O限制,满足高访问量及高下载量业务需求,适用于高下载量、高访问量应用文件的存储。

访问加速

存储文件结合CDN分发加速,国内外500+加速节点,有效降低访问延迟,提高下载速度,提升全网终端用户的访问体验。

安全可用

所存文件保存三份副本,分布存储于不同存储集群,即使单份数据损坏也不影响存储文件的可用性,同时保证文件安全。

内容保护

可通过身份验证机制及防盗链设置控制终端用户访问权限,避免因内容被盗用产生的版权损失和恶意访问的流量消耗。

图片处理

提供图片处理服务,支持图片缩放、剪裁、添加水印等功能,并提供多种尺寸设置,满足移动端、PC端等多终端访问需求。

更低成本

存储单价仅为云硬盘的1/2,下载由CDN分发,降低存储及网络成本,按实际使用量计费,无存储及带宽资源闲置浪费。

开发支持

完备的API接口及SDK开发包支持,适合多种语言,与原有业务无缝结合,能够极大缩短开发周期,帮助业务快速上线。

总结

在大量企业对数据存储需求强劲的背景下,UCloud对象存储系统应运而生。本文通过介绍UFile产品、底层文件存储系统实现细节、功能优势,分析了UFile如何实现高可靠及高可用特性。从云存储技术出发,UCloud助力各领域企业更高效、更智能地探索数据价值。


责任编辑:王刚

为您推荐

2014年云存储服务市场将突破2亿美元

全球IT市场咨询公司思林博德市场咨询SpringboardResearch发布了《中国云存储服务报告,ChinaCloudStorageServicesReport》。报告显示,在未来的5年,中国云存储服务市场的年复合年增长率将达到103%。Springboard认为,中国云存储服务市场将由2009年的605万美元快速增长至2014年的2.0854亿美元。报告指出,尽管每月每GB的存储服务价格将持续下降,但是云存储市场总采用量的增长幅度更为迅猛,这将推动云存储市场整体规模在未来5年内的快速上扬。Springboard定义的‘云存储服务’是指云存储服务供应商提供的存储和存

云计算时代迷局下 云存储如何工作

云计算是目前业界最关注的话题,大至国家部门小至中小企业、个人用户,都想尝试把业务推向云端,其实云计算让很多人云里雾里。而云存储则是在云架构中存放资料不可或缺的组成组件。云存储这个概念的出现,在一定程度上改变了我们对于传统存储模式的看法。但是云存储想必让很多人迷惑,今天我们就并非空谈的云存储进行详细的分析和探讨。采访一个公司的CIO时,记得他说他总是在考虑如何处理生活中“积累的东西”,一旦收集到足够的东西,他就必须找地方来存放这些。这让我想起了存储。像是电脑花了很多时间来获取数据,然后试图找到一种方法来存储每一个人的数据。对于一些计算机用户,找到足够的存储空间来保存他们所获得的数据是一个真正的挑

“云存储”迎来“智能电视”新时代

在家看了一半的电视,出门时把信号转接到手机屏幕上继续欣赏,到了目的地打开电脑屏幕接着看……这个“多屏互动”的场景即将成真。昨日,上海广播电视台、上海东方传媒集团有限公司(下简称SMG)与联想集团在沪签署协议,共同宣布在移动互联视频服务领域达成战略合作,双方将通过发挥各自在终端产品、云计算、内容资源、市场运营等方面的优势,联手开拓中国移动互联与数字家庭市场。记者昨日获悉,联想集团与SMG旗下新媒体百视通公司将在上海成立合资企业“上海视云网络科技有限公司”,双方总投资金额达数千万元,它也是全国首个集终端生产、系统研发、网络行销、增值应用的新媒体合资公司,将在互联网电视、

戴尔推出免费云存储服务与苹果iCloud竞争

据国外媒体报道,随着新款Stage软件推出,戴尔不声不响地建立了一个免费的云存储服务,这给消费者提供了一个令人信服的购买戴尔产品的理由,也给苹果iCloud增加了一个新的竞争对手。这款新的Stage软件已于上周开始销售。它允许用戴尔Streak或其他戴尔移动设备拍照的用户,自动将照片上传到一个免费、共享的云存储池中。这款新的软件还允许戴尔设备远程控制和播放共享的音频和视频以及其他服务。对于消费者而言,戴尔的Stage软件可能比戴尔本周开始播放的MoreYou新宣传广告计划来得更加重要。在MoreYou宣传广告计划推出后,戴尔进行了一次市场调查,结果发现消费者已开始使用PC电脑和移动设备上传和存