Insert title here

超融合解决方案

Hyper-Converged

1.需求描述

2.需求分析

3.解决方案

     近年来,深度学习技术和大数据技术突飞猛进,通过通过大数据分析和深度学习,很多被传统IT行业中视为“垃圾”数据一夜间“变废为宝”成为翘楚。    

非结构化数据其中非常重要的一个特点是其数据量相比传统数据存在着数量级上的差别。传统数据通常按Tbyte来计算,而非结构化数据动辄就可达Pbyte,数据量级的变化带来的响应无论从数据存储、数据吞吐等各方面均对传统独立存储设备带来了极大的挑战。

传统的独立存储设备(如EMC、日立等)最大容量通常只有几百Tbyte并且价格昂贵,除此之外传统的独立存储设备硬盘维护也极为高昂。但最为致命的是传统独立存储数据读写全部依赖于磁盘阵列控制器,控制器的性能成为了整个业务系统的瓶颈所在,面对海量的非结构化数据独立存储的I/O性能相形见肘。

   随着虚拟化和分布式技术的发展,价格低廉、I/O性能无限扩展的分布式存储技术应运而生。利用廉价的X86架构服务器本地硬盘为基础,通过虚拟化技术把多台X86服务器本地硬盘虚拟为一个“独立存储”彻底解决了存储成本、吞吐性能诸多问题。  

存储现状分析:

目前传统的独立存储和早起的分布式存储产品存在的主要问题:

传统的hypervisor海量数据存储:非机构化数据包含数量众多的图片文件、音视频文件、文本文件等,相比传统数据从量级上差距是巨大的。企业在非结构化数据存储方面投入成本越来越大成为企业一大负担。

大数据吞吐:随着大数据及深度学习等技术的发展,对非结构化数据的读取和分析速度成为了系统学习效果的最大瓶颈,例如google深度学习系统TensorFlow需要访问上百万的样本文件来识别某个特定的事物,这对存储设备的I/O产生了极大的要求。

传统系统部署中,X86服务器只负责运算,数据存储有独立存储设备来完成,这对X86服务器本地存储资源造成了极大的浪费。早起的分布式存储设备利用X86服务器来存储数据,但是作为存储的X86服务器很难在其上再部署其他业务系统,由此造成了X86服务器计算资源的极大浪费。既能利用好X86服务器的运算资源又能利用X86服务器的本地存储空间来储存数据成为了企业亟待解决的问题。

Insert title here