北京软开发公司IT行业日新月异的发展有目共睹,然而有一个市场却一直保持着稳定而缓慢的发展脚步——存储。相对于其他产品,存储的技术门槛更高,无论是数据安全性、可恢复性、高可用性以及管理性,都要比其它的IT产品复杂的多。
然而随着近几年互联网的不断壮大,特别是云计算、大数据等技术的冲击下,存储领域也开始发生颠覆性变革,那就是介质的变化。业务互联网化、云化的需求越来越明显,企业对于存储的要求不再局限于处理的速度、容量和可靠性,而是能为数据中心带来较优效率、灵活性、规模、成本和数据保护的存储解决方案。这些都使传统存储越来越无力招架,企业开始将希望寄于软件定义技术。2015 年年中,传统存储行业老大EMC 被服务器厂商 DELL 收购为这场技术变革奠定重要的里程碑。
与此同时,传统虚拟化厂家 VMware 也推出 VSAN 来替代昂贵且过时的集中式存储设备。以可弹性扩展、更易用的存储解决方案,降低数据中心的整体拥有成本。但VSAN的本质是SAN存储,提供的是“块”接口的数据存储功能,不提供NFS服务。为了满足虚拟机中需要文件共享的需求,大多数情况下需要在单个虚拟机中部署NFS服务,这种集中式的部署方式无法充分利用VSAN的横向扩展性能。
为了丰富VSAN存储方案,VMware与以软件定义存储技术见长的达沃时代合作,由其开发VNAS提供并行文件服务。在接受51CTO记者采访时,达沃时代副总裁、CTO雷迎春博士介绍了VNAS与VSAN的协作方式,剖析了分布式文件系统的开发难度何在,同时也展望了他眼中的软件定义技术发展趋势。
VNAS:软件定义的分布式并行NAS
VNAS是运行在VMware虚拟中的一种NAS虚拟化服务,它的部署非常简单,利用VSAN虚拟出来的硬盘,通过VMware的vSphere一键操作即可完成部署。其核心是达沃自主研发的分布式文件系统YeeFS,对外提供标准的NFS/CIFS接口,以及集群式NAS服务。由于它与VSAN运行在同一个宿主机上,即使VMs迁移了,还是可以实现对StorgeVM的就近访问,与VMs位置无关。另外,通过创新数据调度等技术,VNAS提供全活集群的保障机制,因此当本地StorgeVM故障时,VMs仍可以通过其他Host上的StorgeVM继续访问相关数据。当然,VNAS对故障的判断,需要VSAN提供相应的物理资源信息。
除标准的NFS/CIFS接口外,VNAS也为客户提供私有协议支持,为应用提供符合工业标准的Posix接口。运行在Windows、Linux操作系统之上的应用软件都不需要更改即可访问。通过选择私有协议的方式,避免不必要的协议处理,提升系统的可用性和可靠性。
为了使大家进一步明确VNAS对VSAN性能的补充,雷迎春以具体应用实例来加以说明。比如,虽然VSAN本身有Hadoop解决方案,但Hadoop的底层是HDFS文件接口,VNAS允许新增HDFS接口,从而更好地支持Hadoop应用在VSAN环境下的运行。
分布式存储的核心在于共享
国内提供分布式存储服务的厂商并不少见,达沃作为一家成立只有五年的初创型公司,究竟凭借什么获得VMware的青睐呢?雷迎春认为,除了利于VMware在中国本土环境下的业务扩展,更重要的是达沃在存储领域,特别是分布式文件系统研发方面有较为领先的技术优势。
雷迎春谈到,国内存储厂商中提供“块”存储服务的居多,真正自主研发分布文件系统的服务商还是很少见的。市场上见到的一些分布式文件存储产品,也基本是基于GlusterFS、CephFS等开源系统。但对于企业存储来说,可靠性永远是第一位的,因此在缺少足够技术维护人员的情况下,开源存储系统较难投入到企业真正的生产环境当中。
雷迎春进一步分析到,分布式文件系统的研发难度较大。很多应用都依赖于文件系统提供的原子语义,这就要求分布式文件系统在保证性能的前提下,还需要使许多文件操作具有原子语义。例如,创建文件这个简单操作就需要原子完成,要么成功,要么失败,不允许中间过程,否则,系统就不一致,或者存在垃圾资源。
在云计算带来的变革下,未来应用部署的主流形式将主要集中在Docker和虚拟机中。“块”存储技术解决了盘阵的问题,但应用上云后,应用和应用间共享数据时,文件是一种常用的方式。对名字空间进行虚拟化和统一,完成对海量数据的统一管理和共享。
应用定义存储是重要的趋势之一
采访较后雷迎春谈到,存储和应用的耦合效力、耦合的好坏,会直接影响应用的使用和效能。另一方面,不同的应用对于存储有不同的需求。例如,在传统的三层架构下,应用与存储间是分离的,它们之间一般通过iSCSI或NFS标准协议沟通。而在超融合架构下,VSAN通过嵌入到vSphere框架实现应用和存储的直接沟通,获得较好的性能和可靠性。应用定义的存储应该是存储发展的一个重要趋势。
现在大家都在谈论数据智能化,雷迎春认为数据分析是其中重要的一方面,还有一个可以尝试的方面是对数据语义的理解,挖掘数据之间的关系,进而影响数据在物理介质上的部署方式,改善存储性能。当然,做好这个工作的前提之一是需要对应用有一定的理解。未来达沃将专注于解决存储和应用的结合问题,通过应用超强的可调整性与存储进行良好的耦合,存储努力地配合应用的需求,使应用开发者可以不用过多地关注存储层面而把更多的精力放在业务层面。