浪潮分布式存储:元数据检索的四大优势
2022-08-13 08:59:21爱云资讯阅读量:692
随着经济社会加速数字化转型,大数据、云计算、人工智能、区块链等新一代信息技术快速兴起,智慧政务、金融科技、智慧交通、远程教育、智慧医疗等应用加速落地,办公文档、图片、视频、音频、设计文档、日志文件、机器数据等非结构化数据爆发式增长,企业和组织愈发重视海量非结构化数据的管理与应用。如何依靠底层技术让海量非结构化数据的管理和使用更简单?无处不在的元数据给出了答案。
什么是元数据?
元数据是关于数据的数据,人们身边的一切信息和资源都可以用数据来描述,元数据则是从数据资源中抽取用来说明其特征和内容的结构化数据,用于组织、管理、保存、检索信息和资源。虽然人们看不见元数据的存在,但它却无时无刻不伴随左右。人们平时所津津乐道的大数据,也是基于元数据来计算的。
企业和组织可以基于元数据对海量非结构化数据进行管理,例如获取后缀名为jpeg的所有图片文件列表、获取文件大小大于10M的文件列表、获取给定日期之前创建的文件列表,在快速获取符合条件的文件之后还可以高效管理对应的数据。而如何更方便快捷地查找到非结构化的文件成为分布式存储面临的全新挑战。
传统检索方式较为简单粗暴,难以应对文件多、目录层次深、检索条件复杂等挑战。例如Linux中的find查找,对象存储中的前缀检索,都只能遍历所有文件进行筛选,功能上不能满足多样化的检索需求,检索字段有限,检索方式单一;还有性能上也影响了底层元数据管理服务的检索能力和检索效率。
浪潮分布式存储基于对元数据检索的研究,在分布式存储平台AS13000上进行技术创新,在对象、文件、大数据三大非结构化存储场景,研发了元数据检索功能,支持对文件名称、路径、类型、大小、自定义元数据、创建时间、修改时间、用户(组)、桶等关键字段进行检索,以及支持基础检索和逻辑关系自定义等高级检索功能。百亿级文件,可以进行亚分钟级检索。
浪潮分布式存储:元数据检索的四大优势
浪潮分布式存储AS13000元数据检索能够同时兼容对象、文件、大数据三大非结构化存储场景,引入Elasticsearch作为元数据检索引擎,支持NFS、CIFS、S3、Swift、HDFS协议。
元数据检索
Elasticsearch是一个可扩展的RESTful风格的分布式数据检索和分析引擎,它能够快速且近实时地存储、检索、分析海量数据,通常用作具有复杂检索应用的底层引擎。
分布式存储+Elasticsearch,即为浪潮分布式非结构化存储AS13000元数据检索的核心。
文件的元数据信息会同步至Elasticsearch引擎中,基于此,企业的元数据检索命令通过协议转换,在Elasticsearch中检索出符合要求的文件信息。
比如,浪潮分布式存储具有更全面的协议支撑。浪潮分布式存储AS13000能够同时支持NFS、CIFS、S3、Swift、HDFS协议进行检索;同时支持企业自己的RESTful风格访问程序进行自定义元数据信息检索;
又如,具备更灵活便捷的检索方式。基于上述的结构,浪潮分布式存储AS13000实现了更为丰富的检索手段和快捷的检索速度,对数据存储本身的读写影响更小。浪潮存储支持的检索内容包括两个方面,其一,丰富的检索字段,包括文件名称、路径、类型、大小、创建时间、最后修改时间、用户名、用户组名、桶名,以及用户自定义的元数据信息,都可以作为检索字段。其二,多样的检索逻辑,支持大于、大于等于、小于、小于等于、不等于、等于等算术比较运算符,逻辑支持“并且”、“或者”等逻辑运算符。企业可以根据需求在检索界面上进行检索式的组装,且检索结果支持分页展示。
再如,更安全的元数据保护。为了保护企业的元数据信息,避免非法的RESTful请求恶意获取Elasticsearch中的元数据信息,浪潮分布式存储AS13000同时针对Elasticsearch进行了安全限制,针对Elasticsearch提供数据流加密,同时基于角色进行访问安全校验,保障元数据信息的网络安全。
最后,更便捷的对接方式。浪潮分布式存储AS13000不仅能够提供元数据检索服务,同时能够轻松对接企业的Elasticsearch引擎。如果企业原本就有元数据检索引擎,则可以直接部署浪潮分布式存储,对接企业的Elasticsearch,不需要企业更改原本的检索手段,实现无缝切换。
浪潮存储
具备元数据检索功能的浪潮分布式存储AS13000,已经在金融、通信、教科研、医疗等行业规模部署,为企业提供更简单、更丰富、更便捷的元数据检索方式,让企业轻松应对数字经济时代的海量数据挑战。
相关文章
- 开辟大模型更多应用场景 浪潮云洲“知业大模型“加速赋能千行百业
- 浪潮KaiwuDB亮相第二十四届中国国际工业博览会
- 浪潮云海再破SPEC Cloud IaaS基准测试记录,三项指标领跑
- 企业大模型应用开发提速 浪潮信息发布元脑企智EPAI一体机
- 浪潮信息Infinistor:高效运维引擎,驱动企业数据价值最大化
- 专业赋能中网赛场:FILA重磅功能科技发布,引领网球装备新浪潮
- 浪潮KaiwuDB 宣布将开源版 KWDB 数据库捐赠给开放原子开源基金会
- MR头显市场将迎来41.4%爆发增长,Snap/微美全息引领AR+AI全新体验浪潮
- AI浪潮下,中小企业的增长之路——2024云栖大会上或许有答案
- 企企通联合创始人杨华:AI的浪潮下,未来供应链发展将何去何从?
- 业务与AI迎来黄金交叉点 恒为科技全方位拥抱AI浪潮
- 液气换热型液冷数据中心首个技术标准发布,浪潮信息牵头编制
- 浪潮信息:元脑企智EPAI助力金融大模型快速落地
- AI驱动智慧办公革新浪潮,微软/阿里/微美全息加速数字办公垂直领域领航
- 华为坤灵京东自营官方旗舰店开业 双方携手助推企业数智化浪潮
- 阿里云、字节、浪潮信息、英特尔、电标院: OpenBMC是服务器固件大势所趋