在现代教育中,高效的数据管理对于学术研究至关重要。某学校采用群晖(Synology)作为实验数据的存储节点,显著提升了数据处理效率。通过优化存储架构和提高数据传输速度,该学校的数据处理效率提升了50%。这一成功案例不仅展示了群晖存储解决方案的卓越性能,还为其他教育机构提供了宝贵的经验借鉴。

客户背景

某全国重点大学,位列国家"双一流"、"211 工程"、"985 工程优势学科创新平台",入选国家建设高水平大学公派研究生项目、高等学校创新能力提升计划、高等学校学科创新引智计划、基础学科拔尖学生培养计划 2.0、双万计划、卓越工程师教育培养计划、新工科研究与实践项目、国家大学生创新性实验计划、国家级大学生创新创业训练计划、全国深化创新创业教育改革示范高校、中国政府奖学金来华留学生接收院校,为全国 16 所工科重点大学科技工作研讨会、高水平行业特色大学优质资源共享联盟成员。

面对的挑战

GPU 服务器资源管理分散,利用效率亟需提升

由于该学校信息学院自然语言处理与大数据挖掘研究室(简称"研究室")依赖 GPU 服务器进行自然语言处理(NLP)和计算机图像识别(CV)等实验,实验数据的存储和访问成为了一个关键问题。每个 GPU 服务器上只能同时运行一个实验,导致在多个学生需要同时进行实验时,必须将数据复制到其他可用的 GPU 服务器上。这不仅降低了团队的整体效率,也导致了数据重复复制和磁盘空间的浪费。 

此外,当需要对服务器进行软件和系统维护时,学生们必须先备份各自的数据,而且在维护期间无法进行实验,进一步影响了学习和研究的效率。因此,研究室团队迫切需要改进其数据存储和共享方式,以便多人能够同时访问和处理数据,减少数据重复,同时确保操作管理的便捷性,以免影响实验进程。

解决方案

搭建群晖 NAS 作为存储节点,为师生处理信息数据效率提升 50%

研究室团队于 2023 年采购群晖 RS3618xs,并配备 12 块 18TB 硬盘搭建文件服务器,作为学院 70 位师生们实验数据存储和调用。

谈及选择群晖作为实验室文件服务器的原因,华东理工大学信息学院在读博士曾健骏说到:"我们信息学院计算机系自然语言处理团队拥有 11 台高性能 GPU 服务器、以及 6 台高性能计算服务器。由于实验数据代码都存储在 GPU 服务器中,同学们在跑实验时,如果上一次实验用服务器被占用,就只能将数据复制到另一台可用服务器上,这样不仅效率降低,并且也很容易产生重复数据。群晖支持 CIFS 文件协议,我们将实验数据统一存储到 RS3618xs 上,并且将所有计算服务器用户数据目录,统一指向 RS3618xs,同学们就不用跨计算服务器进行数据代码复制。群晖作为我们的存储节点,也节省了原本分散在不同服务器上的磁盘空间,存储效率提升了 50%。"

研究室团队通过文件管理 File Station 集中管理数据代码文件,启用回收站,以及通过 Snapshot Replication 建立每日快照机制。此外为师生们创建对应的帐户和群组,也规避了数据被误删和迁移后,导致丢失或找不到的问题,同时也方便互相共享以提升交流和学习。

简化维护,搭建万兆环境高效提速读写效能

之前当学院要对服务器进行维护时,需要先将师生们各自的数据代码进行备份,并且维护周期还很漫长。群晖的文件管理操作接近电脑本地操作,直观的操作界面降低了学习成本,并且当需要进行系统升级、套件更新等,也不用逐一备份各自数据,可设定在空闲时间进行。此外,RS3618xs 通过 PCIe 扩展卡支持万兆网络,相比于原来的千兆网络提升了 10 倍速度,以参数量 70B 的大语言模型 LLAMA2 为例,在千兆网络下,读取速度为 100MB/s,需要接近 50 分钟,而群晖能提供万兆满速的 1GB/s 的读取速度,使读取时间降低至 5 分钟。不论是日常维护,还是系统效能,都比华理信息学院之前的数据存储方式提升了整体效率。

总结

通过将群晖作为该学校的存储节点,增加了计算资源分配使用的弹性,同学们在不同服务器上运行计算任务,都只需从群晖的存储空间上调取数据即可,避免以往需要排队实验、拷贝实验数据的情况,并且也降低了数据重复率。更重要的是,群晖直观的操作方式,也降低了维护难度,更不用每次维护都需要备份一次实验数据,大幅提升了我们的实验效率。