当前医学研究进入精准医学时代,疾病诊断的分子化及医疗全周期的数字化与信息化是这一发展时期的特征,也是国际研究的热点和国家下一阶段发展布局的重点。以基因组学研究为代表的一系列分子检测技术,例如全基因组测序、外显子组测序、转录组测序、靶向捕获测序、宏基因组测序等,已被广泛应用于辅助诊断中,产生了大量的基因组层面数据,极大的推动了人类对于疾病病因的认识。大量的各类型的原始数据亟需快速分析、解读,转化为有价值信息,支持临床诊疗的决策分析。
生物医疗数据多样化、数据量大、增长速度快,有重要的研究和应用价值,需要长时间保存。如何快速调用有效数据进行应用分析、历史数据的存储成本、海量数据的计算分析、数据传输和共享等难题需要系统化的解决方案支持。
荣联科技集团作为国内领先的企业数字化服务提供商,在生物医疗行业深耕十余年,全面布局生物医疗信息服务领域,依托于研发的“存、管、算”平台,打造了一款简单高效的基因数据分析私有云平台,可提供云存储、云计算、第三方应用系统研发整合等服务,提供基于自有底层平台的行业应用。
荣联科技集团数据分析私有云平台是面向生物医学大数据的存(分布式存储系统)、管(数据管理系统)、算(超级计算系统)、用(集成生信分析应用流程)的四位一体全栈式平台,是为了满足生物信息分析对于速度、规模和智能化的苛刻需求,量身打造的高度垂直的、全栈的、专业的、架设在用户本地的生物信息分析平台,可提供完整的数据存储、数据管理、数据计算和数据特征分析等服务。
荣联科技集团数据分析私有云平台全部采用可视化操作界面,实现一站式的基因数据存储、分析和解读,帮助用户摆脱纯代码界面操作的束缚,轻松创建和运行复杂的分析流程,可以本地化部署,助力生命科学研究成果高效产出。平台独有的分布式计算技术,可支持基因数据的分析计算和数据挖掘,既可满足高度标准化的基因数据分析流程,也可简单便捷地对流程进行个性化配置。
01平台主要功能
02平台技术优势
1)智能化的分布式调度系统
以Docker容器化进行分布式计算,调度系统本身也是分布式调度,执行系统多个调度器之间负载均衡,把不同任务负载到不同调度器上,当调度队列过长时,调度系统会自动进行分裂,增加新的调度实例,从而保证负载平衡;
2)高性能计算,资源弹性扩展
平台采用并行计算模式充分调动计算资源,计算资源可弹性拓展。智能调度和作业并行机制支持批量自定义生信流程编排和数据再挖掘、统计分析,根据分析过程中的资源需求,平台快速调配计算资源,采用最优配置;
3)基于数据特征感知的数据管理系统
能针对海量非结构化数据,通过获取和追踪标准的数据特征和用户自定义数据特征,对海量数据进行高效的组织和索引,使数据管理能够不依赖于特定业务的固定表结构,灵活检索,快速发现,多维有序。通过不断增加、完善面向应用的管理功能,指引客户挖掘数据潜在价值和应用方向,最大程度盘活数据资产;
4)多层次安全防护
采用业界通用标准的安全传输协议,数据加密传输,云端数据采用AES-256加密算法进行加密存储,严格的用户权限控制、多租户数据严格隔离,完善的审计日志,符合HIPAA法案等多种监管条例。另外,支持数据多重备份,全面保障数据的完整性。
03平台特点
荣联科技集团数据分析私有云平台有效解决生物信息数据的“存”、“管”、“算”、“用”等难题外,具有生物数据感知、生物应用感知和多样化计算三大核心优势特性,能够充分利用计算和存储资源,灵活有效的解读高复杂度的生物数据关系和结构,让生物数据的价值大放异彩。
目前,荣联科技集团数据分析私有云平台已涵盖上百种生信分析工具、算法和流程,重点应用于组学科研、群体遗传、微生物、医疗诊断、医药研发等方向,累计提供超PB级的生物数据存储,超10W样本数据的计算分析,成功服务于吉因加、仁东医学、菩提慧生医学检验所等行业用户,其完整、开放、安全、智能、灵活的服务特点,获行业客户一致认可。