脑数据库与信息技术平台简介

广东省智能科学与技术研究院脑数据库与信息技术平台(下称“脑数据平台”)是广东省智能院为促进脑科学研究和信息工程而建立的一套统一的脑数据资源平台,平台可提供影像、脑电、基因、临床等多模态脑数据的存储、共享、处理和分析服务,是智能院的三大支撑性技术平台之一。脑数据平台结合智能院在神经科学、分子生物学、脑机接口技术、类脑芯片技术、人工智能技术领域团队的研究经验,融合超算集群、人工智能、云计算等前沿技术,为研究院及相关合作单位提供数据和算力资源服务,致力于建设以脑和类脑科学数据资源为中心的全生命周期数据生态环境。脑数据库与信息平台主要包含以下功能:

1、脑与类脑多模态数据资源库是一套云端数据系统,可为用户提供多模态脑科学数据资源管理、查询、检索功能,可管理10PB以上规模的数据,管理和共享数百个独立的数据集。

2、生物医学数据处理系统是一套结合超算、人工智能和数据挖掘技术的云端在线分析系统,可为用户管理、计算和分析数十万例的基因组学数据。

3、类脑科学数据处理系统是一套云端数据分析系统,用户可在线分析EEG、近红外、脑磁、眼动等各类脑科学与类脑数据。

4、医学图像数据处理系统是一套支持云端可视化的图像数据分析系统,基于最先进的AI芯片和算法库,用户可实时、快速、批量化的处理和分析人脑影像、医学图像、鼠脑、猴脑等模式动物的图像。

 

具体地,脑数据平台提供以下服务:

1. 综合数据资源库

脑数据资源库采用仓库式数据管理模型,为每个数据集开设单独的存储空间(数据仓库)、设定独立的管理员队列、进行独立的共享授权审计。仓库通过Web界面以及自动化数据传输工具实现存储功能,同时还可以进行原始数据解析流程,针对数据具体模态类型,提取数据元信息、合并组织原始数据记录条目。综合数据资源库支持神经科学、生物学、类脑科学三大领域的数据,包括基因测序数据、脑电数据、蛋白结构解析数据、近红外数据、医学影像数据等多种模态。在数据仓库中,数据资源用户可以对研究被试、样本案例进行分类管理,能够对多模态原始数据进行综合整理、查询与检索。综合数据资源库还支持多种心联合研究项目等复杂形式管理结构。结合脑数据平台的3个数据处理系统,数据仓库将类型繁杂、专业性质强的原始数据、处理后的特征数据、数据处理方法整合为随时可调用、可查询的资源池,是数据的全生命周期管理的可靠基础。

 

2. 生物学数据处理系统

生物学研究的数据处理方法不断迭代更新,专业研究者需要投入许多时间在掌握新的处理方法过程中。生物学数据处理系统将前沿数据处理方法预配置为用户可直接选用的数据处理插件,让用户从代码编写、除错的过程中抽身脱离,专注于数据资源的价值发掘上。生物学数据数据处理系统提供高效的GWAS全基因组、cryo-EM电镜数据的预处理方案,也提供如AlphaFold等基于深度学习算法的预处理工具。

 

3. 类脑科学数据处理系统

类脑科学数据处理系统主要针对用于开展类脑科学研究、类脑算法应用工程开发的数据资源,包括如脑电、脑磁、眼动追踪、功能近红外等已被证明可用于开发脑机接口、训练深度神经网络的数据。类脑科学数据处理系统可以完成去噪、滤波等工作。同时,类脑科学资源库还专为类脑科学相关工作优化,在数据预处理功能、处理产生的特征数据授权共享、数据资源与AI算法的接口对接方面进行了强化,用户可以快速调用AI算力开展相关训练和验证工作。

 

4. 医学图像处理系统

医学图像处理系统支持对医学影像、显微镜图片等数据进行批量化、自动化的预处理,包括图片去噪、形变矫正、感兴趣区勾画等功能,也提供基于深度学习的图像处理算法以及对应资源。同时能够对包含用户信息的敏感数据进行脱敏处理。


脑数据库与信息技术平台