AWS HealthImaging

可大规模存储、检索和获取 DICOM 格式医学影像的 HIPAA 合规全托管存储服务

概述

AWS HealthImaging 是一项专用存储服务,用于在云端大规模存储和管理 CT、MRI、X 光等医学影像数据 (DICOM 格式)。构建在 HIPAA 合规的安全基础上,满足医疗机构的合规要求,同时以低成本保存 PB 级影像数据。通过独有压缩技术 (HTJ2K),相比传统 DICOM 存储可降低最高 40% 的存储成本,同时以亚秒级延迟获取影像。DICOM 元数据检索 API 可按患者 ID、检查日期、模态等条件快速定位影像集,提高向 AI/ML 管道供给数据的效率。

DICOM 数据存储架构与成本优势

HealthImaging 将 DICOM 数据分为像素数据和元数据分别管理。像素数据使用 HTJ2K (High-Throughput JPEG 2000) 无损压缩存储,相比原始 DICOM 文件大幅减少存储容量。元数据以结构化形式索引,支持高速检索。数据存储 (Data Store) 是管理影像集的逻辑容器,可按部门、项目或用途分离。导入作业支持从 S3 批量导入 DICOM 文件,自动解析 DICOM 标签并构建可检索索引。相比在 S3 上自行管理 DICOM 文件,HealthImaging 的优势在于:压缩带来的存储成本削减、元数据检索的高速化、以及 DICOM 标准合规的 API 接口。

与 AI/ML 管道的集成

HealthImaging 的 API 可高效向机器学习管道供给影像数据。通过 GetImageFrame API 获取单帧影像数据,可直接输入到 SageMaker 的训练作业或推理端点。按研究条件 (模态、身体部位、检查日期范围) 检索影像集后批量获取,可高效构建训练数据集。像素数据以 HTJ2K 格式返回,解码后即可作为 NumPy 数组用于模型训练。与 Lambda 结合可构建事件驱动的影像分析管道:新影像导入时触发 Lambda,调用 SageMaker 端点执行 AI 诊断辅助,将结果写回 HealthLake

合规与访问控制

医学影像包含患者个人信息 (姓名、出生日期、患者 ID 等嵌入 DICOM 标签),需要严格的访问控制和审计。HealthImaging 通过 IAM 策略控制数据存储和影像集级别的访问权限。所有 API 调用记录在 CloudTrail 中,可追踪谁在何时访问了哪个影像。KMS 加密应用于静态数据和传输中数据。去标识化功能可在导入时自动删除或替换 DICOM 标签中的个人信息,用于研究目的的数据共享。作为 HIPAA 适格服务,可在 BAA (Business Associate Agreement) 下处理受保护健康信息 (PHI)。

共有するXB!