Amazon HealthLake
安全存储、转换和分析 FHIR 合规医疗数据的全托管服务,加速医疗机构的数据湖构建
概述
Amazon HealthLake 是一项提供符合 HL7 FHIR R4 (Fast Healthcare Interoperability Resources) 规范的医疗数据存储的全托管服务。将电子病历 (EHR)、保险理赔数据、临床试验数据等统一作为 FHIR 资源存储,实现自然语言处理的非结构化数据结构化、时间线形式的患者数据可视化、机器学习模型的预测分析。作为 HIPAA 适格服务,标准配备受保护健康信息 (PHI) 的加密和访问控制。
FHIR 数据存储与互操作性
HealthLake 的数据存储完全基于 FHIR R4 规范,支持 Patient、Observation、Condition、MedicationRequest 等所有 FHIR 资源类型。通过 RESTful API 执行 CRUD 操作,可使用 FHIR 搜索参数进行复杂查询。不同医疗系统间的数据交换以 FHIR Bundle 形式进行,实现互操作性。从现有系统 (HL7 v2、C-CDA 等旧格式) 迁移时,可使用 AWS 提供的转换工具或自定义 Lambda 函数转换为 FHIR 格式后导入。
自然语言处理与数据增强
HealthLake 集成的 NLP 功能可自动从非结构化临床文本 (诊疗记录、出院摘要、病理报告) 中提取医学实体 (疾病名、药物名、检查值) 并映射到标准医学术语 (ICD-10、RxNorm、SNOMED CT)。提取的信息自动作为 FHIR 资源结构化并存储到数据存储中。这使得以往仅以自由文本存在的临床信息变得可检索和可分析。结合 Comprehend Medical 可进一步提取否定表达 (「无糖尿病」) 和时间关系 (「3 天前开始」) 等细微语义。
分析与机器学习集成
HealthLake 的数据可导出到 S3 以 NDJSON 格式供分析使用。通过 Athena 执行 SQL 查询进行队列分析、通过 QuickSight 创建临床仪表板、通过 SageMaker 构建预测模型 (再入院风险、疾病进展预测) 等用例。导出数据保持 FHIR 资源结构,可利用 FHIR 路径表达式进行复杂数据提取。定期导出计划可自动将最新数据同步到分析环境。去标识化导出功能在导出时自动删除个人信息,可安全地用于研究目的的数据共享。