Amazon Textract 热门2018年〜

从文档中自动提取文本、表格和表单数据的 AI 服务

阅读约需 1 分钟最后更新： 2026-03-22

它能做什么

Amazon Textract 是一项使用机器学习从扫描文档、PDF、图像中自动提取文本、手写文字、表格和表单数据的服务。不仅进行简单的 OCR，还能理解文档的结构（表格的行列关系、表单的键值对关系），以结构化数据形式输出。

使用场景

用于发票和收据的自动处理、身份证件的信息提取、合同文档的数字化、医疗记录的结构化、贷款申请文件的自动审核。

日常类比

可以比作能理解文档结构的超级打字员。不仅能将纸质文档转为电子文本，还能理解表格的行列关系和表单中哪个标签对应哪个值。

什么是 Textract

Amazon Textract 是一项文档分析服务。传统 OCR 只能提取纯文本，而 Textract 能够理解文档的布局和结构。例如从发票中不仅提取文字，还能识别出金额、日期、供应商名称等字段及其对应关系。支持同步 API（单页）和异步 API（多页 PDF）。

分析类型

Textract 提供多种分析类型：文本检测（提取所有文本行和单词）、文档分析（提取表格和表单的结构化数据）、费用分析（专门针对发票和收据）、身份证件分析（驾照、护照等）、贷款文档分析。Queries 功能可以用自然语言指定要提取的信息。如需深入了解文档分析的实践知识，可参考相关书籍（Amazon）。