Amazon Textract Especializado2018年〜
Servicio de ML que extrae automáticamente texto, escritura a mano y datos de documentos escaneados
Qué hace
Amazon Textract es un servicio de OCR que extrae automáticamente texto, estructuras de tablas y pares clave-valor de formularios de imágenes escaneadas y PDFs. A diferencia del OCR tradicional que solo reconoce posiciones y caracteres de texto, Textract comprende las estructuras de filas/columnas de tablas y las relaciones etiqueta-valor de formularios.
Casos de uso
Se utiliza para extraer datos de facturas y recibos, procesamiento automatizado de contratos, lectura de información de documentos de identidad, digitalización de registros médicos y autocompletado de documentos fiscales.
Analogía cotidiana
Se puede comparar con un asistente de oficina hábil. Al entregarle un documento en papel, no solo lee el texto, sino que comprende las estructuras de las tablas, identifica correctamente el nombre escrito en el campo "Nombre" y lo ingresa en la base de datos.
¿Qué es Textract?
Amazon Textract es un servicio de IA que extrae datos de documentos automáticamente. Toma imágenes o PDFs almacenados en S3 como entrada y devuelve texto, tablas y datos de formularios en formato estructurado. También admite reconocimiento de escritura a mano, procesando tanto documentos impresos como manuscritos.
Funciones de extracción
Textract ofrece múltiples capacidades de extracción. DetectDocumentText extrae líneas y palabras de texto. La función Tables de AnalyzeDocument reconoce estructuras de filas/columnas de tablas. La función Forms extrae pares etiqueta-valor de formularios. Queries extrae respuestas a preguntas en lenguaje natural de los documentos. AnalyzeExpense se especializa en la extracción de recibos y facturas. Para ejemplos reales y mejores prácticas sobre funciones de extracción, los libros relacionados (Amazon) son una referencia útil.
Cómo empezar
Pruebe las funciones con documentos de ejemplo en la consola de Textract. Suba un documento a S3 y llame a la API AnalyzeDocument mediante el SDK de AWS para obtener resultados de extracción en formato JSON. Para procesar grandes volúmenes de documentos, use la API asíncrona (StartDocumentAnalysis).
Aspectos a tener en cuenta
- La precisión de extracción depende de la calidad del documento (resolución, contraste). Los escaneos de baja calidad pueden reducir la precisión
- Pago por uso basado en el número de páginas y las funciones utilizadas (extracción de texto, análisis de tablas, Queries, etc.)