Розроблення інтелектуального застосунку для автоматизованого розпізнавання та структурування даних з PDF документів та зображень
No Thumbnail Available
Date
2025-06-26
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
НЛТУ України
Abstract
Бакалаврська дипломна робота містить 65 сторінок, 18 ілюстрацій, 2 таблиці, 3 додатки, 15 джерел.
У роботі описано етапи розробки та впровадження інтелектуального застосунку для автоматизованого розпізнавання й структурування даних із PDF-документів та зображень. Застосунок використовує попередню обробку зображень за допомогою OCR-рушіїв (Tesseract, PaddleOCR), а також нейромережні моделі через API OpenAI та Anthropic для розуміння даних. Результати перетворюються у формат Excel із збереженням вихідного макету.
Запропоноване рішення дозволяє значно скоротити час ручного введення даних і може застосовуватися в фінансових, юридичних, інженерних компаніях та дослідницьких центрах.
Description
Keywords
автоматизоване розпізнавання даних, OCR, PDF2Image, Tesseract, PaddleOCR, OpenAI API, Anthropic API, Python, Flask, layout-parser, pandas, експорт у Excel, структурування даних