Розроблення інтелектуального застосунку для автоматизованого розпізнавання та структурування даних з PDF документів та зображень

No Thumbnail Available

Date

2025-06-26

Journal Title

Journal ISSN

Volume Title

Publisher

НЛТУ України

Abstract

Бакалаврська дипломна робота містить 65 сторінок, 18 ілюстрацій, 2 таблиці, 3 додатки, 15 джерел. У роботі описано етапи розробки та впровадження інтелектуального застосунку для автоматизованого розпізнавання й структурування даних із PDF-документів та зображень. Застосунок використовує попередню обробку зображень за допомогою OCR-рушіїв (Tesseract, PaddleOCR), а також нейромережні моделі через API OpenAI та Anthropic для розуміння даних. Результати перетворюються у формат Excel із збереженням вихідного макету. Запропоноване рішення дозволяє значно скоротити час ручного введення даних і може застосовуватися в фінансових, юридичних, інженерних компаніях та дослідницьких центрах.

Description

Keywords

автоматизоване розпізнавання даних, OCR, PDF2Image, Tesseract, PaddleOCR, OpenAI API, Anthropic API, Python, Flask, layout-parser, pandas, експорт у Excel, структурування даних

Citation