Розроблення інтелектуального застосунку для автоматизованого розпізнавання та структурування даних з PDF документів та зображень

Максимова Єлизавета Павлівна

Розроблення інтелектуального застосунку для автоматизованого розпізнавання та структурування даних з PDF документів та зображень

Files

Пояснювальна_записка_Максимова_Є_П.pdf (1.54 MB)

Date

2025-06-26

Authors

Максимова Єлизавета Павлівна

Publisher

НЛТУ України

Abstract

Бакалаврська дипломна робота містить 65 сторінок, 18 ілюстрацій, 2 таблиці, 3 додатки, 15 джерел. У роботі описано етапи розробки та впровадження інтелектуального застосунку для автоматизованого розпізнавання й структурування даних із PDF-документів та зображень. Застосунок використовує попередню обробку зображень за допомогою OCR-рушіїв (Tesseract, PaddleOCR), а також нейромережні моделі через API OpenAI та Anthropic для розуміння даних. Результати перетворюються у формат Excel із збереженням вихідного макету. Запропоноване рішення дозволяє значно скоротити час ручного введення даних і може застосовуватися в фінансових, юридичних, інженерних компаніях та дослідницьких центрах.

Keywords

автоматизоване розпізнавання даних, OCR, PDF2Image, Tesseract, PaddleOCR, OpenAI API, Anthropic API, Python, Flask, layout-parser, pandas, експорт у Excel, структурування даних

URI

http://194.44.236.27/handle/123456789/1506

Collections

Комп'ютерні науки

Full item page

Розроблення інтелектуального застосунку для автоматизованого розпізнавання та структурування даних з PDF документів та зображень

Files

Date

Authors

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Description

Keywords

Citation

URI

Collections