Алгоритми та програмне забезпечення для нормоконтролю наукових та технічних текстових документів
DOI:
https://doi.org/10.15276/aait.06.2023.21Ключові слова:
стиль MS Word, аналіз тексту, аналіз документу, нормоконтроль документів, doc, docxАнотація
У роботі надано вирішення задачі перевіряння оформлення (форматування) наукових та технічних документів на дотримання вимог нормативних документів (задачі нормоконтролю документів). В основу перевірки покладено аналіз стилів текстового редактора Word, які використовуються для оформлення абзаців досліджуваного документа. Для кожного елемента документа (заголовків, анотацій, основного тексту, рисунків, підписів під рисунками, списком літератури ті інших) було розроблено еталонний стиль їхнього оформлення. Разом ці стилі утворюють набір дозволених стилів. Наборів дозволених стилів може бути багато, для кожного видання – свій набір стилів. Доступ до кожного з наборів має тільки адміністратор, який може створювати нові стилі, нові набори та редагувати як окремі стилі, так і окремі набори. З огляду на особливості аналізу стилів документ розглядається як об’єднання колонтитулів та основного тексту документу. Для такої структури документу було розроблено алгоритми його нормоконтролю: алгоритм аналізу колонтитулів, алгоритм аналізу абзаців основного тексту, а також алгоритм оновлення налаштувань стилів адміністратором. Для реалізації алгоритмів програмним способом було використано технології .Net, WPF, DocumentFormat.OpenXml. Використання DocumentFormat.OpenXml дозволяє аналізувати стилі в документах формату .doc/.docx, розроблена програма приймає на вхід файли формату .doc чи .docx і аналізує їх на відповідність заданим стилям. Результат аналізу повертається у форматі .txt чи .doc/.docx, із зазначенням виявлених відхилень від еталонів. Файл формату .txt представляє собою перелік знайдених відхилень, а у файлах форматів .doc/.docx відхилення фіксуються у вигляді коментарів до початкового тексту. Використання програми спрощує процес перевірки документів, дозволяє визначити всі відхилення від еталонів та знизити витрати часу та ресурсів на виконання нормоконтролю. Для розробки інтерфейсу користувача було використано технології .Net та WPF. Розроблену програму було перевірено в процесі нормоконтролю пояснювальних записок реальних бакалаврських та магістерських кваліфікаційних робіт. Було визначено час аналізу стилів, час не перевищує 3 с. Розроблена програма може бути корисною для автоматизація процесу нормоконтролю документів, забезпечення якості та дотримання стандартів оформлення наукової та технічної документації, наукових та технічних видань, і, в першу чергу, у навчальному процесі для нормоконтролю бакалаврських та магістерських кваліфікаційних робіт, а також різноманітних студентських звітів.