Автоматизированная система реставрации текстовых документов Муромского историко-художественного музея




Скачать 121.73 Kb.
НазваниеАвтоматизированная система реставрации текстовых документов Муромского историко-художественного музея
Дата публикации21.09.2013
Размер121.73 Kb.
ТипДокументы
www.lit-yaz.ru > История > Документы
Автоматизированная система реставрации текстовых документов Муромского историко-художественного музея

Канунова Екатерина Евгеньевна

ассистент кафедры «Информационные системы»

Муромский Институт Владимирского Государственного Университета

Адрес: 602200, Муром, Владимирской обл. ул. Энгельса д. 15 кв. 90.

Тел: (809234) 35963

E-mail: asp_kat@rambler.ru

Музеи, библиотеки и архивы являются одним из наиболее оптимальных для нас источником просвящения по истории и культуре нашей страны, - в них хранятся исторически значимые документы и ценности, начиная с предметов быта народов различных культур и периодов, и, заканчивая величайшими шедеврами изобразительного, театрального, музыкального и других видов искусства. И практически каждый из нас является прямым или косвенным потребителем деятельности учреждений этого типа. Несмотря на это, в настоящее время значительно сократилось государственное финансирование как учреждений образования, так и учреждений культуры. Поэтому большинство музеев и архивов, в особенности малых, не могут обеспечить надлежавшую для них сохранность, распространенность и систематический учет своих фондов. Использование современных технологий и сети Интернет в музеях и архивах, конечно же, позволит решить частично эти вопросы, и обеспечит вполне достаточный объем публикаций хранимых материалов с целью их предоставления широкому кругу пользователей. В РФ задаче цифровой реставрации исторических ценностей не уделяется должного внимания, и здесь особое значение имеет решение вопроса реставрации исторических документов, так как вследствие длительного хранения, они приобрели значительные дефекты, которые снижают уровень информативности. Создание страховых цифровых копий и цифровая реставрация музейных и архивных документов позволит сделать более доступным их использование широкому кругу людей в настоящее время, а значит – более качественное представление информации и их сохранение для будущих поколений.

Автоматизированная система реставрации текстовых документов является частью системы оперативного управления информационными ресурсами Муромского историко-художественного музея (СОУИР), которая состоит из следующих подсистем:

  1. Подсистема «Фонды»1;

  2. База видеоданных;

  3. Подсистема реставрации материалов фонда рукописей и старопечатных книг.

  4. Подсистема реставрации материалов фонда фотографии;

  5. Подсистема «Библиотека».

Структура системы оперативного управления информационными ресурсами представлена на рисунке 1. Подсистема «Фонды» предназначена для хранения информации о музейных фондах, и для учета их движения внутри и вне музея. Фонды Муромского музея насчитывают около пятидесяти пяти тысяч экспонатов, которые хранятся в таких коллекциях, как коллекции дерева, фарфора, драгоценного металла, ткани, рукописных, старопечатных книг, коллекциях фотографии, археологических раскопок, филокартии. Сюда могут входить все данные о музейном предмете, учетные документы – акты приема музейного предмета на хранение, акты внутримузейной и временной передачи, акты списания, топографические описи, карточки и научные паспорта предметов.

Подсистема обеспечивает:

- ведение сквозного учета приема, выдачи и движения музейных предметов, оформление всей учетно-хранительской документации музея (актов приема и выдачи);

- ведение книг поступления, временного хранения, и инвентарных;

- проведение сверок музейных коллекций;

- хранение информации о музейных коллекциях, включающую текст и изображения (картотеки произведений, авторов, выставок, литературы; терминологические и тематические тезаурусы);

- быстрый поиск и выборку данных по различным атрибутам и их сочетаниям;

- подготовку инвентарных карточек, научных паспортов, различных видов списков и каталогов;

- формирование выходных документов в виде Word и Excel файлов для обеспечения дальнейшего их хранения и использования;

- ведение топографических описей предметов;

- подготовку данных для статистических отчетов;

- подготовку электронных интерактивных публикаций в формате HTML;

- формирование сводных музейных баз данных с открытым доступом из Интернет, сопряженных с Интернет-каталогами.

Подсистема реализована по архитектуре «клиент-сервер», за счет которой значительно снижается сетевой трафик и требования к вычислительным мощностям компьютеров-клиентов. Система выполнена в виде отдельной программы, устанавливаемой на компьютерах-клиентах, и работает без каких либо дополнительных настроек операционной системы. Система обладает понятным и простым интерфейсом, доступным для начинающего пользователя. В тоже время система защищена от каких-либо неправильных действий со стороны оператора, могущих повлечь за собой потерю данных или их порчу. Возможности программы позволяют обходиться без сетевого администратора, все записи и операции проводятся непосредственно пользователем – хранителем фондов и работником сектора учета, что при достаточно малом штате отдела учета и хранения фондов (7 человек) немаловажно. База данных содержит полную информацию по фондовым единицам, согласно полям книги КП, по форме, установленной инструкциями Министерства культуры 1984г.

База данных независима от разработанной системы и может храниться в любом месте сети (на любом автоматизированном рабочем месте). В данном случае для хранения базы данных выделяется специальный сервер баз данных.

Доступ к базе данных настраивается из разработанной системы, с учетом прав конкретного пользователя или группы пользователей.

В состав подсистемы входит группа АРМов музея (хранитель, издательский отдел, выставочный отдел) и группа серверов (Интернет-сервер и сервер баз данных). Для функционирования подсистемы «Фонды» рекомендуется следующее аппаратное и программное обеспечение:

1. Сервер баз данных – минимум Pentium 2 266, RAM 64Mb, HDD 40Gb, ATAPI CD-ROM 24x. Операционная система Windows 2000, NT, XP. СУБД – Interbase 6.0 или FireBird.

2. Рабочие станции сотрудников музея Pentium 166, RAM 32Mb, HDD 10Gb, ATAPI CD-ROM 24x. Операционная система Windows 98, 2000, XP. Interbase Client 6.0.

Необходимость в разработке базы видеоданных заключается в потребности хранения и передачи больших объемов данных различного типа и формата, представлению информации из фондов музея широкому кругу пользователей. Здесь под видеоданными понимаются электронные копии музейных предметов, в частности предметов из фонда фотографий и фонда рукописных и старопечатных книг. Практикуемые в архивах и музеях способы хранения таких данных основываются на составлении текстовых описаний, которые не являются неотъемлемой частью рукописей и фотодокументов, а хранятся отдельно и лишь сопоставлены им с помощью системы шифров или нумерации. Это потенциально угрожает целостности информации. Разработка базы видеоданных позволяет объединить текстовую и графическую информацию в единую многоуровневую систему. База видеоданных (БВД) предназначена для автоматизации деятельности хранителей коллекций редкой, старопечатной и печатной книги и коллекции фотографий. БВД разрабатывается для хранения как самих изображений музейных предметов, так и сопутствующей информации к ним. Сопутствующая информация разделяется на описание характеристик цифровых копий (изображений) музейных предметов и на описание самих музейных предметов.

В организации базы видеоданных используется подход, основанный на использовании трехуровневой модели организации и хранения видеоданных:

1. Изображения хранятся в локальной памяти автоматизированного рабочего места;

2. Централизованное краткосрочное хранение текущих исследований и связанных изображений;

3. Высокоемкостное, с медленным доступом долгосрочное хранение изображений.

Все компоненты БВД взаимодействуют между собой посредством системного архива. Системный архив используется при регистрации музейного материала. Он служит хранилищем информации для музейного материала, а также содержит физические параметры файла архивного материала. При регистрации файла музейного материала в системном архиве, материал регистрируется на одном или нескольких уровней БВД. Временный архив представляет собой хранилище файлов изображений музейных материалов. Постоянный архив используется для регистрации файла музейного материала на CD носителе. Это делается с учетом дальнейшего восстановления архивного материала, после сбоя, а также уменьшения размера БВД, за счет удаления из временного архива двоичных данных. Постоянный архив хранит ссылки на CD носители, на которых записаны (с помощью программ записи CD дисков) файлы архивных материалов. Архив пользователей предназначен для идентификации всех пользователей БВД, то есть основная его функция – защита информации от несанкционированного доступа.

Приложение для работы с базой видеоданных состоит из серверной и клиентской части и дополнения к сайту МИХМ.

Серверная часть приложения представляет собой запушенную в фоновом режиме приложение, основной задачей которого является обеспечение централизованного доступа к БВД посредством BDE. На компьютере-сервере устанавливаются: Firebird Server, BDE Administrator и утилита OSAGENT.EXE, входящая в поставляемый вместе с Delphi инструментарий VisiBroker версии 3.1.

Клиентская часть приложения представляет собой пользовательское приложение для работы с БВД. На компьютере клиента устанавливается Microsoft Word, входящий в состав пакета Microsoft Office. Программа клиент выполняет следующие функции:

1. Регистрация новых пользователей;

2. Изменение прав пользователей;

3. Удаление пользователей;

4. Регистрация изображения в системном архиве;

5. Регистрация изображения во временном архиве;

6. Регистрация изображения в постоянном архиве;

7. Восстановление изображения из временного архива;

8. Восстановление изображения из постоянного архива;

9. Изменение системного архива;

10. Изменение постоянного архива;

11. Удаление изображения из БД;

12. Генерация отчетов в Microsoft Word;

13. Просмотр каталога изображений;

14. Поиск материалов по нескольким критериям;

15.Работа со множеством входных форматов файлов (bmp, tiff, jpeg).

Дополнение к сайту МИХМ выполняет функции просмотра каталога архивных материалов и поиска архивного материала. Для функционирования сайта предусмотрена установка виртуального web- сервера Apache и скрипт языка PHP.

Еще одним немаловажным вопросом является разработка методов и алгоритмов цифровой реставрации материалов из фонда фотографий и рукописных и старопечатных книг. Данную функцию выполняет подсистема автоматизированной реставрации. Разработка базы видеоданных дает возможность хранения, учета и передачи электронных копий таких фондов, при этом сами фонды будут находиться в безопасности. Основной смысл хранения исторических материалов – это сохранение информации об истории Муромского края, его традициях. Так, например, рукописный и старопечатный фонд содержит огромный массив разноплановой текстовой информации, в которой отражается вся история и быт Мурома и Муромского края. В результате длительного хранения этих фондов, многие рукописи и старопечатные книги приобрели разнообразные дефекты, такие как потеря контраста между штрихами текста и фоном, пятна различной природы и различного происхождения, что является следствием потери информативности этих материалов. Подсистема автоматизированной реставрации предназначена для устранения различных видов дефектов и удовлетворяет следующим требованиям:

1. Подсистема имеет удобный и наглядный интерфейс;

  1. Позволяет обрабатывать полутоновые изображения архивных текстовых документов (АТД) любого размера и формата (bmp, jpg, tiff);

  2. Подсистема работает в двух режимах – автоматическом и автоматизированном;

  3. Осуществляет обработку, как всего изображения АТД, так и любого его фрагмента;

  4. Выполняет устранение основных видов дефектов на изображениях АТД;

  5. Производит анализ АТД на наличие дефектов;

  6. Алгоритмы устранения дефектов АТД дают вполне корректные результаты с минимальным числом вводимых оператором параметров (подбор параметров должен производиться путем машинного анализа изображений);

  7. Алгоритмы реставрации требуют минимального времени обработки изображений АТД2.



В состав прикладного программного обеспечения подсистемы автоматизированной реставрации АТД входят 7 модулей, содержащих 52 подпрограммы, реализующие алгоритмы устранения различных дефектов текстовых изображений и сервисные функции:

- программы восстановления контраста на изображениях текстовых документов;

- программы статистического анализа изображений и дефектов, осуществляющие вычисление гистограммы изображения текстового документа и их параметров, расчет статистических характеристик изображения и дефекта;

- программы автоматического выделения на изображении локальных дефектов, которые осуществляют обнаружение объектов с заданными признаками и их устранение;

- программы диалоговой работы с изображениями текстовых документов, служащие для выделения произвольных линий, областей, отдельных элементов с целью преобразования выделенных фрагментов (статистического анализа, устранения дефектов путем аппроксимации их элементами из граничной области, повышения контраста, сегментацией; программы выделения полезной информации (в частности, штрихов текста) путем системы опорных точек;

- программы геометрического преобразования изображений текстовых документов: зеркального отображения, поворота, транспонирования, совмещения частей изображения с помощью аффинных преобразований.

В состав технических и программных средств системы входят: персональный компьютер: процессор не ниже Intel Pentium 166, ОЗУ объемом 64 Mb и более, видеокарта, поддерживающая разрешение 800*600 и цветовую палитру High Color, наличие манипулятора типа мыши; сканер – с разрешением не меньше 300 dpi. Операционная система – Microsoft Windows XP.

Программа реализована в среде программирования Borland Delphi 6.0. Компоновка программы произведена с включением библиотек указанной среды программирования, соответственно работа программы не зависит от наличия на компьютере пользователя самой среды программирования. Объем программы – 1500 Kb3.

Последовательность этапов обработки текстовых документов с помощью автоматизированной системы реставрации:

- визуальный анализ текстового документа и его оценка;

- оцифровка текстового документа;

- машинный анализ дефектов текстового материала;

- выбор способов для устранения дефекта на изображении;

- обработка изображения текстового материала;

- контроль результатов реставрации и оценка качества реставрации;

- перевод отреставрированной цифровой копии документа на бумажную

основу.

При подготовке документа к реставрации архивом-хранителем указываются конкретные дефекты, подлежащие устранению, и те участки изображения, которые нуждаются в реставрации, что позволяет исключить субъективный подход оператора к этой работе.

После визуального анализа и оценки дефектов изображение преобразуется в цифровую форму при помощи сканирующего устройства (сканера). Анализ дефектов при помощи ЭВМ является первым этапом автоматизированной реставрации изображений. Выбор математических моделей дефектов осуществляется на основе их классификации. От степени зашумленности изображения зависит принцип реставрации – автоматический или автоматизированный. Автоматизированный метод позволяет устранять самые разнообразные дефекты (слабый контраст, пятна, складки). Однако, если на текстовом документе имеется дефект, полностью уничтожающий часть текста, то для решения вопроса по восстановлению утраченной информации необходима консультация квалифицированного работника,

специализирующегося на работе с такими текстовыми документами.

Выбор методов (алгоритмов) устранения дефектов является одним из наиболее ответственных этапов, от него непосредственно зависит результат реставрации.

Одним из подходов к выбору метода устранения дефекта является пробная обработка сначала небольшого характерного участка изображения и анализ результатов обработки. При удовлетворительном результате выбранный метод применяется ко всему изображению.

Если используемые программы оказались малоэффективными, то следует вернуться к этапу выбора методов и алгоритмов устранения дефектов. Или производится дополнительная (повторная) обработка изображения текстового документа с учетом уже полученных результатов.

Обратное преобразование оцифрованного текстового документа в документ на бумажной основе производится с помощью устройства вывода изображений (принтер) по достижении удовлетворительных результатов процесса реставрации.

В заключение следует заметить, что исследование разработанных алгоритмов устранения дефектов на тестовых и реальных изображениях АТД показало, что они хорошо решают задачи реставрации, и созданная подсистема автоматизированной реставрации является удобным инструментом восстановления АТД фонда редких рукописных и старопечатных книги, хранимых в музеях. С использованием разработанной подсистемы реставрации АТД в настоящее время отреставрированы наиболее ветхие страницы из 7-ми старопечатных и рукописных книг 16-ого и 17-ого в.в.; 10-ти старопечатных и печатных книг 18-ого века; 6-ти рукописных и старопечатных книг 19-ого века и 22 документа конца 19-ого, начала 20-ого веков фонда рукописных и старопечатных книг Муромского историко-художественного музея.

Список литературы

  1. Канунова Е.Е., Тюрина Е.К Автоматизированная система учета фондов – теория и практика.. Материалы шестой международной конференции ЕВА’2003. – М.: ГТГ. 2003. С. 4.11-4.12.

  2. Канунова Е.Е., Садыков С.С. Дефекты рукописных архивных документов и возможные методы их устранения. Обработка информации: методы и системы: Сборник научных статей/ Под ред. Садыкова С.С., Андрианова Д.Е. – М.: Горячая линия – Телеком, 2003 г. – 231 с. (с. 9 - 12).

  3. Канунова Е.Е., Садыков С.С. Автоматизированная система учета и реставрации архивных рукописных материалов Муромского историко-художественного музея. Материалы седьмой международной конференции ЕВА’2004 (http://conf.cpic.ru/eva2004/rus/reports/report_126.html).

Добавить документ в свой блог или на сайт

Похожие:

Автоматизированная система реставрации текстовых документов Муромского историко-художественного музея iconУрок. Оценка количественных параметров текстовых документов
Электронные образовательные ресурсы презентация «Оценка количественных параметров текстовых документов» из электронного приложения...

Автоматизированная система реставрации текстовых документов Муромского историко-художественного музея iconК проекту по дисциплине "Технологии программирования" на тему "Автоматизированная...
Автоматизированная система поиска оптимального пути на карте города по заданному критерию

Автоматизированная система реставрации текстовых документов Муромского историко-художественного музея iconАвтоматизированная система планирования объёмов продаж на основе прогнозирования спроса
На тему: Автоматизированная система планирования объёмов продаж на основе прогнозирования спроса

Автоматизированная система реставрации текстовых документов Муромского историко-художественного музея iconТехническое задание на разработку Системы
Автоматизированная система управления снабжением воздушных судов и мониторинга процессов

Автоматизированная система реставрации текстовых документов Муромского историко-художественного музея iconГост 24. 301-80* общие требования к выполнению текстовых документов
Постановлением Государственного комитета СССР по стандартам от 14 мая 1980 г. №2101 срок введения установлен

Автоматизированная система реставрации текстовых документов Муромского историко-художественного музея iconБольшинство учащихся не в полной мере владеют техникой решения текстовых...
Полный минимум знаний, необходимый для решения всех типов текстовых задач, формируется в течение первых девяти лет обучения учащихся...

Автоматизированная система реставрации текстовых документов Муромского историко-художественного музея icon15. Уроки алгебры Кирилла и Мефодия,10-11 класс
МАрк sql. Автоматизированная информационно-библиотечная система. Версия для школьных библиотек

Автоматизированная система реставрации текстовых документов Муромского историко-художественного музея iconМбоу комсомольская сош №1 Историко – краеведческий музей «Исток»
В. С. Помещение увеличили до 36 кв м, руководителем музея стала Белухина Н. С., психолог школы. Руководитель музея с 2007-08 уч года:...

Автоматизированная система реставрации текстовых документов Муромского историко-художественного музея iconПрактическая работа. Редактирования текста
Цели раздела: изучение основных понятий и правил работы с текстовым редактором, а также овладение практическими навыками создания...

Автоматизированная система реставрации текстовых документов Муромского историко-художественного музея iconРасписание» Автоматизированная информационно аналитическая система «аверс:
Смыкалов П. Ю., канд техн наук, член Европейской Рабочей группы по Автоматизированному составлению Расписаний, Санкт-Петербург



Образовательный материал



При копировании материала укажите ссылку © 2013
контакты
www.lit-yaz.ru
главная страница