Время советское. Архив региональной прессы советского периода (1946-1991)
"Время советское: региональная городская пресса советского периода, 1946-1991" - научно-образовательный ресурс, созданный в 2015 г. силами сотрудников Центра социально-гуманитарной информатики БФУ им. И.Канта при активном участии студентов магистратуры «Public History: историческая информатика и медиа-технологии в истории».
Создание проекта
Функциональные особенности
Создание проекта
В основу информационной составляющей ресурса положен электронный архив региональной газеты Калининградская правда 1946-1991 гг. (глобальная оцифровка всего массива выпусков советского периода). Газеты были оцифрованы при помощи специального оборудования (планетарного сканера BookEye-3) в формате JPEG с разрешением 600 dpi и минимальным сжатием (размер имиджа одной полосы ок. 5 Мб).
Для обеспечения доступа к электронному архиву через интернет был создана копия массива оцифрованных газет полностью идентичная основному набору изображений, однако разрешение копии было понижено до 150 dpi, которое является достаточным для разметки и чтения.
Источниками для оцифровки послужили фонды Государственного архива Калининградской области и архивы редакции газеты «Калининградская правда». В результате оцифрован полный объем выпусков газеты за период 1946-1991 гг, включая сдвоенные номера и приложения.
Функциональные особенности
С учетом особенностей издания была разработана информационная система, ориентированная на работу в сети Интернет. База данных разработана в формате MySQL. Система имеет следующие модули:
Модуль импорта данных. Позволяет импортировать изображения и получать их первичные описания из имен файлов.
Модуль управления правами пользователей. Позволяет управлять доступом к функционалу сайта для пользователей, которым присвоены различные роли (права). В частности, незарегистрированный пользователь может получить доступ только к размеченным выпускам газеты. Редактор видит неразмеченные номера и может производить их разметку или проверять работу других редакторов. Администратор имеет доступ ко всем разделам системы, включая управление пользователями. Кроме того, администратор управляет механизмом импорта новых изображений в систему.
Модуль разметки. Модуль позволяет в графическом режиме размечать фрагменты газетной полосы и сопоставлять им соответствующие описания. Этот модуль использует предлагаемые шаблоны таксономии, но так же позволяет вводить расширенные описания. Модуль разметки предоставляет возможность представлять фрагменты, расположенные на разных полосах, как одну статью. Такой функционал необходим в случае обработки больших статей.
Модуль вывода информации. Позволяет просматривать архив по номерам и постранично внутри номера. Позволяет просматривать и масштабировать изображение газетной полосы и отдельных статей. Выводит список размеченных статей активного номера газеты. Модуль вывода позволяет быстро производить извлечение фрагмента статьи из изображения газетной полосы и выводит его на экран. Модуль поиска. Модуль обеспечивает возможности поиска и фильтрации. Позволяет выполнять поиск по ключевым словам, аннотациям и полным текстам статей. Позволяет фильтровать статьи по рубрикам, авторам и т.д.
Система написана на языке PHP и JavaScript. Программный продукт является уникальной разработкой, выполненной в ходе реализации проекта. Возможность получать фрагменты с изображениями статей в момент обращения пользователя, позволяет в любое время вернуться к изображению всей газетой полосы и, в то же время, минимизирует интернет трафик и занимаемое место на носителях серверной площадки. По функционалу, скорости работы, возможности масштабирования данный программный продукт не имеет аналогов в России.