Перевести страницу на:  
Please select your language to translate the article


You can just close the window to don't translate
Библиотека
ваш профиль

Вернуться к содержанию

Историческая информатика
Правильная ссылка на статью:

Использование технологий управления данными при создании исторических Интернет-ресурсов

Тришин Иван Германович

Магистр истории, кафедра Исторической информатики, Московский Государственный Университет

301570, Россия, Тульская область, пос. Волово, ул. Александрова, 4А, кв. 2

Trishin Ivan

Master of History, Historical Information Science Department, Moscow State University 

301570, Russia, Tul'skaya oblast', pos. Volovo, ul. Aleksandrova, 4A, kv. 2

trishin_ivan@rambler.ru
Другие публикации этого автора
 

 

DOI:

10.7256/2585-7797.2022.2.38334

EDN:

JTFMFO

Дата направления статьи в редакцию:

26-06-2022


Дата публикации:

19-07-2022


Аннотация: В данной статье особое внимание уделяется проблеме сохранения и распространения результатов виртуальных реконструкций объектов историко-культурного наследия путем создания специализированных электронных справочников на базе конструктора веб-сайтов Wordpress. На примере справочника по виртуальным реконструкциям усадеб Подмосковья автор показывает, как с помощью современных технологий управления данными можно настроить систему таким образом, чтобы ее наполнение и администрирование проходило с наименьшими затратами времени со стороны авторов публикаций и администратора справочника. Основная проблема, решаемая такой системой - устранение необходимости ручного ввода каждой статьи и последующего одобрения публикации в ручном режиме.    Автором исследования представлена апробация использования технологий управления данными в исторических Интернет-ресурсах. Системы, представленные в статье, используются в промышленных системах управления данными, но их доступность позволяет применять их и в других сферах деятельности, в том числе в качестве вспомогательного инструмента в научном исследовании. Автоматический трансфер данных из веб-формы пользователя на новую страницу справочника значительно ускоряют задачу наполнения Интернет-ресурса. Предложенный вариант справочника создан с применением базы данных MySQL, оркестратора данных Apache NiFi и конструктора веб-сайтов Wordpress. Все перечисленные инструменты бесплатны и доступны для скачивания на их официальных страницах.


Ключевые слова:

Виртуальные реконструкции, Культурное наследие, Исторические Интернет-ресурсы, Подмосковные усадьбы, Базы данных, Wordpress, Apache NiFi, MySQL, Московская область, Источниковедение

Abstract: In this article, special attention is paid to the problem of preserving and distributing the results of virtual reconstructions of historical and cultural heritage objects by creating specialized electronic reference books based on the Wordpress website builder. Using the example of the handbook on virtual reconstructions of estates in the Moscow region, the author shows how, with the help of modern data management technologies, it is possible to configure the system in such a way that its filling and administration take place with the least amount of time on the part of the authors of publications and the directory administrator. The main problem solved by such a system is the elimination of the need for manual entry of each article and subsequent approval of the publication in manual mode.    The author of the study presents an approbation of the use of data management technologies in historical Internet resources. The systems presented in the article are used in industrial data management systems, but their availability allows them to be used in other fields of activity, including as an auxiliary tool in scientific research. Automatic transfer of data from the user's web form to a new directory page significantly speeds up the task of filling an Internet resource. The proposed version of the directory was created using the MySQL database, the Apache NiFi data orchestrator and the Wordpress website builder. All the listed tools are free and available for download on their official pages.


Keywords:

Virtual reconstructions, Cultural heritage, Historical Internet resources, Suburban estates, Databases, Wordpress, Apache NiFi, MySQL, Moscow oblast, Source studies

В последние десятилетия пространство глобальной сети стало играть в жизни людей значительную роль. Наука не отстает от этого тренда, а потому растет количество электронных научных изданий, увеличивается количество научных и научно-популярных ресурсов, которые позволяют исследователям находить нужную информацию и, реже, делиться друг с другом своими наработками. Интернет-ресурсы все чаще используются в качестве площадки для публикации результатов какого-либо исследовательского или любительского проекта, что делает эти результаты доступными для широкого круга обычных пользователей, преумножая интерес к электронным ресурсам таких проектов.

Подобные ресурсы могут формироваться как стихийно (энтузиастами и любителями) так и в организованных процессах (чаще всего в рамках грантовых проектов или иных исторических инициатив, в которых работают профессиональные историки).[1] Также во вторую категорию Интернет-ресурсов входят тематические сайты, сформированные на базе спецсеминаров[2] или спецкурсов[3] исторических факультетов. Если целью любительских сайтов чаще служит привлечение аудитории заинтересованных общей тематикой пользователей, то ресурсы профессиональных авторов становятся как публикацией результатов какого-либо проекта (пример – ресурс, посвященный реконструкции Белого города Москвы[4]), так и вспомогательным ресурсом для последующего изучения заданной проблематики (проект «Электронные ресурсы по рабочей истории России»[5]). Такие ресурсы должны формироваться по определенным правилам, позволяющим в полной мере подкрепить информацией представляемую историческую тематику.[1],[6] Но чаще всего историки зависят от профессиональных разработчиков, формирующих внешний вид сайта и его взаимодействие с системой-хостингом. При этом подобные ресурсы, как правило, содержат информацию о завершенном проекте, а потому новые данные вносятся в систему крайне редко. Тем не менее, создание масштабных Интернет-ресурсов с сотнями или тысячами страниц разнообразной информации с ручным заполнением такого количества данных потребует огромного количества человеко-часов не только на простое внесение данных, но и на верстку страниц, а потому работа над подобным проектом может затянуться.

Данная статья описывает часть проекта, посвященного трехмерным реконструкциям подмосковных усадебных комплексов и выполняемого автором предлагаемой публикации. Работа над этим проектом требует упорядоченного хранения большого количества разнородной информации: текстовые файлы, изображения, трехмерные модели, проекты визуализации и прочая техническая информация должны грамотно распределяться в системе хранения, чтобы у исследователя всегда был быстрый доступ к нужным материалам. Согласно источникам[7], в Московской области находится более шестисот бывших усадебных комплексов, преимущественно руинированных или полностью утраченных. Значительная часть объектов из этого перечня описана в различных справочниках, мемуарах и заметках, по ряду усадеб составлены проекты реконструкций, в архивах и музеях хранятся фотографии и зарисовки этих комплексов. Общее количество материалов, относящихся к данной тематике, не поддается подсчету, поскольку места их хранения разрознены, а потому работа с каждой реконструкцией требует отдельного путешествия в музеи и архивы.

Обозначенный проект компьютерных реконструкций содержит четыре примера восстановления утраченного облика усадебных комплексов в компьютерной среде. Автор исследования также пришел к идее публикации результатов работы на сетевом ресурсе, который может содержать как материалы источников, так и созданные проекты виртуальных реконструкций в различных форматах. Также существует ряд виртуальных реконструкций подмосковных усадеб, выполненных студентами кафедры Исторической информатики МГУ им. М.В. Ломоносова[8], результаты которых опубликованы в электронных журналах в виде статей, но сами модели и источники, на базе которых они были созданы, остаются у авторов работ и недоступны широкому кругу исследователей. Более того, интерес к таким работам может возникать не только у историков, специализирующихся на виртуальных реконструкциях, но и у профессиональных архитекторов, музееведов, краеведов и археологов, заинтересованных в изучении истории усадеб Подмосковья. По этой причине разрозненность результатов реконструкций является еще одной сложностью на пути к изучению русской усадьбы.

Одной из целей описываемого проекта является публикация результатов в открытом электронном справочнике усадебных комплексов Подмосковья (о разработке которого пойдет речь далее), привлечение исследователей к наполнению этого справочника, а также его поддержка после завершения проекта. В текущей статье мы разберем, как система электронного справочника может выглядеть с точки зрения рядового пользователя, участника проекта и администратора, а также опишем всю функциональную систему, на базе которой разворачивается предлагаемый ресурс.

Позиция пользователей: электронный справочник усадебных комплексов с подкрепленными ресурсами

При входе на сайт проекта обычный пользователь попадает на главную страницу с основными записями – об усадебных комплексах, их владельцах, реконструкциях и основных источниках. Каждая категория относится к одноименной рубрике, каждая рубрика разнесена в отдельный блок. В верхней части страницы пользователь может увидеть новые записи об усадьбах (рис. 1), при прокрутке страницы вниз – такие же блоки с содержимым других рубрик.

Рис. 1. Главная страница сайта с фильтром по рубрике «Усадьбы» (снимок экрана автора статьи)

Каждая рубрика имеет свой формат записи – своеобразный формуляр, унифицирующий содержание статей. Помимо пользовательского удобства единый формат необходим в технической работе сайта (об этом подробнее во второй части статьи). Меню с левой стороны от пользователя содержит поисковую строку, по которой можно найти любую страницу или запись на сайте, а также список рубрик и свежие записи без фильтров. Этим образом пользователь переходит на страницу интересующего его комплекса, видит основную информацию и изображение усадьбы, а также ссылки на все связанные с ней записи. Отличия от обычного Интернет-ресурса в данном случае минимальны.

Пользователь, имеющий доступ к внесению контента, в этом случае действует немного иначе. Для заполнения формы будущей веб-страницы ему необходимо получить у администратора логин и пароль к отдельной странице с формой. В письме от администратора пользователь получает логин и пароль и попадает на страницу с выбором таблиц (рис. 2). При нажатии на соответствующую кнопку в окне появляется форма для заполнения.

Рис. 2. Форма выбора таблиц (снимок экрана автора статьи)

К примеру, при внесении данных об усадебных комплексах, пользователю необходимо внести название комплекса, время его основания, описание, современный адрес, а также выбрать файл фотографии или добавить ссылку на изображение из открытых источников (рис. 3). После этого пользователь отправляет данные в систему и может продолжать вносить новую информацию, или перейти на сайт для просмотра полученной веб-страницы (рис. 4).

Рис. 3. Форма внесения данных об усадебных комплексах (снимок экрана автора статьи)

Данные, внесенные через форму, в нужном формате попадают на веб-страницу и размещаются в соответствии с заданным шаблоном. В случае необходимости пользователь может уведомить администратора о некорректной публикации страницы, после чего администратор вручную исправит шаблон и настроит отображение записи.

Рис. 4. Пример заполненной через форму веб-страницы (снимок экрана автора статьи)

На этом действия пользователей сайта по загрузке информации заканчиваются. Они могут пользоваться содержимым веб-страниц и скачивать необходимые файлы, если владелец информации дает разрешение на скачивание. В том случае, если разрешение не дается, данные доступны только для просмотра.

Таким образом, система позволяет пользователям добавлять контент без значительного вмешательства администратора. Подобный алгоритм действий возможен благодаря использованию современных технологий управления данными с открытым кодом. Рассмотрим, каким образом реализован данный алгоритм с технической точки зрения.

Администратор сайта: хранение и маршрутизация данных

Для размещения Интернет-ресурса необходим хостинг, который предоставит возможность хранения файловой системы и баз данных предполагаемого сайта. В данном случае хостинг не использовался, так как для разработки достаточно установить локальную виртуальную машину (операционная система, работающая на эмуляторе) и размещать сайт на этой системе с помощью ряда приложений. Для размещения описанного выше ресурса требуется ряд компонентов.

Ядро проекта – операционная система Windows или Unix-класса, различий в видимой части ресурса не выявится. В данном случае была выбрана Unix-система Ubuntu Linux, так как Linux-системы имеют бесплатные версии (к которым и относится Ubuntu), а лицензии Windows Server продаются по высоким ценам. Среда Linux является первым компонентом необходимого набора «LAMP» - Linux, Apache (веб-сервер для размещения сайта), MySQL (система управления базами данных) и PHP (язык программирования для создания веб-приложений).[9] Об установке перечисленных программ существует большое количество статей, одна из которых использовалась для подготовки сервера к установке сайта.[10]

Разработка веб-интерфейса возможна с помощью двух сценариев: написание платформы «с нуля» и использование конструктора сайтов. В случае рассматриваемого ресурса применяются оба варианта: основной справочник разрабатывается на Wordpress – системе управления сайтом с открытым исходным кодом, а веб-форма написана вручную с применением Bootstrap-стилей (специальный набор стилей CSS, используемый в большинстве современных систем) и вынесена на отдельный сайт. Данная схема необходима на случай отказа работы одного из компонентов: в случае отключения формы справочник продолжит функционировать, и наоборот. Использование Wordpress также продиктовано наличием REST API – архитектуры внешнего взаимодействия с сайтом, благодаря которой возможна программная загрузка страниц.

Компонентом, отвечающим за маршрутизацию данных в интерфейс сайта, стал Apache Nifi – веб-оркестратор потоковых данных, способный подключаться к разным хранилищам информации, модернизировать и перенаправлять данные из одного пункта в другой (ETL-процесс выгрузки (Extract), преобразования (Transform) и загрузки (Load) данных). Инструмент имеет высокий уровень гибкости, что позволяет администратору менять настройки процесса без потери значительного количества времени. Nifi, как и все перечисленные выше программы, распространяется свободно, что является несомненным плюсом для малобюджетных проектов.

Итак, при отправке данных из веб-формы (нажатие кнопки «Отправить», рис. 3) веб-страница отправляет данные формы через AJAX-код (асинхронный процесс связи браузера и веб-сервера) в базу данных MySQL, которая использует данные авторизации пользователя при загрузке информации. К полям формы добавляется автоматический идентификатор записи (id) и точное время загрузки данных в систему (рис. 5). База веб-формы отделена от основной базы Wordpress, так как ручное изменение информации в последней может обрушить веб-сайт полностью.

Рис. 5. Первые строки таблицы MySQL с данными, внесенными через веб-форму (снимок экрана автора статьи)

Таблицы, привязанные к веб-формам, постоянно проверяются с помощью оркестратора Apache Nifi. Шаг проверки установлен на 5 минут, но система позволяет настроить любое время обновления до секунды. Система состоит из семи шагов (рис. 6).

Рис. 6. Процесс Apache Nifi (снимок экрана автора статьи)

На первом этапе SQL-запрос возвращает запись, идущую первой после даты последней проверки (вносится в отдельную таблицу). Далее полученный результат разбивается на атрибуты (значение каждого поля select-запроса вносится в переменную), после чего следует проверка на наличие записей в запросе (шаг «RouteOnAttribute»). Если запрос пуст (нет новых записей), система прекращает работу до запуска следующей проверки. Если запись попадает в работу, из полученных атрибутов формируется JSON-структура (текстовый файл формата «ключ : значение») для загрузки в Wordpress, в которую подставляются данные переменных из SQL-запроса (рис. 7). На этапе «InvokeHTTP» REST-запрос отправляет JSON-файл в Wordpress, после чего последним шагом Update-запрос SQL заменяет дату последней проверки датой загрузки внесенной записи, после чего процесс повторяется.

Рис. 7. JSON-файл, сформированный в Apache Nifi (снимок экрана автора работы)

Администратор Wordpress видит справочник через консоль управления, куда выводится вся информация о состоянии сайта, список страниц и записей, а также настраивается внешний вид системы и регулируются права пользователей. В разделе «Записи» появляются внесенные из формы материалы, которым присваивается соответствующая рубрика в зависимости от таблицы, из которой они были загружены. Если администратор не хочет, чтобы вносимые данные автоматически публиковались на сайте, то ему необходимо поменять в JSON-файле Nifi строку с “status”: “publish” на “status”: “draft”, тогда записи будут загружаться в систему в виде черновиков, а решение о публикации будет принимать администратор.

Таким образом, ряд свободно распространяемых веб-приложений, которые используются множеством компаний, начиная с создателей интернет-блогов и заканчивая нефтедобывающими корпорациями, можно использовать при создании исторических Интернет-ресурсов для ускорения процессов загрузки данных и контроля над оформлением выходного материала. В рамках проекта трехмерных реконструкций подмосковных усадеб, автору удалось значительно минимизировать время поиска и встраивания необходимой информации в исследовательскую работу с помощью представленного ресурса.

Библиография
1. Бородкин Л.И. Историко-ориентированные тематические сайты: источниковедческие аспекты разработки контента // Информационный бюллетень Ассоциации «История и компьютер». № 34. 2006. С. 147-150.
2. Карагодин А.В. — Историко-ориентированный тематический сайт «Симеиз. Путеводитель по старым дачам»: этапы разработки и перспективы исследования. // Историческая информатика. – 2020. – № 1. – С. 143-157. DOI: 10.7256/2585-7797.2020.1.32009 URL: https://nbpublish.com/library_read_article.php?id=32009 (дата обращения: 01.12.2021).
3. Валетов, Т. Я. "Создание Интернет-ресурсов для историков" и "Компьютерная графика для историков": опыт чтения "технических" спецкурсов на историческом факультете / Т. Я. Валетов // Информационный бюллетень ассоциации История и компьютер. – 2006. – № 34. – С. 206-207.
4. Белый город. Виртуальная реконструкция исторического ландшафта центра Москвы [сайт] URL: http://landscape.vrmsu.ru/ (дата обращения: 01.12.2021).
5. Проект «Электронные ресурсы по рабочей истории России» [сайт] URL: http://www.hist.msu.ru/Labour/index.html (дата обращения: 01.12.2021).
6. Гарскова, И. М. Разработка исторических интернет-ресурсов: некоторые источниковедческие и методические проблемы / И. М. Гарскова // Технотронные документы-информационная база источниковедения и архивоведения : сборник научных статей: посвящается профессору В. М. Магидову в связи с 70-летием со дня рождения / Российский государственный гуманитарный университет, Историко-архивный институт. – Москва, 2011. – С. 221-235.
7. Подмосковные усадьбы. Каталог с картой расположения усадеб – М.: НП «Русская усадьба», 2018. – 408 с.
8. Бородкин Л.И., Герасимова Ю.Н. — Виртуальная реконструкция исторических усадебных комплексов: сотрудничество историков и архивистов, проектная деятельность студентов // Историческая информатика. – 2020. – № 3. – С. 103-111. DOI: 10.7256/2585-7797.2020.3.34273 URL: https://nbpublish.com/library_read_article.php?id=34273
9. Стек LAMP // IBM – Россия [сайт] URL: https://www.ibm.com/ru-ru/cloud/learn/lamp-stack-explained (дата обращения: 11.12.2021).
10. Установка LAMP в Ubuntu // Losst [сайт] URL: https://losst.ru/ustanovka-lamp-ubuntu-16-04 (дата обращения: 11.12.2021
References
1. Borodkin L.I. History-oriented thematic sites: source study aspects of content development // Newsletter of the History and Computer Association. No. 34. 2006. P. 147-150.
2. Karagodin A.V. — Historical-oriented thematic site “Simeiz. Guide to old dachas”: development stages and research prospects. // Historical informatics. - 2020. - No. 1. - P. 143-157. DOI: 10.7256/2585-7797.2020.1.32009 URL: https://nbpublish.com/library_read_article.php?id=32009 (accessed 12.01.2021).
3. Valetov, T. Ya. "Creation of Internet resources for historians" and "Computer graphics for historians": the experience of reading "technical" special courses at the Faculty of History / T. Ya. Valetov // Newsletter of the History and Computer Association. - 2006. - No. 34. - S. 206-207.
4. White city. Virtual reconstruction of the historical landscape of the center of Moscow [website] URL: http://landscape.vrmsu.ru/ (accessed 01.12.2021).
5. Project “Electronic Resources on the Labor History of Russia” [website] URL: http://www.hist.msu.ru/Labour/index.html (accessed 01.12.2021).
6. Garskova, I. M. Development of historical Internet resources: some source studies and methodological problems / I. M. Garskova // Technotronnye dokumenty-information base of source and archive studies: collection of scientific articles: dedicated to Professor V. M. Magidov in connection Happy 70th birthday / Russian State University for the Humanities, Historical and Archival Institute. - Moscow, 2011. - S. 221-235.
7. Estates near Moscow. Catalog with a map of the location of estates - M .: NP "Russian Estate", 2018. - 408 p.
8. Borodkin L.I., Gerasimova Yu.N. — Virtual reconstruction of historical manor complexes: cooperation between historians and archivists, project activities of students // Historical informatics. - 2020. - No. 3. - P. 103-111. DOI: 10.7256/2585-7797.2020.3.34273 URL: https://nbpublish.com/library_read_article.php?id=34273
9. LAMP stack // IBM - Russia [website] URL: https://www.ibm.com/ru-ru/cloud/learn/lamp-stack-explained (accessed 12.11.2021).
10. Installing LAMP in Ubuntu // Losst [website] URL: https://losst.ru/ustanovka-lamp-ubuntu-16-04 (accessed 12.11.2021).

Результаты процедуры рецензирования статьи

В связи с политикой двойного слепого рецензирования личность рецензента не раскрывается.
Со списком рецензентов издательства можно ознакомиться здесь.

Предметом исследования настоящей статьи является создание электронных информационных ресурсов, посвященных результатам различных, преимущественно, исследовательских проектов. Автор дает характеристику создаваемого им проекта информационного ресурса, посвященного трехмерным реконструкциям подмосковных усадебных комплексов. Особенностью этих реконструкций является поиск и систематизация большого числа разнообразных источников.
Особенностью рассматриваемого ресурса является незавершенность проекта и упорядочение хранения большого количество разнородной и разноформатной информации. Речь идет о более 600 бывших усадебных комплексах Подмосковья, часть из которых находится в полуразрушенном состоянии, а часть является полностью утраченной. По мере выполнения проекта вся информация о нем публикуется в открытом информационном справочнике.
Актуальность статьи определяется, с одной стороны, необходимостью сохранения, а также реконструкции (в том числе на основе цифровых технологий) объектов историко-культурного наследия, представляющих большую историческую и архитектурную ценность, с другой, – большим интересом научной общественности, а также широкого круга читателей современными виртуальными историческими реконструкциями.
Все изложенное определяет и научную новизну рассматриваемого проекта и написанной на основе его анализа статьи. Фактически речь идет о новой разновидности электронных ресурсов, сочетающих в себе источники, технологии, методы и итоги их применения к обрабатываемому материалу. Все это дополняется коллективным доступом к внесению информации. Возможное создание электронного справочника по материалам Подмосковья может стать примером для разработки подобных ресурсов по другим регионам.
Содержание статьи достаточно традиционно для научной работы прикладного жанра. После постановки проблемы, целей и задач исследования автор переходит к описанию конкретного проекта, которому посвящена статья. Дается подробное описание сайта проекта. Пользователям, заинтересованным в размещении своей информации, предоставляется возможность создать свою часть сайта и корректировать ее совместно с администратором проекта. Проект выполняется в среде Linux. По мнению автора, построение создаваемого им сайта уменьшает время поиска и встраивания информации в исследовательскую работу. Статья написана профессиональным языком и хорошим научным стилем. Статье присуще последовательное разворачивание авторских суждений в соответствии с логикой научного изложения, что обеспечивает достоверность сделанных выводов.
Библиография статьи содержит достаточное число ссылок на научные работы по схожей тематике исследования. Она не очень велика, но включает ряд необходимых статей и электронных ресурсов. Библиография отличается грамотным оформлением.
Обзор научных работ других исследователей по схожей тематике, расположенный в начале статьи, кратко, но ясно объясняет детали рассмотренной научной проблемы.
Рецензируемая статья полностью соответствует формату журнала «Историческая информатика» и вызовет большой интерес читателей разных категорий. Статья рекомендуется к публикации.