Перевести страницу на:  
Please select your language to translate the article


You can just close the window to don't translate
Библиотека
ваш профиль

Вернуться к содержанию

Историческая информатика
Правильная ссылка на статью:

Дискуссии о российской революции 1917 г. в Сети: методические подходы к исследованию веб-форумов как исторического источника

Соколов Юрий Вячеславович

ORCID: 0000-0003-1628-8558

младший научный сотрудник, Национальный исследовательский Нижегородский государственный университет им. Н.И. Лобачевского

603005, Россия, Нижегородская область, г. Нижний Новгород, ул. Ульянова, 2, каб. 326

Sokolov Yuri Vyacheslavovich

Junior researcher, Nizhny Novgorod State University. N.I. Lobachevsky

603005, Russia, Nizhny Novgorod region, Nizhny Novgorod, Ulyanova str., 2, office 326

sapsan118@yandex.ru

DOI:

10.7256/2585-7797.2023.2.40601

EDN:

AFQXIL

Дата направления статьи в редакцию:

27-04-2023


Дата публикации:

08-06-2023


Аннотация: Предметом исследования является методика анализа электронного контента социальных сетей (форумов) как исторического источника. В качестве материала для анализа использовано обсуждение революции 1917 г. в период столетнего юбилея этого исторического события. Целью исследования являлась апробация подходов к методике работы с большими массивами сетевых текстов, и возможном совмещении двух подходов к работе с онлайн-текстами — средств количественного анализа ("дальнее чтение") и традиционных приёмов работы с историческим текстом ("медленное чтение"). В рамках «дальнего чтения» используется тематическое моделирование при помощи алгоритма LDA (латентное размещение Дирихле) и LSA (латентно-семантический анализ) в среде программирования R в программе R studio (версия 4.2.1). В ходе «медленного чтения» мы анализируем весь объём текста непосредственно. Новизна исследования заключается в применении к источникам тематического моделирования в среде программирования R в совокупности с классическими методами анализа исторических текстов. В рамках исследования апробирована методика анализа контента социальных сетей (форумов), ориентированная на существенные массивы текста, которые физически невозможно прочитать полностью или хотя бы в значительной части, пользуясь исключительно традиционными средствами взаимодействия исследователя с корпусом источников. Предложен пошаговый алгоритм исследования, в рамках которого исследователю нужно проанализировать текст методами «дальнего чтения», выявив темы тексты, состоящие из термов (слов). Затем используя эти ключевые слова следует найти соответствующие фрагменты текста, в которых выявленная тема обсуждалась наиболее активно, и проанализировать фрагменты подробнее с использованием традиционных приемов работы с текстовым источником. Предложен возможный способ улучшения качества выявления необходимых исследователю тем в социальных сетях и на форумах алгоритмом LDA, а именно предварительное дробление большого текста и последующий анализ фрагментов методом LDA как отдельных документов.


Ключевые слова:

цифровые источники, онлайн-форумы, дальнее чтение, латентно-семантический анализ, латентное размещение Дирихле, тематическое моделирование, историческая информатика, публичная история, веб-форум, онлайн-текст

Abstract: The subject of the study is a methodology for analyzing the electronic content of social networks (forums) as a historical source. The discussion of the revolution of 1917 during the centenary of this historical event was used as a material for analysis. The aim of the study was to test approaches to the methodology of working with large arrays of online texts, and the possible combination of two approaches to working with online texts - quantitative analysis tools (distant reading) and traditional methods of working with historical text (slow reading). As part of the "distant reading", thematic modeling is used using the LDA (latent Dirichlet placement) and LSA (latent semantic analysis) algorithm in the R programming environment in the R studio program (version 4.2.1). During the "slow reading" we analyze the entire volume of the text directly.The novelty of the research lies in the application of thematic modeling to sources in the R programming environment in conjunction with classical methods of analyzing historical texts. Within the framework of the study, a methodology for analyzing the content of social networks (forums) has been tested, focused on substantial arrays of text that are physically impossible to read in full or at least in a significant part, using exclusively traditional means of interaction of the researcher with the corpus of sources. A step-by-step research algorithm is proposed, in which the researcher needs to analyze the text by "distant reading" methods, identifying the topics of texts consisting of terms (words). Then, using these keywords, you should find the relevant text fragments in which the identified topic was discussed most actively, and analyze the fragments in more detail using traditional methods of working with a text source. A possible way to improve the quality of identifying topics necessary for the researcher in social networks and forums by the LDA algorithm is proposed, namely, preliminary splitting of a large text and subsequent analysis of fragments by the LDA method as separate documents.


Keywords:

digital sources, online forums, distant reading, latent semantic analysis, latent Dirichlet placement, thematic modeling, historical information science, public history, web forum, online text

Научная актуальность. Возрастающая роль цифровизации и развитие сетевых технологий обусловили возникновение совершенно нового типа исторического источника — цифрового, что заставляет нас искать новые методологические решения при работе с онлайн-текстами [1, с. 62]. Подходы к работе с источниками, формирующиеся в рамках сетевой коммуникации — дискуссионный вопрос, поскольку, с одной стороны, онлайн-коммуникация - это и классический текст, что предполагает его чтение и формулирование выводов с помощью традиционных для историков методов. С другой стороны, масштабы онлайн-дискуссий, а также возможности, которые создаёт цифровой подход к обработке материалов, делают необходимым, на наш взгляд, применение методов «дальнего чтения» ввиду огромных объёмов онлайн-текстов. Под «дальним чтением» в данной работе имеется ввиду анализ текстов с использованием в том числе количественных методов, информационных технологий, в противоположность «медленному чтению», которое заключается в непосредственном ознакомлении с текстом. Термины «медленное" и "дальнее чтение», которые используются в нашей статье, раскрываются в работе Ф. Моретти [2]. Проблема сетевого источниковедения рассматривалась в статье М. С. Корнева [1], по мнению которого «современная теория и практика отечественного источниковедения не дает целостной и достаточно ясной картины работы с источниками в современных условиях развития информационно-коммуникационных технологий (ИКТ), цифровизации и новых медиа» [1, с. 60-61]. Таким образом, очевидно наличие проблемы синтеза различных источниковедческих подходов для работы с текстом, как традиционных, так и появившихся вместе с цифровым текстом, нахождения оптимальных методических решений при работе с онлайн-источниками.

Цель статьи состоит в апробации подходов к методике работы с большим массивом сетевых текстов и возможном совмещении двух подходов к работе с онлайн-текстами – «медленного" и "дальнего чтения». В качестве материала для анализа мы взяли сетевые обсуждения революции 1917 г. в период столетнего юбилея этого исторического события.

Источники исследования. Интернет-источники сегодня оказывают значительное влияние на формирование общественного мнения об исторических событиях, причём в ещё большей степени, чем профессиональные издания [3, с. 57]. Онлайн-контент является источником или одним из источников в ряде исторических исследований [4-22]. Хотя работа ведется с цифровыми текстами, существующими онлайн, основной инструментарий исследователей—это по-прежнему «медленное чтение».

«Дальнее чтение»—использование информационных технологий для работы с текстом — если и используется исследователями интернет-контента, то в основном в виде количественного анализа частотности употребления слов в постах/сообщениях, но не в виде использования перспективного, на наш взгляд, тематического моделирования в среде программирования, которое позволит более релевантно выявить тематики обсуждений, чем простой анализ частотности слов.

Один из самых перспективных подобных источников — веб-форум. Отмечается два важных его преимущества:

1. Специфика данных о повседневном историческом знании о прошлом, которое образуется без вмешательства со стороны исследователя [13, с. 142].

2. Источник отражает многие сферы повседневного взаимодействия людей — от обсуждения новостей до межличностных отношений. Т.е. историческое знание здесь находится в контексте совокупного повседневного знания, что дает возможность увидеть, с какими сторонами социальной жизни оно связано. Такой подход может дать понимание специфики повседневного исторического знания [13, с. 143].

В качестве материала для апробации методики мы выбрали обсуждение революции 1917 г. в год её столетнего юбилея. В 2017 г. произошёл ожидаемый всплеск интереса к данной теме [23] (см. Рис 1).

Рис. 1. Динамика запросов «революция 1917 г.» в 2013–2023 гг. по данным Google Trends

Эмпирические данные и ограничения. Для исследования мы отобрали четыре форума, загрузившихся после запроса ««революция 1917» AND Форум» в поисковой системе «Яндекс» и в которых присутствует обсуждение революционных событий 1917 г. в 2017 г. в рамках специальной темы, созданной на форуме (два форума) или в рамках большой группы сообщений (еще два форума). Поиск интернет-источников для исследований является самостоятельной и безусловно очень важной проблемой, одним из перспективных вариантов решения которой может стать применение нейросетей (таких, как ChatGPT). Однако, поскольку предметом рассмотрения в данной статье являются способы обработки источников, данная проблема не рассматривается в настоящей статье. Важным этапом в осуществлении исследования интернет-источников является оценка репрезентативности используемых данных. В первую очередь она определяется используемыми методиками отбора интернет-контента, но также связана и с применяемыми методиками обработки эмпирических данных. В какой степени в исследовательских подходах доминируют количественные подходы? Проблема репрезентативности качественных исследований (в нашем случае качественным исследованием является «медленное чтение» материала) не может быть решена однозначно с использованием только количественных оценок. Данный подход не является ни универсальным, ни исчерпывающим, а верификация репрезентативности выборки может быть осуществлена не только математически, но и эмпирически [24, с.24-25].

В некоторых случаях тема о революции 1917 г. была создана в год столетнего юбилея — в 2017 г., хотя зачастую тема была создана значительное раньше, но в 2017 г. снова актуализировалась на форумах.

Тексты с форумов были загружены при помощи пакета rvest.

1. Первый форум—«Strategium.ru»—крупнейший русско-язычный ресурс о стратегических компьютерных играх, в которых основа сюжета — исторические события (например серия Hearth of Iron, Vicrtoria, Europa). На форуме есть специальный раздел для обсуждения исторических вопросов, в котором и находится тема о революции 1917 г. [25], состоящей из порядка 400 сообщений, написанных более чем 20 участниками.

2. «History forum»—форум на историческую тематику, одной из тем обсуждения на котором является революция 1917 г. [26]. Дискуссия велась в основном между двумя пользователями и содержит около 50 сообщений.

3. «Playground»—форум о компьютерных играх, исторические вопросы (в том числе революция 1917 г.) обсуждаются в разделе «Болталка», специализированного исторического раздела здесь нет [27]. В группе сообщений о революции около 100 сообщений и 20 участников.

4. «Игромания»—также форум о компьютерных играх, тема революции 1917 г. обсуждается в разделе «Беседка» [28]. Теме было посвящено порядка 150 сообщений (около 10 дискутирующих).

Методика исследования. Сообщения о революции 1917 г., написанные в 2017 г. будут исследованы методами «дальнего чтения», а затем «медленного чтения». Словосочетание «дальнее чтение» Ф. Моретти ввел по аналогии с понятием «медленного» или «пристального» чтения (close reading)—подхода к изучению литературы, применявшегося американскими «новыми» критиками в 1940-1970 гг. Хотя в чистом виде «новая критика» уже давно потеряла актуальность, ее основные идеи прочно укоренились в англоязычном литературоведении (а также, вследствие разных причин, характерны для литературоведения многих других стран): основное внимание литературоведа должны привлекать «великие» произведения, важные смыслы которых следует извлекать посредством внимательного "всматривания" в отдельные тексты или даже фрагменты текстов. Все статьи в «дальнем чтении» так или иначе направлены против этих идей: по мнению Моретти, литературу следует изучать не вглядыванием в детали, а рассматриванием с «дистанции»—причем имеется в виду охват не одного или нескольких произведений, а сотен и тысяч текстов» [2, с. 11]. Таким образом, данная дискуссия о методах чтения шла в основном в литературоведении, однако, на наш взгляд, данная бинарная оппозиция — "пристальное" чтение небольших по объёму отрывков vs чтение огромных объёмов текстов с применением различных методологических приёмов актуальна и для изучения текстовых источников в гуманитарных науках. В нашей статье методы «дальнего чтения» будут использоваться для предварительного выявления тематик текстов и поиске возможных сходств дискуссий на различных форумах. Затем используя «медленное чтение» мы окончательно определим тематики дискуссий и более подробно их проанализируем. По нашей гипотезе, предварительное выявление тематик текстов в ходе «дальнего чтения» позволит на этапе «медленного чтения» эффективнее работать с текстом, обращая внимание на ключевые слова и тематики.

«Дальнее чтение» в настоящей работе включало алгоритмы LDA (латентное размещение Дирихле) и LSA (латентно-семантический анализ), реализованные в среде программирования R в программе R studio (версия 4.2.1). В рамках исторических исследований алгоритм LSA применялся в работе А. В. Кузнецова [29]. Исследователь также выложил на электронный ресурс github методику применения алгоритмов LSA и LDA в среде программирования R на примере своих статей [30]. Методика тематического моделирования при помощи алгоритма LDA прописана также на электронном ресурсе «tidytextmining.com» [31]. Предварительно перед «дальним чтением» в нашей статье при помощи пакета tm тексты были очищены от стоп-слов. Стоп-слова являются малозначительными в тексте, не несут смысловой нагрузки, к примеру это предлоги или местоимения, но также и слова, которые не несут информации именно в контексте настоящего исследования — «событие», «век» и т.д. По ходу анализа список стоп-слов нами пополнялся. Также тексты были лемматизированы, переведены в нижний регистр, были удалены цифры и лишние пробелы.

«Дальнее чтение». Проведём анализ текстов методами «дальнего чтения», используя латентное размещение Дирихле (LDA) и латентно-семантический анализ (LSA).

Латентное размещение Дирихле (LDA) является одним из методов тематического моделирования. В основе метода— концепция, согласно которой определённый текст состоит из тем, а темы из слов. Одна тема отличается от другой вероятностями вхождения определённых слов в эти темы, алгоритм LDA позволяет зафиксировать эту разницу. После выполнения алгоритма мы получаем набор тем, каждая из которых представляет из себя список слов, ранжированный по вероятности вхождения слова в тему. Базой для выполнения LDA является терм-документная матрица, столбцы которой соответствуют документам, а строки – термам (словам). Для примера приведем фрагмент матрицы (Таблица 1).

Таблица 1. Терм-документная матрица (фрагмент)

Документы

Термы

History forum

Форум Playground

Форум strategium

Форум игромания

американский

2

0

0

0

английский

3

4

0

0

англия

3

4

0

1

антанта

11

4

20

0

армия

1

2

80

17

большевик

17

8

120

32

Значения в матрице обозначают частоту встречаемости определённых термов в каждом документе. На базе этой матрицы алгоритм и выявляет тематики с помощью ряда математических операций.

Мы выполнили на матрице алгоритм LDA с целью определить для каждого форума ключевые слова, характеризующие его тематику. Поэтому был задан поиск четырёх тем по числу документов в подборке (один документ соответствует одному форуму). В результате реализации алгоритма был получен следующий набор тем (Рис.2).

Рис. 2. Тематики, выявленные алгоритмом LDA (2 темы)

Чтобы соотнести определённую тему с определённым документом (форумом), мы рассчитали показатель «Вероятность темы в документе», который мы приводим в таблице (Таблица 2):

Таблица 2. Вероятность темы в документе

Форум

Тема

Значение

1

History

1

0,0000114

2

Playground

1

0,00000926

3

Strategium

1

0,00000192

4

Игромания

1

1

5

History

2

1

6

Playground

2

1

7

Strategium

2

0,00000192

8

Игромания

2

0,00000755

9

History

3

0,0000114

10

Playground

3

0,00000926

11

Strategium

3

0,855

12

Игромания

3

0,00000755

13

History

4

0,0000114

14

Playground

4

0,00000926

15

Strategium

4

0,145

16

Игромания

4

0,00000755

Данный расчёт показывает, что текст форума «Игромания» на 100% состоит из темы 1 (см. тут и темы 2-4 на Рис. 1). Обсуждения на форумах «History» и «Playground» на 100% состоят из темы 2, а на форуме Strategium—на 86% из темы 3 и на 14% из темы 4. Таким образом, тема 4 мало фигурирует в документах, поэтому имеет смысл повторно запустить алгоритм LDA и выявить 3 темы (Рис. 3).

Рис. 3. Тематики, выявленные алгоритмом LDA (3 темы)

Произведём повторную проверку по показателю «Вероятность темы в документе» (Таблица 3).

Таблица 3. Вероятность темы в документе (3 темы).

Форум

Тема

Значение

1

History

1

0,00000832

2

Playground

1

0,00000676

3

Strategium

1

0,00000141

4

Игромания

1

1

5

History

2

1

6

Playground

2

1

7

Strategium

2

0,00000141

8

Игромания

2

0,00000552

9

History

3

0,00000832

10

Playground

3

0,00000676

11

Strategium

3

1

12

Игромания

3

0,00000552

После данной операции каждый документ принадлежит к определённой теме, а материалы форумов «History» и «Playground» состоят из одной темы—темы 2, таким образом у нас нет «лишней» темы. Поскольку материалы форумов «History» и «Playground» были отнесены алгоритмом LDA к одной теме, мы проверили при помощи алгоритма LSA семантическую близость двух форумов, построив семантическое пространство всех четырёх исследуемых форумов (Рис. 4).

Рис. 4. Семантическое пространство документов (LSA)

На семантическом пространстве форумы «History» и «Playground» действительно находятся «рядом», по сравнению с двумя другими форумами.

Проанализируем результаты «дальнего чтения» (см Рис. 2). Во всех трём тематиках первый и самый важный терм— «революция», то есть именно так пользователи данных форумов в основном воспринимают события 1917 г. — в противоположность «перевороту». Тема 1 соответствует форуму «Игромания». Термы «Отречение», «Февральский», «Николай» позволяют сделать предположение о доминировании в обсуждении на форуме тематики Февральской революции и отречения Николая II. Обсуждения на форумах «History» и «Playground» алгоритм отнёс к одной теме, второй по порядку (см. Рис. 2). Термы «Долг» (вероятно) и «Рубль» указывают на экономическую тематику, а термы «Ленин», «коммунизм», «СССР» — на обсуждение Октябрьской революции. Тема 3, на наш взгляд, состоит из несвязанных друг с другом термов из широкого круга тем, поэтому либо алгоритм не выявил здесь тему, либо на форуме «Strategium» обсуждался очень широкий круг тем. Форум Strategium, на котором алгоритм LDA не выявил тематики, отличается от других форумов большим количеством сообщений (20 страниц против 3-7 на других форумах), а также большим количеством дискутировавших пользователей. По нашему мнению, разнообразная стилистика авторов также могла затруднить работу алгоритма LDA. Для проверки этой гипотезы мы разбили текст на 2 и 4 равные части по хронологическому принципу. Деление на 2 части всё ещё не позволило выявить темы, а деление на 4 части позволило выявить более определённые тематики. Мы задали алгоритму выявить 4 тематики данного форума по числу частей, на которые мы поделили дискуссию на форуме. Приведём результат анализа (Рис. 5).

Рис. 5. Тематики, выявленные алгоритмом LDA на форуме Strategium после разбивки текста

Первую тематику можно отнести к «продовольственной» теме («голод», «зерно», экспорт», «вывозить»). Вторая и третья тематики – идеологические («демократия», «социализм», «коммунизм», «анархист», «фашизм», «партия», «эсер»). Четвёртая тематика—«продовольственная» и «военная» («армия», «война», «хлеб», «мир», «урожайность»).

Производить проверку по показателю «вероятность темы - документа», по нашему мнению, не имеет смысла, поскольку деление на документы в данном случае хронологическое и условное, нельзя обособить один документ от другого.

На семантическом пространстве просматривается семантическая близость материалов форумов «History» и «Playground» и их обособленность от двух остальных форумов, что показал и анализ методом LDA.

«Медленное чтение». После исследования текстов методами «дальнего чтения» мы имеем приблизительное представление о том, какие темы обсуждались на форумах. Термы из этих тем мы используем для поиска соответствующих сообщений на форумах, чтобы изучить подробнее обсуждение той или иной темы, в каком контексте шла дискуссия, что спровоцировало её начало. Операции будут проделаны либо при помощи сервиса поиска самого форума, либо при помощи команды ctrl+f. Необходимо помнить, что была проведена лемматизация и следует искать по корню слова.

В результате анализа мы пришли к выводу, что дискуссии на форумах были спровоцированы 100-летним юбилеем революции. Темы были либо созданы в 2017 г., либо получили импульс к продолжению в период юбилея, если были созданы ранее.

Характерной особенностью дискуссий являлся очевидность того, что пользователи «заходили» в дискуссию с уже сформированными взглядами на события революции 1917 г., её предпосылки и последствия.

Дискуссия на форуме «History» во многом шла вокруг тематики финансового положения России накануне и во время революции. Именно по данной проблематике в теме возникли споры. По мнению одного из пользователей, основным катализатором обеих революций 1917 г. была Первая мировая война, в которую, в свою очередь, Россия вынуждена была вступить из-за долгов французским банкам. Когда же правительство большевиков отказалось платить царские долги, страны Антанты начали военную интервенцию и развязали Гражданскую войну в России (цитата: «К тому же именно из за растранжиренных долгов Николая Второго перед французскими банкирами он вынужден был вляпаться в Первую мировую войну... Когда Ленин прекратил войну и объявил, что советская Россия не будет платить по царским долгам, в страну ввели войска страны Антанты...были вооружены "белые" и началась гражданская война»). Другой пользователь возлагал вину за невыгодный, по его мнению, выход России из Первой мировой войны и за Гражданскую войну на большевиков («Ленин…развязал Гражданскую войну. Может быть вы поясните зачем нужна была Октябрьская революция если она не была заказной (чтобы убрать Россию, пока возможно, из войны). Все члены Антанты получили свои дивиденды, все кроме России») [26].

Пользователи на форуме «Playground» в целом «на стороне» большевиков в исторической дискуссии. Как результат: споры на форуме были в основном о частностях. По мнению одного из пользователей, базой для прихода к власти большевиков стала поддержка обедневшего крестьянства («85% населения России составляли крестьяне. Эти люди дошли до края. Самое ужасное то, что они боялись умереть от голода. Это увидел Ленин. А власть ему сама пришла. Без всякой крови и насилия. Террор развязали «благородные» люди высшего сословия, чтобы вернуть свои богатства и людей-рабов. Народ сказал: "Нет!"»). Но было и другое, нехарактерное для данного форума мнение, согласно которому Февральская революция была нужна и закономерна, а Октябрьская революция принесла стране вред («Нужна была только февральская революция т.к. Николай второй был слабым монархом и его отречение было благом для России в 1917 году. Но после неудачных действий Керенского к власти пришли коммунисты и начали развал страны. При коммунистическом режиме мы проиграли почти выигранную Первую мировую войну, подписав позорный брестский мир, развалили экономику») [27].

На форуме «Strategium» одной из центральных тем было обсуждение голода в СССР 1932-1933 гг. и его причин («То, что вывозили зерно—несомненно. Но привело ли к это к массовому голоду, либо же у голода были в большей степени иные причины—большой предмет споров»). В рамках другой группы сообщений пользователи обсуждали определения и суть основных идеологий. Терм «война» в теме форума указал на упоминание Гражданской войны и Первой мировой войны («В 1917 управление армией потеряно. Эта потеря безвозвратная, т.к. без сильной власти это сделать невозможно. Сильной власти не имелось. Это требование текущего момента. Имела место революция. Приход к власти мог быть возможен лишь после подавления внутренних врагов. При продолжении войны с Германией, успешная борьба с внутренним врагом невозможна. Война для России с Германией вещь невозможная. Требовался мир») [25].

На форуме «Игромания» самой значительной по объёму дискуссией было обсуждение отречения Николая II. По мнению одних пользователей отречение было законно, другие считали, что оно либо незаконное, либо и вовсе «фейковое» («само отречение напечатано на машинке и подписано карандашом. Текст отречения противоречил юридическим нормам тогдашнего времени, про которые Император не мог не знать. А вот создавшие фейк заговорщики—вполне. Сам Николай находился под арестом и от его имени можно было делать какие угодно заявления») [28].

На всех форумах наибольший интерес представляют неэмоциональные комментарии со ссылками на научную литературу, статистику или прямую речь участников событий революции 1917 г. Как правило, такие комментарии больше по объёму и задают направление дискуссии на форумах.

Форумы различаются между собой по объёму и тематикам дискуссии. Три из четырёх сообществ посвящены компьютерным играм, в частности стратегическим, с историческим сюжетом, в связи с чем в данных сообществах присутствует интерес к истории и в том числе к событиям 1917 г. в России. На наш взгляд, на подобных форумах есть материал и для исследований дискуссий о других исторических событиях.

Выводы. Предложенная методика работы ориентирована на работу исследователя с существенными массивами текста, которые физически невозможно прочитать полностью или хотя бы в значительной части, пользуясь исключительно традиционными средствами взаимодействия исследователя с корпусом источников. При взаимодействии с подобными комплексами цифровых источников первым этапом следует провести «дальнее чтение» с использованием тематического моделирования, которое может быть выполнено на алгоритме LDA. Результатом его применения должен стать набор тем текстов. Если тема на субъективный взгляд исследователя не была выявлена, то текст следует разделить на части, и каждую часть проанализировать как отдельный документ и выявить для неё тему. Затем в ходе «медленного чтения», используя полученные ключевые слова, следует найти страницы и сообщения, в которых интересующая исследователя тема обсуждалась наиболее активно, и проанализировать её подробнее уже с использованием традиционных приемов работы с текстовым источником.

Библиография
1. Корнев М. С. Источниковедение 2.0: о новых подходах к работе с источниками в сетевой цифровой среде // Вестник РГГУ. Серия «История. Филология. Культурология. Востоковедение». 2018. № 11 (44). С. 59-66.
2. Моретти Ф. Дальнее чтение [Текст] / пер. с англ. А. Вдовина, О. Собчука, А. Шели. Науч. ред. перевода И. Кушнарева. М.: Изд-во Института Гайдара, 2016. 352 с.
3. Бородкин Л. И. "Цифровой поворот" в дискуссиях на XXII международном конгрессе исторических наук (Китай, 2015 г.) // Историческая информатика. информационные технологии и математические методы в исторических исследованиях и образовании. 2015. №3-4 (13-14). С. 56-67.
4. Trubina E. Past Wars in the Russian Blogosphere: On the Emergence of Cosmopolitan Memory // War, Conflict and Commemoration in the Age of Digital Reproduction. 2010. P. 63-85.
5. Зверева В. В. Дискуссии о советском прошлом в сообществах сети «В Контакте» // Вестник общественного мнения. 2011. №4(110). С. 97-112.
6. Pfanzelter E. At the crossroads with public history: mediating the Holocaust on the Internet // Holocaust Studies. 2015. Vol. 21, No. 4. P. 250-271.
7. Commane G. Instagram and Auschwitz: a critical assessment of the impact social media has on Holocaust representation / G. Commane, R. Potton // Holocaust Studies: A Journal of Culture and History. 2018. P. 1-24.
8. Manca S. Holocaust memorialisation and social media. Investigating how memorials of former concentration camps use Facebook and Twitter // Conference: 6th European Conference on Social Media-ECSM 2019, Brighton, UK. P. 189-198.
9. Mugueta I. History popularised and tweeted: emotions and social representations around the conquest of Navarre in 1512 // Imago Temporis. Medium Aevum. 2018. Vol. 12. P. 57-90.
10. Keith S. Forgetting the Last Big War: Collective Memory and Liberation Images in an Off-Year Anniversary // American Behavioral Scientist. 2012. №56(2). P. 204-222.
11. Белых О. Л. Интернет-периодика как источник для изучения российско-американских отношений: дис. ... канд. ист. наук / О.Л. Белых. Иркутск., 2017. 303 с.
12. Heimo A. The 1918 Finnish Civil War Revisited: The Digital Aftermath // Folklore (Estonia). 2014. №57. P. 141-168.
13. Махов А. С. Повседневное знание о прошлом в дискуссиях на веб-форуме // Новая и новейшая история. 2015. №1. С. 141-154.
14. Бубнов А. Ю. Память о Гражданской войне в России как часть публичной полемики в цифровом пространстве // Электронный научно-образовательный журнал «История». 2020. №9 (95). С. 1-14.
15. Промыслов Н. В. Отечественная война 1812 года в русскоязычном сегменте сети Интернет // Электронный научно-образовательный журнал «История». 2021. №5(38). С. 5.
16. Бубнов А. Ю. «Гражданская война памяти»: конструирование нарративов о Гражданской войне в России в онлайн-дискуссии // Вестник Московского университета. 2019. №6. С. 29-43.
17. Грибан Н. В. Пакт Молотова-Риббентропа в современном медиаполитическом дискурсе // Политическая лингвистика. 2018. №1(67). С. 131-138.
18. Ермолин Д. С. Вспоминая Приштину: сетевые сообщества и практика изучения этносоциальных процессов / Д.С. Ермолин, А.А. Михайлова // Этнография. 2021. №3(13). С. 146-170.
19. Кирюхин Д. В. Функционирование интернет-ресурсов и сообществ в социальной сети «ВКонтакте», посвященных тематике Великой Отечественной войны // Исторический бюллетень. 2019. №3. С. 5-13.
20. Clavert F. History in the Era of Massive Data // Geschichte und Gesellschaft. 2021. Vol. 47, Iss. 1. P. 175-194.
21. Eiroa M. Primary sources for a digital-born history: the Hispanic blogosphere on the Spanish Civil War and Franco’s regime // Culture & History Digital Journal. 2019. №7(2):016. P. 1-57.
22. Marcinkevicius A. Constructing Historical Justice Discourse in Lithuanian and Russian Press in Lithuania: The Case of Holocaust // Filosofija. Sociologija. 2018. Vol 29, No 4. P. 246-252.
23. Google Trands [сайт]. Google LLC, 2023. URL: https://trends.google.com/home (дата обращения 06.09.2022). Текст электронный.
24. Белановский С.А. Глубокое интервью и фокус-группы. М., 2019. 372 с.
25. Strategium.ru: [сайт].-Invision Community, 2008–2022. URL: https://www.strategium.ru/forum/topic/85647-stoletie-oktyabrskoy-revolyucii/ (дата обращения: 25.11.2022). Текст электронный.
26. History-forum.ru [сайт]. URL: https://history-forum.ru/viewtopic.php?t=1308 (дата обращения 15.11.2022). Текст электронный.
27. Playground [сайт]. 2001–2022. URL: https://forums.playground.ru/talk/society/nuzhna_li_byla_revolyutsiya_1917_go_goda-562484/ (дата обращения: 22.12.2022). Текст электронный.
28. Игромания [сайт]. Jelsoft Enterprises Ltd., 2000–2022. URL: http://forum.igromania.ru/showthread.php?t=78610&page=117 (дата обращения: 10.11.2022). Текст электронный.
29. Кузнецов А. В. Компьютерный анализ текстов на латинском языке: латентно-семантический анализ «Истории готов, вандалов и свевов» Исидора Севильского // Историческая информатика. 2020.-№2. С. 178-190.
30. Компьютерный анализ средневековых латинских текстов [сайт]. Алексей Кузнецов. URL: https://alexeyvkuznetsov.github.io/. Текст электронный.
31. Text Mining with R: A Tidy Approach [сайт]. Julia Silge and David Robinson. URL: https://www.tidytextmining.com/topicmodeling.html. Текст электронный.
References
1. Kornev, M. S. (2018). Source science 2.0: new approaches to working with sources in a digital network environment. Vestnik RGGU. Series History. Philology. Culturology. Oriental studies. 11(44), 59-66.
2. Moretti, F. (2016). Distant reading [Monograph]. Publishing House of the Gaidar Institute. 352.
3. Borodkin, L. I. (2015). «Digital turn» in discussions at the XXII International Congress of Historical Sciences (China, 2015). Historical informatics. information technologies and mathematical methods in historical research and education. 3-4 (13-14), 56-67.
4. Trubina, E. (2010). Past Wars in the Russian Blogosphere: On the Emergence of Cosmopolitan Memory. War, Conflict and Commemoration in the Age of Digital Reproduction, 63-85.
5. Zvereva, V. V. (2011). Discussions about the Soviet past in the communities of the VKontakte network. Bulletin of Public Opinion. 4 (110), 97-112.
6. Pfanzelter, E. (2015). At the crossroads with public history: mediating the Holocaust on the Internet. Holocaust Studies. 21 (4), 250-271.
7. Commane, G., R. Potton (2018). Instagram and Auschwitz: a critical assessment of the impact social media has on Holocaust representation. Holocaust Studies: A Journal of Culture and History. 1-24.
8. Manca, S. (2019). Holocaust memorialization and social media. Investigating how memorials of former concentration camps use Facebook and Twitter. Paper presented at the 6th European Conference on Social Media-ECSM 2019, Brighton. 189-198.
9. Mugueta, I. (2018). History popularised and tweeted: emotions and social representations around the conquest of Navarre in 1512. Imago Temporis. Medium Aevum. 12, 57-90.
10. Keith, S. (2012). Forgetting the Last Big War: Collective Memory and Liberation Images in an Off-Year Anniversary. American Behavioral Scientist. 56(2), 204-222.
11. Belykh, O. L. (2017). Internet periodicals as a source for the study of Russian-American relations (Candidate’s thesis).
12. Heimo, A. (2014). The 1918 Finnish Civil War Revisited: The Digital Aftermath. Folklore (Estonia). 57, 141-168.
13. Makhov, A. S. (2015). Everyday knowledge about the past in discussions on a web forum. New and recent history. 1, 141-154.
14. Bubnov, A. (2020). Yu. Memory of the Civil War in Russia as a part of public controversy in the digital space. History: Journal of Education and Science. 9 (95), 1-14.
15. Promyslov, N. V. The Patriotic War of 1812 in the Russian-speaking segment of the Internet (2021). History, an electronic scientific and educational journal. 5(38), 5.
16. Bubnov, A. Yu. (2019). «Civil War of Memory»: constructing narratives about the Civil War in Russia in online discussions. Moscow University Bulletin. 6, 29-43.
17. Griban, N. V. (2018). Molotov-Ribbentrop Pact in modern media political discourse. Political Linguistics. 1(67), 131-138.
18. Ermolin, D.S. Mikhailova A.A. (2021). Remembering Pristina: network communities and the practice of studying ethnosocial processes. Ethnography. 3(13), 146-170.
19. Kiryukhin, D.V. (2019). Functioning of Internet resources and communities in the social network «VKontakte» dedicated to the Great Patriotic War. Historical Bulletin. 3, 5-13.
20. Clavert, F. History in the Era of Massive Data (2021). Geschichte und Gesellschaft. 47 (1), 175-194.
21. Eiroa, M. (2019). Primary sources for a digital-born history: the Hispanic blogosphere on the Spanish Civil War and Franco’s regime. Culture & History Digital Journal. 7(2): 016, 1-57.
22. Marcinkevicius, A. (2018). Constructing Historical Justice Discourse in Lithuanian and Russian Press in Lithuania: The Case of Holocaust. Filosofija. Sociology. 29 (4), 246-252.
23Google Trends (2023). Google LLC. Retrieved from: https://trends.google.com/home.
24. Belanovsky, S.A. (2019). In-depth interviews and focus groups [Monograph], 372 p.
25Strategium.ru. (2017). Internet forum. Retrieved from: https://www.strategium.ru/forum/topic/85647-stoletie-oktyabrskoy-revolyucii/.
26History-forum.ru. (2017). Internet forum. Retrieved from: https://history-forum.ru/viewtopic.php?t=1308.
27Playground. (2017). Internet forum. Retrieved from: https://forums.playground.ru/talk/society/nuzhna_li_byla_revolyutsiya_1917_go_goda-562484/.
28Igromania. (2017). Internet forum. Retrieved from: http://forum.igromania.ru/showthread.php?t=78610&page=117.
29. Kuznetsov, A. V. (2020). Computer analysis of texts in Latin: latent semantic analysis of Isidor of Seville's «History of the Goths, Vandals and Suebi». Historical informatics. 2, 178-190.
30. Kuznetsov, A. V. (2023). Computer analysis of medieval Latin texts. Github. Retrieved from: https://alexeyvkuznetsov.github.io/.
31. Julia Silge and David Robinson. Text Mining with R: A Tidy Approach. Retrieved from: https://www.tidytextmining.com/topicmodeling.html.

Результаты процедуры рецензирования статьи

В связи с политикой двойного слепого рецензирования личность рецензента не раскрывается.
Со списком рецензентов издательства можно ознакомиться здесь.

Хотя со времен революционных событий 1917 г. прошло более ста лет, споры вокруг событий тех лет ведутся и сегодня. Согласно утвержденной в феврале 2023 г. «Концепции преподавания истории России для неисторических специальностей и направлений подготовки, реализуемых в образовательных организациях высшего образования» эти события рассматриваются в рамках Великой российской революции, однако и сегодня ведутся споры о различиях между февральскими и октябрьскими событиями. А ведь в течение долгих десятилетий революция 1917 г. была фактически мифологизирована, что конечно мешало объективному изучению процессов, которые привели к свержению династии Романовых и установлению власти большевиков. Заметим, что в настоящее время эти споры во многом переместились в интернет-пространство, сами масштабы которого вызывают потребность в новых подходах к его изучению.
Указанные обстоятельства определяют актуальность представленной на рецензирование статьи, предметом которой являются дискуссии о революции 1917 г. в ее столетний юбилей на веб-форумах. Автор ставит своими задачами рассмотреть методику работы исследователя с существенными массивами текста, а также определить роль веб-форумов как исторического источника.
Работа основана на принципах анализа и синтеза, достоверности, объективности, методологической базой исследования выступает системный подход, в основе которого находится рассмотрение объекта как целостного комплекса взаимосвязанных элементов. В исследовании автор методы «дальнего чтения» и «медленного чтения»: как отмечается в работе, «методы «дальнего чтения» будут использоваться для предварительного выявления тематик текстов и поиске возможных сходств дискуссий на различных форумах. Затем используя «медленное чтение» мы окончательно определим тематики дискуссий и более подробно их проанализируем. По нашей гипотезе, предварительное выявление тематик текстов в ходе «дальнего чтения» позволит на этапе «медленного чтения» эффективнее работать с текстом, обращая внимание на ключевые слова и тематики».
Научная новизна статьи заключается в самой постановке темы: автор стремится охарактеризовать апробацию подходов к методике работы с большим массивом сетевых текстов, и возможном совмещении двух подходов к работе с онлайн-текстами – «медленного и дальнего чтения».
Рассматривая библиографический список статьи, как позитивный момент отметим его масштабность и разносторонность: всего список литературы включает в себя 30 различных источников и исследований, что уже само по себе говорит о том объеме работы, который проделал ее автор. Источниковая база статьи представлена прежде всего текстами с форумов «Strategium.ru», «History forum», «Playground», «Игромания». Из привлекаемых автором исследований укажем на труды М.С. Корнеева, Л.И. Бородкина, А.С. Махова, А.Ю. Бубнова, в центре внимания которых различные аспекты изучения знания о прошлом в интернет-пространстве. Заметим, что библиография статьи обладает важностью как с научной, так и с просветительской точки зрения: после прочтения текста статьи читатели могут обратиться к другим материалам по ее теме. В целом, на наш взгляд, комплексное использование различных источников и исследований способствовало решению стоящих перед автором задач.
Стиль написания статьи можно отнести к научному, вместе с тем доступному для понимания не только специалистам, но и широкой читательской аудитории, всем, кто интересуется как источниками в сетевой среде, в целом, так и революцией 1917 г., в частности. Аппеляция к оппонентам представлена на уровне собранной информации, полученной автором в ходе работы над темой статьи.
Структура работы отличается определенной логичностью и последовательностью, в ней можно выделить введение, основную часть, заключение. В начале автор определяет актуальность темы, показывает, что сегодня «очевидно наличие проблемы синтеза различных источниковедческих подходов для работы с текстом, как традиционных, так и появившихся вместе с цифровым текстом, нахождения оптимальных методических решений при работе с онлайн-источниками». В работе ожидаемо отмечается, что столетний юбилей революции вызвал всплеск интереса к ней в интернет-пространстве. Анализируя материалы с 4 обозначенных выше форумов, автор выявляет доминирующие при дискуссиях темы. Автор показывает, что «затем, в ходе «медленного чтения» используя полученные ключевые слова следует найти страницы и сообщения, в которых интересующая исследователя тема обсуждалась наиболее активно, и проанализировать её подробнее уже с использованием традиционных приемов работы с текстовым источником».
Главным выводом статьи является то, что «предложенная методика работы ориентирована на работу исследователя с существенными массивами текста, которые физически невозможно прочитать полностью или хотя бы в значительной части, пользуясь исключительно традиционными средствами взаимодействия исследователя с корпусом источников».
Представленная на рецензирование статья посвящена актуальной теме, снабжена таблицами и рисунками, вызовет читательский интерес, а ее материалы могут быть использованы как в учебных курсах, так и в рамках изучения совершенно нового типа исторического источника – цифрового.
В целом, на наш взгляд, статья может быть рекомендована для публикации в журнале «Историческая информатика».