Перевести страницу на:  
Please select your language to translate the article


You can just close the window to don't translate
Библиотека
ваш профиль

Вернуться к содержанию

Филология: научные исследования
Правильная ссылка на статью:

Пелевин vs Сорокин: опыт стилометрического сопоставления

Зенков Андрей Вячеславович

ORCID: 0000-0002-1233-9082

кандидат физико-математических наук

доцент; кафедра "Моделирование управляемых систем"; Уральский федеральный университет

620002, Россия, Свердловская область, г. Екатеринбург, ул. Мира, 19, оф. 434

Zenkov Andrei Viacheslavovich

PhD in Physics and Mathematics

Associate Professor at the Department of Modeling of Controllable Systems, Ural Federal university

620002, Russia, Sverdlovsk region, Ekaterinburg, Mira st., 19, office 434

zenkow@mail.ru
Другие публикации этого автора
 

 
Зенков Мирослав Андреевич

магистр; институт Радиотехники и информационных технологий; Уральский федеральный университет

620100, Россия, Свердловская область, г. Екатеринбург, ул. Куйбышева, 88

Zenkov Miroslav Andreevich

Master's degree; Institute of Radio Engineering and Information Technology; Ural Federal University

620100, Russia, Sverdlovsk region, Yekaterinburg, Kuibyshev str., 88

zenkow@mail.ru
Зенков Николай Андреевич

бакалавр; институт цифровых технологий управления и информационной безопасности; Уральский государственный экономический университет

620100, Россия, Свердловская область, г. Екатеринбург, ул. Куйбышева, 88

Zenkov Nikolai Andreevich

Bachelor's degree; Institute of Digital Technologies of Management and Information Security; Ural State University of Economics

620100, Russia, Sverdlovsk region, Yekaterinburg, Kuibyshev str., 88

zenkow@mail.ru

DOI:

10.7256/2454-0749.2024.7.71169

EDN:

OLBCPG

Дата направления статьи в редакцию:

30-06-2024


Дата публикации:

01-08-2024


Аннотация: Настоящее исследование относится к квантитативной лингвистике. Рассмотрено применение нового количественного метода изучения авторского стиля литературных текстов. Метод основан на компьютерном анализе статистики числительных, встречающихся в текстах. Среди знаменательных частей речи именно числительные по своей природе наиболее легко поддаются количественному учёту. Применительно к художественному тексту, порожденному свободной фантазией, естественно предположить, что употребление числительных связано с психологическими особенностями автора, влияющими на результат творчества. Следовательно, манера использования числительных – это авторская особенность, позволяющая решать проблему авторства текста, изучать жанровые и стилистические особенности. Результаты анализа статистики числительных инвариантны относительно перевода текста на другой язык. Это позволяет при недоступности оригинального текста на данном языке воспользоваться его доступным переводом, а также количественно сопоставлять тексты авторов, творивших на нескольких языках. В нашем анализе учитываются количественные и порядковые числительные, выраженные как цифрами, так и словесно в разных словоформах. Компьютерная программа автоматически убирала из текста фразеологизмы и устойчивые сочетания, случайно содержащие числительные. Предварительно текст вручную очищается от числительных, не связанных с авторским художественным замыслом (пагинация, номера глав и т.п.). Впервые выполнен формальный количественный стилометрический анализ художественных произведений В.О. Пелевина и В.Г. Сорокина, в литературном стиле которых в рамках традиционного описательного филологического подхода находят немало общего. Для проверки методологии дополнительно включены в рассмотрение тексты четырёх подставных авторов. Обнаружено, что тексты Пелевина и Сорокина существенно различаются по использованию числительных. Полученные данные о встречаемости числительных в текстах подвергнуты иерархической кластеризации, правильно разделившей тексты в соответствии с авторством. Поскольку результаты применения кластерного анализа могут существенно зависеть от выбора метрики и метода кластеризации, а строго обосновать их выбор невозможно, испробованы различные разумные комбинации метрики и метода кластеризации. Оказалось, что при этом дендрограмма меняется лишь незначительно. Таким образом, результаты кластеризации оказались достаточно устойчивыми. Предложенный новый метод квантитативной лингвистики, основанный на анализе встречаемости числительных в (авторских) литературных текстах, способен успешно решать задачи стилометрии, связанные, в частности, с атрибуцией текстов.


Ключевые слова:

стилометрия, квантитативная лингвистика, атрибуция текстов, авторство текстов, числительные в тексте, Виктор Пелевин, Владимир Сорокин, иерархический кластерный анализ, дендрограмма, манхэттенская метрика

Исследование выполнено за счет средств гранта Российского научного фонда № 23-28-00750, https://rscf.ru/project/23-28-00750/ , проект «Разработка нового метода стилометрии на основе статистики использования числительных в авторских текстах».

Abstract: Our study is related to quantitative linguistics and focuses on the application of a new method for analyzing the author's style in literary texts. The method uses computer analysis of numerical data found in texts, including both cardinal and ordinal numerals, expressed both in numbers and verbally. Author used the program which automatically removed phraseological units and fixed combinations accidentally containing numerals. Before analysis, the text must be manually cleaned of numbers that do not contribute to the author's artistic vision, such as page numbers or chapter numbers. The analysis revealed that the use of numerals by an author in his/her texts is unique and individual, forming a characteristic feature that distinguishes texts by different authors. For the first time, a formal quantitative stylometric analysis is performed of the literary works by Victor Pelevin and Vladimir Sorokin – authors whose literary styles share many similarities when viewed through the lens of a traditional descriptive philological approach. To validate this methodology, we have also included the texts of four "impostor" authors in our analysis. It has been found that Pelevin's and Sorokin's texts differ significantly in their use of numerals. The data on occurrences of numerals in the texts were subjected to hierarchical clustering, which accurately divided the texts into groups based on their authorship. Since the clusterization results can be influenced by the choice of both metrics and clustering method, we tried various reasonable combinations of them to ensure the reliability of our results. Each time, the dendrogram would change only slightly. Thus, the clustering outcomes were found to be reliable. The proposed new method of quantitative linguistics, which is based on the analysis of numerals in literary texts, has the potential to successfully solve the stylometric problems, particularly related to the attribution of texts.


Keywords:

stylometry, quantitative linguistics, text attribution, text authorship, numerals in texts, Victor Pelevin, Vladimir Sorokin, hierarchical cluster analysis, dendrogram, Manhattan metrics

1. Введение

Неизменное на протяжении многих лет ежегодное появление очередного романа Виктора Пелевина (к настоящему времени это Путешествие в Элевсин, 2023) стимулирует внимание читающей публики и литературной критики [1–6] к этому своеобразному типу социально-метафизического фэнтези, в котором смешное и пародийное соседствуют с черным юмором и абсурдистскими сюжетными поворотами, а меткие бытовые наблюдения – с элементами оккультизма и сюрреализма. Пелевина сравнивали с такими мастерами социально-метафизического фантастического жанра, как Гоголь, Кафка и Борхес, а в последние десятилетия многие ценят его как писателя, уловившего дух времени и обладающего даром предвидения. Интерес к личности Пелевина подогревается практически полной закрытостью его частной жизни, подобно «великим затворникам» Д. Сэлинджеру и Т. Пинчону. Это даже порождало слухи о том, что писателя вообще не существует, а под маркой «Пелевин» работает группа авторов; с другой стороны, в текстах других авторов видят скрытое авторство Пелевина (см. ниже).

Перечисленные художнические особенности в значительной степени свойственны и творчеству Владимира Сорокина, которого, наряду с Пелевиным, считают одной из двух звезд русской постмодернистской литературы, находящихся в непрерывном негласном противостоянии [6–11]. Не только на низовом читательском уровне, но и в литературной критике тексты этих двух авторов нередко рассматриваются совместно.

Не претендуя на литературно-критический анализ творчества Пелевина и Сорокина, мы в настоящей работе применим формальный квантитативный подход к их текстам, что, насколько нам известно, ещё ни кем не делалось.

Стилометрия (и более широко понимаемая квантитативная лингвистика) – количественное изучение авторских особенностей текстов, в т.ч. для их атрибуции – до настоящего времени не имеет вполне удовлетворительного универсального рабочего метода [12, 13]: анализируются частоты встречаемости в текстах знаменательных частей речи и служебных слов (предлоги, союзы), средние длины слов и предложений; в паре анализируемых текстов сравниваются самые часто встречающиеся слова и даже буквосочетания (как ни странно, последний подход часто даёт неплохие результаты). К сожалению, разные методы часто приводят к противоречивым выводам, поэтому более надёжно совместное использование нескольких методов.

Перспективные результаты получены с помощью нейронных сетей, а вскоре, по-видимому, искусственный интеллект сможет успешно решать задачи квантитативной лингвистики [14], но содержательная интерпретация результатов при таком подходе затруднительна, поскольку сам метод является «чёрным ящиком».

Нами разработан оригинальный стилометрический метод анализа авторских текстов, основанный на учёте использования авторами числительных в их текстах [15, 16]. Среди знаменательных частей речи именно числительные по своей природе наиболее легко поддаются количественному учёту. Применительно к художественному (не жёстко фактографическому) тексту, порожденному свободной фантазией, естественно предположить, что употребление числительных связано с психологическими особенностями автора, незаметно для него самого влияющими на результат творчества. Следовательно, манера использования числительных – это авторская особенность (fingerprint), позволяющая при определённых обстоятельствах решить проблему авторства текста.

Заметим также, что, в отличие от всех перечисленных выше методов, именно статистика использования числительных инвариантна относительно перевода текста на другой язык. Это позволяет при недоступности оригинального текста на данном языке воспользоваться его доступным переводом, а также количественно сопоставлять тексты авторов, творивших на нескольких языках (А. Стриндберг, С. Беккет, В. В. Набоков, …).

Анализ произведений нескольких десятков авторов на русском, чешском, английском языках обнаружил ощутимые авторские особенности употребления числительных в текстах, влияние на них жанра, стиля, художественного направления [17–22]. Таким образом, результаты анализа допускают содержательное филологическое истолкование.

В данной работе мы проанализируем с точки зрения использования числительных основные литературные произведения В. О. Пелевина и В. Г. Сорокина, а также некоторые другие тексты, которые будут привлечены к рассмотрению ради надёжности получаемых результатов.

2. Метод и объекты исследования

Использовалась компьютерная программа, отыскивающая в русскоязычном тексте числительные, выраженные как цифрами (числа), так и словесно в разных словоформах [22]. Поиск основан на сличении слов текста со словарной базой из словаря М. Хаген – Полная парадигма. Морфология. Частотный словарь. Совмещенный словарь (http://speakrus.ru/dict2/#morph-paradigm). Программа автоматически убирала из текста фразеологизмы и устойчивые сочетания, случайно (без авторского замысла) содержащие числительные (как свои пять пальцев, за семью замками, …).

Предварительно из текста вручную удалялись номера страниц, глав, перечисления 1), 2), 3), … и т.п.

Мы проанализировали некоторые наиболее объёмные произведения Пелевина и Сорокина, представленные в табл. 1. На выбор авторских текстов для анализа повлияла их доступность для свободного скачивания в сети Интернет, а также их непринадлежность (на момент подготовки настоящей работы) к проскрипционным спискам.

3. Результаты

Для каждого текста вычислена обратная плотность числительных как результат деления объёма текста на количество найденных в нём числительных. Чем меньше обратная плотность, тем чаще в тексте встречаются числительные.

Уже сравнение обратных плотностей числительных обнаруживает существенное различие между произведениями Пелевина (№1–15 в табл. 1) и Сорокина (№16–22): средние обратные плотности различаются на треть; в текстах Сорокина числительные используются чаще (детализация больше). При этом по размаху колебаний обратной плотности в проанализированных текстах (отношение максимальной и минимальной плотности: в 1,6 и 2,2 раза в текстах Пелевина и Сорокина, соответственно) манера использования числительных более единообразна у Пелевина.

Ещё определённее различие в употреблении числительных двумя авторами видно при использовании иерархического кластерного анализа [23], объединяющего объекты (здесь: тексты) в кластеры по принципу подобия – в нашем случае схожести абсолютных частот встречаемости числительных 1, 2, 3, … , 10 в текстах (эти числительные присутствуют без исключения во всех проанализированных текстах). Поскольку тексты существенно различаются по объёму (см. табл. 1), для сопоставимости частот мы ввели поправочные коэффициенты, выбрав в качестве эталонного текста для сравнения S.N.U.F.F. Пелевина. Поэтому, например, частоты для Generation П пришлось умножить на 1 285 434/ 832 755= 1,54, а для Дня опричника – на 1 285 434/ 414 628 = 3,10.

Как известно, мерой сходства в кластерном анализе является метрика ρ («расстояние»): чем меньше «расстояние» между объектами, тем больше сходство между ними. Мы применили манхэттенскую метрику

, (1)

где x и yn-мерные векторы, компонентами которых являются исправленные абсолютные частоты первых n натуральных чисел в двух анализируемых текстах (здесь n = 10).

В процессе кластеризации использован метод дальнего соседа (Complete linkage method) [24], который приводит к образованию компактных, чётко очерченных кластеров.

Исследованные тексты идеально распределились по кластерам в соответствии с авторством (рис. 1). Суперкластеры текстов Пелевина и Сорокина сливаются на большой высоте, что снова подтверждает большие различия между текстами двух авторов. Заметим, что это делает сомнительной маргинальную точку зрения о группе авторов, пишущих под маркой «Пелевин».

В современной стилометрии принята точка зрения, что при сравнении текстов двух конкретных авторов доказательную силу об их сходстве/различии будет иметь лишь анализ, в котором изучаемые тексты «разбавлены» текстами подставных авторов (т.н. impostors – «самозванцы») [25]. Следуя этим идеям, мы ввели в рассмотрение добавочные литературные тексты (см. табл. 2) и заново провели кластеризацию (рис. 2).

Несколько выводов, следующих из табл. 2 и рис. 2:

· Добавочные тексты также кластеризовались в соответствии с авторством;

· Написание произведения совместно двумя авторами (О. Робски, К. Собчак – №4 в табл. 2) делает его непохожим на тексты только одного из авторов (О. Робски – №2, 3 в табл. 2) и заставляет кластеризоваться отдельно – дополнительный аргумент в пользу предположения о числительных как авторском инварианте;

· Тексты Пелевина и Сорокина по-прежнему никогда не попадают в один кластер низкого уровня, что подкрепляет сделанный выше вывод о существенных различиях между текстами двух авторов.

Отдельного рассмотрения требует произведение «Околоноля» – литературная мистификация, опубликованная в 2009г. под псевдонимом «Натан Дубовицкий». В спорах об авторстве в качестве возможных авторов назывались, в частности, В. Сорокин и В. Пелевин. В российских и зарубежных СМИ делалось предположение, что роман написан российским политическим деятелем Владиславом Сурковым. Сам он противоречиво высказывался по этому поводу. К настоящему времени его авторство считается признанным [26].

Что показывает наш анализ с точки зрения статистики числительных? Обратная плотность числительных для данного текста находится посредине между средними значениями для текстов Пелевина и Сорокина (табл. 2); на дендрограммах (рис. 2, 3) «Околоноля» не входит в кластер низкого уровня с каким-либо произведением этих авторов. Гипотезы о Пелевине или Сорокине как предполагаемых авторах не принимаются. Разумеется, тем самым не доказывается авторство Суркова, но мы не располагаем каким-л. добавочным его литературным текстом для исследования этого вопроса.

Как известно, выбор метрики и метода кластеризации невозможно строго обосновать; между тем, они способны существенно повлиять на результаты кластеризации. Мы провели кластеризацию текстов тех же авторов, что и на рис. 2, но используя не метод дальнего соседа, как в предыдущей попытке, а метод межгрупповых связей (Group average method, Between-groups linkage) [24]; по-прежнему с манхэттенской метрикой (рис. 3). В нашем случае результаты оказались достаточно устойчивыми; все выводы сохраняют свою силу. Другие разумные комбинации метрики и метода кластеризации также лишь незначительно меняют дендрограмму.

Таблица 1

Встречаемость числительных в исследованных произведениях

Автор, текст, год публикации

Объём (байты, кодировка UTF)

Количество числительных

Обратная плотность числительных

1

Пелевин, Синий фонарь (рассказы), 1991

1 245 806

1152

1081

2

Пелевин, Чапаев и Пустота (роман), 1996

1 075 941

665

1618

3

Пелевин, Generation П (роман), 1999

832 755

753

1106

4

Пелевин, Македонская критика французской мысли (повесть), 2007

675 550

582

1161

5

Пелевин, Зал поющих кариатид (сочинения), 2008

230 693

218

1058

6

Пелевин, t (роман), 2009

1 110 851

706

1573

7

Пелевин, Ананасная вода для прекрасной дамы (сочинения), 2010

795 699

583

1365

8

Пелевин, S.N.U.F.F. (роман), 2011

1 285 434

893

1439

9

Пелевин, Любовь к трём цукербринам (роман), 2014

1 059 056

698

1517

10

Пелевин, Лампа Мафусаила, или Крайняя битва чекистов с масонами (роман), 2016

1 002 303

762

1315

11

Пелевин, iPhuck 10 (роман), 2017

1 007 765

909

1109

12

Пелевин, Тайные виды на гору Фудзи (роман), 2018

986 624

844

1169

13

Пелевин, Непобедимое Солнце. Книга I (роман), 2020

670 911

477

1407

14

Пелевин, Transhumanism Inc. (роман), 2021

1 217 515

887

1373

15

Пелевин, Путешествие в Элевсин (роман), 2023

909 633

541

1681

Средняя обратная плотность числительных по пятнадцати текстам Пелевина:

1322

16

Сорокин, Сердца четырех (роман), 1991

448 680

681

659

17

Сорокин, Пир (Сб. рассказов), 2000

932 711

1242

751

18

Сорокин, Лёд (роман), 2002

697 517

818

852

19

Сорокин, День опричника (повесть), 2006

414 628

381

1088

20

Сорокин, Метель (повесть), 2010

430 967

296

1456

21

Сорокин, Теллурия (роман), 2013

868 261

829

1047

22

Сорокин, Доктор Гарин (роман), 2021

1 295 466

981

1320

Средняя обратная плотность числительных по семи текстам Сорокина:

973

Таблица 2

Встречаемость числительных в текстахподставных авторов

Автор, текст

Объём (байты, кодировка UTF)

Количество числительных

Обратная плотность числительных

1

«Натан Дубовицкий», Околоноля

573 376

505

1135

2

О. Робски, Casual

649 060

608

1068

3

О. Робски, Про ЛЮБОff /on

502 168

490

1025

4

О. Робски, К. Собчак, Zамуж за миллионера или брак высшего сорта

381 724

342

1116

5

Э. Веркин, Облачный полк

741 749

584

1270

6

Э. Веркин, Друг апрель

758 194

715

1060

4. Выводы

Разрабатываемый нами новый подход к задачам стилометрии, основанный на анализе статистики числительных в текстах, при всей его простоте, демонстрирует высокую эффективность и чувствительность. Тексты В. О. Пелевина и В. Г. Сорокина, сравнительный анализ которых выполнялся до сих пор лишь в рамках традиционного описательного филологического подхода, впервые подвергнуты формальному количественному анализу, правильно распределившему тексты согласно авторству. Обнаружены значимые авторские различия в манере использования числительных. Привлечение для анализа текстов сторонних авторов (impostors) усиливает значимость полученного результата и подтверждает его неслучайный характер. Метод пригоден для атрибуции текстов.

Рисунок 1 – Результат применения иерархического кластерного анализа к текстам В. О. Пелевина и В. Г. Сорокина (при кластеризации использованы метод дальнего соседа, манхэттенская метрика). По горизонтальной оси указано «расстояние» в произвольных единицах

Изображение выглядит как текст, диаграмма, Параллельный, черно-белый

Автоматически созданное описание

Рисунок 2 – Результат применения иерархического кластерного анализа к текстам В. О. Пелевина и В. Г. Сорокина с добавлением текстов посторонних авторов (при кластеризации использованы метод дальнего соседа, манхэттенская метрика). По горизонтальной оси указано «расстояние» в произвольных единицах

Изображение выглядит как текст, Параллельный, диаграмма, черно-белый

Автоматически созданное описание

Рисунок 3 – Результат применения иерархического кластерного анализа к текстам В. О. Пелевина и В. Г. Сорокина с добавлением текстов посторонних авторов (при кластеризации использованы метод межгрупповых связей, манхэттенская метрика). По горизонтальной оси указано «расстояние» в произвольных единицах

Библиография
1. Богданова О.В. Литературные стратегии Виктора Пелевина / О.В. Богданова, С.А. Кибальник, Л.В. Сафронова. СПб.: Петрополис, 2008.
2. Полотовский С. Пелевин и поколение пустоты / С.А. Полотовский, Р.В. Козак. М.: Манн, Иванов и Фербер, 2012.
3. Шилова Н.Л. Визионерские мотивы в постмодернистской прозе 1960–1990-х годов (Вен. Ерофеев, А. Битов, Т. Толстая, В. Пелевин) / Н.Л. Шилова. Петрозаводск: Изд-во Карельской гос. пед. академии, 2011.
4. Khagi S. Alternative Historical Imagination in Viktor Pelevin // Slavic and Eastern European Journal. 2018. No. 62(3). Pp. 483–502.
5. Хаги С. Пелевин и несвобода: Поэтика, политика, метафизика. М.: Новое литературное обозрение, 2023. – 392 с. ISBN: 978-5-4448-1967-8.
6. Ланин Б.А. Новая старая литературократия: Сорокин и Пелевин в борьбе с традициями // Ценности и смыслы. 2015. № 40(6). С. 110–123.
7. Богданова О.В. Концептуалист, писатель и художник Владимир Сорокин. СПб.: СПбГУ, 2005.
8. Андреева Н.Н., Биберган Е.С. Игры и тексты Владимира Сорокина / Н.Н. Андреева, Е.С. Биберган. СПб.: Петрополис, 2012.
9. Марусенков М.П. Абсурдопедия русской жизни Владимира Сорокина: Заумь, гротеск и абсурд / М.П. Марусенков. СПб.: Алетейя, 2012.
10. Биберган Е.С. Рыцарь без страха и упрёка: Художественное своеобразие прозы Владимира Сорокина / Е.С. Биберган. СПб.: Петрополис, 2014.
11. «Это просто буквы на бумаге…» Владимир Сорокин: после литературы / И.А. Калинин; М.Н. Липовецкий; Е.А. Добренко и др. М.: Новое литературное обозрение, 2018.
12. Stamatatos E. A survey of modern authorship attribution methods // J. Amer. Soc. for Information Science and Technology. 2009. No. 60(3). Pp. 538–556.
13. Tempestt N., Kalaivani S., Aneez F., Yiming Y., Yingfei X., and Damon W. Surveying Stylometry Techniques and Applications // ACM Comput. Surv. 2017, No. 50(6), Article 86, 36 pages.
14. La Inteligencia Artificial ayuda a descubrir una obra desconocida de Lope de Vega en los fondos de la BNE, Biblioteca Nacional de España, https://www.bne.es/es/noticias/inteligencia-artificial-ayuda-descubrir-obra-desconocida-lope-vega-fondos-bne (Accessed: June 30, 2024).
15. Зенков А.В. Новый метод стилеметрии на основе статистики числительных, Компьютерные исследования и моделирование, 2017, Т. 9, № 5, С. 837–850.
16. Zenkov A.V. A Method of Text Attribution Based on the Statistics of Numerals // J. of Quantitative Linguistics. 2018. No. 25(3). Pp. 256–270.
17. Zenkov A.V., Místecký M. The Romantic Clash: Influence of Karel Sabina over Macha’s Cikani from the Perspective of the Numerals Usage Statistics // Glottometrics. 2019, No. 46, Pp. 12–28.
18. Zenkov A.V. Stylometry and Numerals Usage: Benford’s Law and Beyond // Stats 2021. No. 4. Pp. 1051–1068.
19. Zenkov A., Místecký M. Young Vladimír Vašek? – A Numerals Analysis Contribution to the Bezruč−Hrzánský Identity Issue // Naše řeč, 2022. No. 105(3). Pp. 151–161.
20. Зенков А.В. Литературные мистификации и авторское использование числительных // Филологические науки. Вопросы теории и практики. 2023. № 16(11). С. 3696–3709. URL: https://doi.org/10.30853/phil20230568.
21. Zenkov A.V. Under a False Flag: Literary Hoaxes and the Use of Numerals // Litera. 2023. № 10. С. 86-109. DOI: 10.25136/2409-8698.2023.10.68743 EDN: TYDRFD URL: https://e-notabene.ru/fil/article_68743.html
22. Зенков А.В., Ермаков Н.Е. Числительные в текстах как характерная особенность авторского стиля // Russian Linguistic Bulletin. 2023. № 45(9). URL: https://doi.org/10.18454/RULB.2023.45.28.
23. Moisl H. Cluster Analysis for Corpus Linguistics. De Gruyter Mouton, 2015.
24. Gan G., Ma C., Wu J., Data Clustering: Theory, Algorithms, and Applications. Society for Industrial and Applied Mathematics, 2007.
25. Koppel M., Winter Y. Determining if two documents are written by the same author // J. of the Association for Information Science and Technology. 2014. No. 65(1). Pp. 178–187.
26. Плеханова И.И. Внутрилитературная полемика начала XXI века: мотивы и содержание («Околоноля» Н. Дубовицкого и «S.N.U.F.F.» В. Пелевина) // Филологический класс. 2013. № 33(3). С. 26–32.
References
1. Bogdanova, O.V., Kibalnik, S.A., & Safronova, L.V. (2008). Литературные стратегии Виктора Пелевина [Literary strategies of Victor Pelevin]. Saint Petersburg: Petropolis.
2. Polotovski, S.A. & Kozak, R.V. (2012). Пелевин и поколение пустоты [Pelevin and the generation of emptiness]. Moscow: Mann, Ivanov and Ferber.
3. Shilova, N.L. (2011). Визионерские мотивы в постмодернистской прозе 1960–1990-х годов (Вен. Ерофеев, А. Битов, Т. Толстая, В. Пелевин) [Visionary motives in postmodern prose of the 1960–1990s (Ven. Erofeev, A. Bitov, T. Tolstaya, V. Pelevin)]. Petrozavodsk: The Publ. House of the Karelian State Pedagogical Academy.
4. Khagi, S. (2018). Alternative Historical Imagination in Viktor Pelevin. Slavic and Eastern European Journal, 62(3), 483–502.
5. Khagi, S. (2023). Пелевин и несвобода: Поэтика, политика, метафизика [Pelevin and Unfreedom: Poetics, Politics, Metaphysics]. Moscow: Novoe literaturnoie obozrenie.
6. Lanin, B.A. (2015). Новая старая литературократия: Сорокин и Пелевин в борьбе с традициями [The new old literaturocracy: Sorokin and Pelevin's fight against tradition]. Cennosti i smysly, 40(6), 110–123.
7. Bogdanova, O.V. (2005). Концептуалист, писатель и художник Владимир Сорокин [Conceptualist, writer and artist Vladimir Sorokin]. Saint Petersburg: Saint Petersburg State University.
8. Andreeva, N.N., & Bibergan, E.S. (2012). Игры и тексты Владимира Сорокина [Games and texts of Vladimir Sorokin]. Saint Petersburg: Petropolis.
9. Marusenkov, M.P. (2012). Абсурдопедия русской жизни Владимира Сорокина: Заумь, гротеск и абсурд [The Absurdopedia: Vladimir Sorokin's Russian Life in Abstraction, Grotesque, and Absurdity]. Saint Petersburg: Aleteia.
10. Bibergan, E.S. (2014). Рыцарь без страха и упрёка: Художественное своеобразие прозы Владимира Сорокина [A Knight without Fear and Reproach: The Artistic Originality of Vladimir Sorokin's Prose]. Saint Petersburg: Petropolis.
11. Kalinin, I.A., Lipovetski, M.N., Dobrenko, E.A. et al. (2018). «Это просто буквы на бумаге…». Владимир Сорокин: после литературы [“These are just letters on paper... ". Vladimir Sorokin: After Literature ]. Moscow: Novoe literaturnoie obozrenie.
12. Stamatatos, E. (2009). A survey of modern authorship attribution methods. J. Amer. Soc. for Information Science and Technology, 60(3), 538–556.
13. Tempestt, N., Kalaivani, S., Aneez, F., Yiming, Y., Yingfei, X., & Damon, W. (2017). Surveying Stylometry Techniques and Applications. ACM Comput. Surv., 50(6), Article 86.
14. La Inteligencia Artificial ayuda a descubrir una obra desconocida de Lope de Vega en los fondos de la BNE, Biblioteca Nacional de España [Artificial Intelligence helps to discover an unknown work by Lope de Vega in the collections of the BNE, National Library of Spain], https://www.bne.es/es/noticias/inteligencia-artificial-ayuda-descubrir-obra-desconocida-lope-vega-fondos-bne
15. Zenkov, A.V. (2017). Новый метод стилеметрии на основе статистики числительных [A new method of stylometry based on numerals statistics]. Kompiuternye issledovaniia i modelirovanie, 9(5), 837–850.
16. Zenkov, A.V. (2018). A Method of Text Attribution Based on the Statistics of Numerals. J. of Quantitative Linguistics, 25(3), 256–270.
17. Zenkov, A.V., & Místecký, M. (2019). The Romantic Clash: Influence of Karel Sabina over Macha’s Cikani from the Perspective of the Numerals Usage Statistics. Glottometrics, 46, 12–28.
18. Zenkov, A.V. (2021). Stylometry and Numerals Usage: Benford’s Law and Beyond. Stats, 4, 1051–1068.
19. Zenkov, A., & Místecký, M. (2022). Young Vladimír Vašek? – A Numerals Analysis Contribution to the Bezruč−Hrzánský Identity Issue. Naše řeč, 105(3), 151–161.
20. Zenkov, A.V. (2023). Литературные мистификации и авторское использование числительных [Literary hoaxes and the use of numerals by authors]. Filologicheskie nauki. Voprosy teorii i praktiki, 16(11), 3696–3709. https://doi.org/10.30853/phil20230568
21. Zenkov, A.V. (2023). Under a False Flag: Literary Hoaxes and the Use of Numerals. Litera, 10, 86–109. Retrieved from https://doi.org/10.25136/2409-8698.2023.10.68743
22. Zenkov, A.V., & Ermakov, N.E. (2023). Числительные в текстах как характерная особенность авторского стиля [The use of numerals in texts is a distinctive feature of the author's writing style]. Russian Linguistic Bulletin, 45(9). Retrieved from https://doi.org/10.18454/RULB.2023.45.28
23. Moisl, H. (2015). Cluster Analysis for Corpus Linguistics. De Gruyter Mouton.
24. Gan, G., Ma, C., & Wu, J. (2007). Data Clustering: Theory, Algorithms, and Applications. Society for Industrial and Applied Mathematics.
25. Koppel, M., & Winter, Y. (2014). Determining if two documents are written by the same author. J. of the Association for Information Science and Technology, 65(1), 178–187.
26. Plekhanova, I.I. (2013). Внутрилитературная полемика начала XXI века: мотивы и содержание («Околоноля» Н. Дубовицкого и «S.N.U.F.F.» В. Пелевина) [The intra-literary debate of the early 21st century: themes and content (N. Dubovitsky's "Okolonolia" and V. Pelevin's "S.N.U.F.F.")]. Filologicheski klass, 33(3), 26–32.

Результаты процедуры рецензирования статьи

В связи с политикой двойного слепого рецензирования личность рецензента не раскрывается.
Со списком рецензентов издательства можно ознакомиться здесь.

Представленный к публикации материал ориентирован на манифестацию формального подхода в изучении литературных текстов. На это ориентирует сам автор, полученные данные также свидетельствуют об этом. На мой взгляд, имеющийся формат допустим как альтернатива, вероятно, что работу / алгоритм (программу) можно использовать при изучении не только текстов Виктора Пелевина и Владимира Сорокина, но и других. Суждения по ходу работы объективны, выверены, системы: например, «перечисленные художнические особенности в значительной степени свойственны и творчеству Владимира Сорокина, которого, наряду с Пелевиным, считают одной из двух звезд русской постмодернистской литературы, находящихся в непрерывном негласном противостоянии [6–11]. Не только на низовом читательском уровне, но и в литературной критике тексты этих двух авторов нередко рассматриваются совместно», или «для каждого текста вычислена обратная плотность числительных как результат деления объёма текста на количество найденных в нём числительных. Чем меньше обратная плотность, тем чаще в тексте встречаются числительные. Уже сравнение обратных плотностей числительных обнаруживает существенное различие между произведениями Пелевина (№1–15 в табл. 1) и Сорокина (№16–22): средние обратные плотности различаются на треть; в текстах Сорокина числительные используются чаще (детализация больше). При этом по размаху колебаний обратной плотности в проанализированных текстах (отношение максимальной и минимальной плотности: в 1,6 и 2,2 раза в текстах Пелевина и Сорокина, соответственно) манера использования числительных более единообразна у Пелевина» и т.д. Текст дробится на смысловые блоки, это вполне уместно, полученные результаты обобщены в таблично-схематичном формате. В целом концепция автора изложена убедительно, но некоторые моменты могли быть прописаны точнее. Например, не очень понятна связь «использования в стиле того или иного автора числительных с психологическими особенностями»: «применительно к художественному (не жёстко фактографическому) тексту, порожденному свободной фантазией, естественно предположить, что употребление числительных связано с психологическими особенностями автора, незаметно для него самого влияющими на результат творчества. Следовательно, манера использования числительных – это авторская особенность (fingerprint), позволяющая при определённых обстоятельствах решить проблему авторства текста». Вполне удачно выбрана литературная база сравнения: думаю, что данный вариант все же доказывает «авторство» того или иного текста. Хотя проблема, на мой взгляд, должна решаться и в других исследовательских плоскостях. В итоге автор приходит к следующему выводу: «разрабатываемый нами новый подход к задачам стилометрии, основанный на анализе статистики числительных в текстах, при всей его простоте, демонстрирует высокую эффективность и чувствительность. Тексты В. О. Пелевина и В. Г. Сорокина, сравнительный анализ которых выполнялся до сих пор лишь в рамках традиционного описательного филологического подхода, впервые подвергнуты формальному количественному анализу, правильно распределившему тексты согласно авторству. Обнаружены значимые авторские различия в манере использования числительных. Привлечение для анализа текстов сторонних авторов (impostors) усиливает значимость полученного результата и подтверждает его неслучайный характер. Метод пригоден для атрибуции текстов». Считаю, что можно скорректировать список источников: некоторые формальные моменты желательно устранить. Например, «Хаги С. Пелевин и несвобода: Поэтика, политика, метафизика. М.: Новое литературное обозрение, 2023. – 392 с. ISBN: 978-5-4448-1967-8» и т.д. В целом же тема данной работы раскрыта, цель достигнута, результат наличен. Рекомендую статью «Пелевин vs Сорокин: опыт стилометрического сопоставления» к публикации в журнале «Филология: научные исследования».