Перевести страницу на:  
Please select your language to translate the article


You can just close the window to don't translate
Библиотека
ваш профиль

Вернуться к содержанию

Историческая информатика
Правильная ссылка на статью:

Автографы Петра I: чтение технологиями искусственного интеллекта и создание электронного архива

Базарова Татьяна Анатольевна

ORCID: 0000-0001-9380-5921

кандидат исторических наук

Зав. Научно-историческим архивом и группой источниковедения, Санкт-Петербургский институт истории Российской академии наук

195196, Россия, г. Санкт-Петербург, ул. Громова, 12

Bazarova Tat'yana Anatol'evna

PhD in History

Head of the Scientific and Historical Archive and a Group of Source Studies

195196, Russia, Saint Petersburg, Gromova str., 12

tbazarova@yandex.ru
Проскурякова Мария Евгеньевна

ORCID: 0000-0003-3000-999X

кандидат исторических наук

Старший научный сотрудник, Санкт-Петербургский институт истории Российской академии наук

197082, Россия, г. Санкт-Петербург, ул. Оптиков, 47

Proskuryakova Mariya Evgen'evna

PhD in History

Senior researcher, Saint Petersburg Institute of History of Russian Academy of Sciences

197082, Russia, Saint Petersburg, Optikov str., 47

m-proskuryakova@mail.ru

DOI:

10.7256/2585-7797.2022.4.39224

EDN:

QMWYXE

Дата направления статьи в редакцию:

21-11-2022


Дата публикации:

30-12-2022


Аннотация: Статья посвящена современным цифровым методам работы с рукописным наследием Петра I. Они были применены в рамках реализации научного проекта «Автографы Петра Великого: Чтение технологиями искусственного интеллекта». Проект был инициирован Российским историческим обществом и реализован специалистами Санкт-Петербургского института истории РАН, ПАО «Сбербанк». В статье описана методика подготовки набора данных для создания программы машинного чтения рукописей Петра I («Digital Петр»). Особый акцент авторами сделан на выработанных в ходе проекта принципах передачи исторического текста. Кроме того, проанализированы случаи использования Петром I небуквенных символов и вызванные этим сложности при формировании набора данных. В статье также отражены результаты работы созданного алгоритма и определены варианты организации петровского текста, которые снижают качество распознавания. Авторами также уделено внимание электронному архиву «Автографы Петра I», который стал продолжением проекта о машинном чтении рукописей первого русского императора. В архиве, над которым продолжается работа, представлены цифровые копии автографов Петра I, результаты их распознавания программой Digital Петр, а также научные публикации этих уникальных исторических источников. Интернет-портал "Автографы Петра I" связан с ресурсом: "Биохроника Петра Великого день за днем" (создан на сайте НИУ ВШЭ). Связь двух сайтов открывает перед исследователями дополнительные возможности: каждый оцифрованный автограф вводится в исторический контекст.


Ключевые слова:

Преобразование текстов, Обработка цифровых архивов, Машинное чтение, Электронный архив, Петр I, Палеография, Компьютерное зрение, Digital Петр, Автографы Петра I, Биохроника Петра Великого

Abstract: The article is devoted to modern digital methods of working with the handwritten heritage of Peter I. They were applied within the framework of the scientific project "Autographs of Peter the Great: Reading by artificial intelligence technologies". The project was initiated by the Russian Historical Society and implemented by specialists of the St. Petersburg Institute of History of the Russian Academy of Sciences, Sberbank PJSC. The article describes the methodology of preparing a data set for creating a program for machine reading of the manuscripts of Peter the Great ("Digital Peter"). Special emphasis is placed by the authors on the principles of transcribing of the historical text developed during the project. In addition, the cases of the use of non-letter characters by Peter I and the difficulties caused by this in the formation of a data set are analyzed. The article also reflects the results of the created algorithm and identifies variants of the organization of the text of Peter I, which reduce the quality of recognition. The authors also paid attention to the electronic archive "Autographs of Peter I", which became a continuation of the project on machine reading of the manuscripts of the first Russian emperor. The archive, which is being worked on, contains digital copies of Peter's autographs, the results of their recognition by the Digital Peter program, as well as scientific publications of these unique historical sources. The Internet portal "Autographs of Peter I" is associated with the resource: "Biochronics of Peter the Great day by day" (created on the HSE website). The connection of the two sites opens up additional opportunities for researchers: each digitized autograph is introduced into a historical context.


Keywords:

Data preparation, Processing of digital archives, Machine reading, Electronic archive, Peter I, Paleography, Computer vision, Digital Peter, Autographs of Peter the Great, Biochronics of Peter the Great

Первые публикации автографов Петра I увидели свет в конце XVIII в. и еще не носили научного характера. На заре становления российской исторической науки ученых интересовало только содержание документа и возможность его интерпретировать [4, 8, 9]. Положение изменилось ко второй половине XIX в., когда историки разработали и стали применять принципы научной публикации. 200-летний юбилей Петра I побудил ученых обратить пристальное внимание на его эпистолярное наследие. На волне роста в российском обществе интереса к жизни и деятельности царя-реформатора академик Афанасий Федорович Бычков (который обладал значительным опытом изучения и публикации петровских документов) выдвинул идею выявить, скопировать и опубликовать все рассредоточенные по различным государственным, ведомственным и частным собраниям письма и бумаги Петра I. Замысел А. Ф. Бычкова поддержал министр народного просвещения Дмитрий Андреевич Толстой и одобрил император Александр II.

В конце 1872 г. была создана Комиссия по изданию писем и бумаг императора Петра Великого (в состав комиссии вошли петербургские и московские ученые С. М. Соловьев, Н. А. Попов, К. Н. Бестужев-Рюмин, Е. Е. Замысловский, Н. В. Калачов, А. Е. Викторов). В 1887 г. вышел из печати первый том «Писем и бумаг императора Петра Великого». В него были включены документы за 1688–1701 гг., как написанные писарским почерком и заверенные подписью царя-реформатора, так собственноручные письма и указы Петра I [5, 6]. В предисловии, разъясняя причины задержки публикации первого тома, члены комиссии отметили и «трудность найти лиц, умеющих правильно читать связный и неразборчивый почерк Петра Великого» [5, т. 1, с. XIII].

Всего до революции было опубликовано шесть томов; первый выпуск седьмого тома вышел из печати в 1918 г., а второй — только в 1946 г. Работа, которая велась медленно и с большими перерывами, не завершена до сих пор. В 2022 г. увидел свет первый выпуск четырнадцатого тома, охватывающий события января—июня 1714 г. Материалы, относящиеся к последним десяти годам жизни первого российского императора, практически не введены в научный оборот. В связи с этим особую важность приобретает оцифровка и создание единой базы для хранения цифровых копий автографов Петра I, а также использование современных компьютерных технологий для машинного чтения его рукописного наследия.

В июне 2020 г. сотрудники Санкт-Петербургского института истории РАН (далее — СПбИИ РАН) и ПАО «Сбербанк» приступили к исполнению проекта «Автографы Петра Великого: Чтение технологиями искусственного интеллекта», который инициировало Российское историческое общество [2, 3]. Главной задачей проекта являлось создание программного обеспечения для распознавания автографов Петра I и размещение ее в открытом доступе в сети «Интернет». Пути решения проблемы в тесном сотрудничестве искали историки, специалисты в области вспомогательных исторических дисциплин и вычислительной техники.

В Санкт-Петербургском институте истории РАН была создана рабочая группа, состоявшая из специалистов по истории Петровской эпохи, а также палеографии и археографии. Ее ключевой задачей стал отбор и транскрибирование петровских автографов. Отбор документов проводился в т. 7–13 издания «Письма и бумаги императора Петра Великого». В этих томах приведены современные (или близкие к ним) архивные шифры документов за 1708–1713 гг. из собрания РГАДА. Сотрудники РГАДА проводили оцифровку материалов и передавали копии СПбИИ РАН. Члены рабочей группы транскрибировали полученные документы, при этом результаты прочтения каждого текста проходили двойную проверку. Варианты прочтения документов, приведенные в «Письма и бумаги императора Петра Великого», использоваться не могли. Для обучения искусственного интеллекта требовалось выработать иные принципы передачи текста, которые значительно отличались от требований современной археографии. Необходимо было максимально точно передать все знаки (буквы), которые использовал Петр I. Группа специалистов «Сбербанка», которую возглавили Д. В. Димитров и М. С. Потанин, создали пробный алгоритм с использованием небольшого числа транскрипций (около 90 автографов). На основании первой итерации алгоритма удалось уточнить принципы транскрибирования текста. Они сводились к следующему: а) пробелы между словами расставлялись; б) сокращения слов не раскрывались; в) буквы, написанные над строкой, вносились в строку; г) заглавные буквы не расставлялись; д) знаки препинания и знаки переноса строки не расставлялись; е) использовались вышедшие из употребления буквы «i» и «ѣ»; ж) воспроизводились зачеркнутые слова и строки; з) строки, вписанные вертикально по полю, воспроизводились в конце текста; и) установлены символы для воспроизведения знаков, которые использовал Петр I (например, знак креста в круге, который употреблялся им для обозначения места текстовой вставки). При компьютерном наборе текст транскрибировался построчно, а строки нумеровались (Рисунок 1).

Text, letter

Description automatically generated

Рисунок 1. Петровский автограф и построчная транскрипция текста (Письмо Петра I — П. П. Шафирову, 18 сентября 1711 г. // РГАДА. Ф. 142. Оп. 2. Д. 7. Л. 157).

Во время тестирования алгоритма были выявлены две технические ошибки. Первая заключалась в использовании неверного символа для буквы «i»: в некоторых транскрипциях вместо знака из латинского алфавита (конвенциональный вариант) применялся знак из украинского алфавита (неконвенциональный). Вторая ошибка произошла из-за разнообразия символов, которые употребляли палеографы при передаче знаков, применявшихся Петром I для обозначения вставки в текст. В многостраничных текстах, которые царь собственноручно правил, он использовал несколько вариантов для знака вставки (не менее десяти): а) крест [7, л. 32, 33 об., 37, 180, 195 об., 221, 222, 385 об., 409; б) крест, слева заключенный в полукруг [7, л. 157, 180, 181 об., 230, 286, 304, 385 об., 409]; в) крест в круге [7, л. 240, 279 об., 367., 409]; г) два креста, поставленные рядом [7, л. 196 об., 197]; д) косой (андреевский) крест [7, л. 367 об., 385, 395]; е) косой крест, сверху заключенный в полукруг [7, л. 424]; ж) косой крест, слева заключенный в полукруг [7, л. 181 об.]; з) косой крест в круге [7, л. 409]; и) косая черта, дважды перечеркнутая по горизонтали [7, л. 39 об., 40, 279 об.]; к) две вертикальные черты, перечеркнутые двумя горизонтальными чертами («решетка») [7, л. 151 об.]; л) овал в верхней части строки, соединенный с овалом в нижней части строки косой чертой [7, л. 306а, 307]. Некоторые из перечисленных символов использовались в единичных случаях, поэтому способ их передачи заранее не оговаривался. Во время тестирования алгоритма строки с символами-«не буквами» и символами-«не цифрами» остались не распознанными: исчез весь текст после неопознанного символа. Поэтому после выявления ошибок весь массив транскрипций был вновь просмотрен, а неверные символы заменены (Рисунок 2).

Text, letter

Description automatically generated

Рисунок 2. Знаки, используемые Петром I для обозначения вставки в текст («Сентенция» о действиях русской армии и флота в Финляндии, 11–12 мая 1713 г. Фрагмент // РГАДА. Ф. 9. Отд. I. Кн. 21. Л. 409).

После завершения работы с транскрибированием рукописей коллектив перешел к разметке данных в специализированной программе, доступ к которой предоставили сотрудники «Сбербанка». В программу загрузили фотокопии всех транскрибированных документов (719 страниц). Палеографам необходимо было с помощью ломаных линий отделить одну строку от другой. При этом следовало максимально аккуратно обводить элементы текста, включая буквы, написанные над строкой, и все элементы букв (петли, полупетли и мачты). Это требовалось для того, чтобы программа получила максимально большой набор шаблонов (вариантов написания Петром I букв и цифр) для корректного распознавания текста в будущем. На описываемом этапе к коллективу присоединились аспиранты и магистранты Научно-исследовательского университета «Высшая школа экономики». Всего совместными усилиями было транскрибировано и размечено 10512 строк, которые составили набор данных, переданных для дальнейшей работы программистов и проведения соревнования на лучшее решение. Соревнование осенью 2020 г. провел ПАО «Сбербанк» с целью получить другие варианты алгоритма для распознавания автографов и определить различные подходы к решению поставленной задачи (Рисунок 3).

Text, letter

Description automatically generated

Рисунок 3. Разметка фотокопии петровского автографа и построчная транскрипция текста (РГАДА. Ф. 142. Оп. 2. Д. 7. Л. 157).

Итогом работы коллектива историков, палеографов и специалистов по анализу данных стала компьютерная программа, которая размещена на сайте Digital Петр по адресу https://www.sber.ru/digital-petr/ [2]. Цифровые копии петровских автографов загружаются на ресурсе для распознавания. После транскрибирования интерфейс отражает одновременно и копию документа, и построчно прочитанный текст (все строки пронумерованы). На сайте также есть возможность скачать распознанный текст в формате docx.

После завершения работы над сайтом было проведено тестирование программного обеспечения на нескольких десятках петровских рукописей, которые не входили в набор учебных данных и не были ранее опубликованы. Для проверки качества распознавания на сайт был загружен документ из собрания СПбИИ РАН: «Замечания Петра I к “Линия де баталии” русских кораблей» 1719 г. [1, л. 4] (Рисунок 4).

Text

Description automatically generated

Рисунок 4. Распознавание автографа Петра I на сайте Digital Петр https://www.sber.ru/digital-petr/ (Замечания Петра I к «Линия де баталии» русских кораблей, 1719 г. // Архив СПбИИ РАН. Колл. 277. Оп. 1. Д. 3. Л. 4).

Из 365 букв петровского текста (из которых 64 написаны над строкой) алгоритм «ошибся» только в четырех случаях. Это сложные для чтения слова: в 1-ой строке неверно прочитано зачеркнутое слово со следами правки: «увидат» вместо «увидят»; в 13-й строке прочитано «он» вместо «с нами», здесь Петр I один слог перенес под строку, а чернила оказались размазаны. В 9-й строке искусственный интеллект неверно поставил пробел, при этом правильно распознав все буквы в слове «во//просителю». Наконец, не были транскрибированы слова «на грот-стенге», в 4-ой строке «прочитано» так: «награ станге». Слово «грот-стеньга» стало новым для программы, оно не встречалось в автографах Петра I, использованных для обучения компьютера. При транскрибировании компьютером смысл документа не подвергся искажениям. Точность распознавания составила 97,4% (Рисунок 5).

Text, letter

Description automatically generated

Рисунок 5. Результаты распознавания текста на сайте Digital Петр (Архив СПбИИ РАН. Колл. 277. Оп. 1. Д. 3. Л. 4).

В ходе тестирования программы были выявлены четыре группы проблемных случаев, когда алгоритм не «читает» текст или допускает ошибки: а) строки, написанные вертикально (рядом с основным текстом или под текстом); б) строки, вписанные Петром I между строк писарского текста; в) текст, раздробленный на столбцы (два и более); г) буквы латинского алфавита. При транскрибировании текстов, которые содержат перечисленные особенности, процент точности чтения снижается. Однако, насколько можно судить по изученному комплексу петровских автографов, общее число таких документов невелико. Безусловно, результат также зависит и от качества цифровой копии загружаемого в программу архивного документа.

Во время реализации проекта, посвященного автографам Петра I, алгоритм протестировали на скорописных документах второй половины XVII века (транскрибировано и размечено 3500 строк). Искусственный интеллект показал высокую точность распознавания текстов (95,8%). Результатами этой работы в настоящее время нельзя воспользоваться, так как сайт, созданный в рамках проекта «Автографы Петра Великого: Чтение технологиями искусственного интеллекта» рассчитан исключительно на расшифровку петровских рукописей. Поэтому при загрузке других документов программа не работает. Однако за время реализации проекта коллективом СПбИИ РАН был накоплен уникальный опыт формирования наборов данных, необходимых для обучения алгоритма. Этот опыт может быть использован в будущем для создания новых моделей, ориентированных на машинное чтение текстов различных эпох и алфавитов.

В юбилейный петровский год, 2022 г., проект «Digital Петр» получил дальнейшее продолжение. По инициативе Российского исторического общества научные сотрудники вместе с IT-специалистами А. Ю. Ходотом и Е. В. Ригиным начали работу над новым сайтом, также направленным на изучение и популяризацию эпистолярного наследия Петра I. Вдохновением послужил проект цифрового академического издания сочинений А. С. Пушкина «Pushkin Digital» (https://pushkin-digital.ru/), который превратился в настоящую мультимедийную энциклопедию произведений великого русского поэта.

На разработанном IT-специалистами сайте «Автографы Петра I» (https://peterscript.ru/) были запрограммированы следующие страницы:

1. Главная.

2. Каталог документов с двумя вариантами вывода (списком и плиткой), а также контекстным поиском по документам, сортировкой по различным параметрам, группировкой по году и возможностью выбора количества результатов на странице с памятью выбора.

3. Страница документа с двумя колонками для планшетов и персональных компьютеров и одной для мобильных устройств. В первой колонке выводятся изображения рукописи с возможностью увеличения и переключения между изображениями, во второй — расшифровка каждой страницы рукописи через «Digital Petr», изображения публикации и публикация в формате pdf. Расшифровка через «Digital Petr» и изображения публикации были привязаны к каждому изображению рукописи (Рисунок 6).

Text

Description automatically generated

Рисунок 6. Собственноручное письмо Петра I Г. Ф. Долгорукому, 13 июня 1709 г. (РГАДА. Ф. 9. Отд. I. Кн. 60. Л. 30) и результаты чтения петровского текста программой «Digital Петр», представленные на сайте «Автографы Петра I. Электронный архив» https://peterscript.ru/document/14

4. Текстовая страница с управлением через Панель администратора.

В настоящее время на сайте размещено свыше 170 писем, указов и записок Петра I за 1707–1713 гг., оригиналы которых хранятся в РГАДА и Архиве СПбИИ РАН. Каждое изображение автографа снабжено кратким заголовком с датой, указанием на место хранение и публикацию. У пользователя есть возможность осуществлять сортировку и поиск по данным параметрам, а также поиск по адресатам петровских писем. Каждая цифровая копия архивного документа сопровождаются копией ее публикации в «Письмах и бумагах императора Петра Великого» в форматах pdf и jpg, а также транскрибированной на сайте «Digital Петр». Таким образом, один и тот же текст оказался представленным в различных ипостасях. У специалиста или заинтересованного читателя появилась возможность прочитать петровский почерк самостоятельно, сравнить результат с публикацией в «Письмах и бумагах императора Петра Великого» (Рисунок 7) или с распознанным искусственным интеллектом.

Text

Description automatically generated

Рисунок 7. Собственноручное письмо Петра I Г. Ф. Долгорукому, 13 июня 1709 г. (РГАДА. Ф. 9. Отд. I. Кн. 60. Л. 30) и научная публикация текста этого письма в «Письмах и бумагах императора Петра Великого» (М., 1950. Т. 9. Вып. 1. № 3227. С. 208), представленные на сайте «Автографы Петра I. Электронный архив» https://peterscript.ru/document/14

Также было принято решение размещенные на сайте документы «привязывать» к биохронике Петра Великого (Itinera petri: биохроника Петра Великого день за днем; https://spb.hse.ru/humart/history/peter/ ). Подготовленная Е. В. Анисимовым и размещенная на сайте НИУ ВШЭ в Санкт-Петербурге база данных, позволяет день за днем проследить жизнь и деятельность первого российского императора. Связь двух сайтов открывает перед исследователями дополнительные возможности. Например, узнать, что делал в день отправки размещенного на сайте письма первый российский император, какие еще указы подписал, с кем встречался или кто его сопровождал в поездке. Следовательно, каждый оцифрованный автограф вводится в исторический контекст.

Таким образом исследователи и все интересующие историей России Нового времени получат уникальную возможность работать с петровскими наследием еще до завершения фундаментальной публикации «Писем и бумаг императора Петра Великого» и оценить вклад, который внес Петр I в становление российской государственности.

Библиография
1. Архив СПбИИ РАН. Колл. 277 (Коллекция документов Петра I). Оп. 1. Д. 3.
2. Базарова Т. А., Димитров Д. В., Потанин М. С., Проскурякова М. Е. Распознать и транскрибировать: Автографы Петра Великого и технологии искусственного интеллекта // Воронцово поле. 2020. № 4. С. 36–41.
3. Базарова Т. А., Потанин М. С., Проскурякова М. Е. «…Он нисколько не заботился о синтаксисе»: Может ли искусственный интеллект прочитать письма Петра I? // Родина. 2022. № 6 (Июнь); С. 112–115.
4. Голиков И. И. Деяния Петра Великого, мудрого преобразителя России, собранные из достоверных источников и расположенные по годам. Т. 1–15. М.: Типография Н. Степанова, 1837–1843.
5. Письма и бумаги императора Петра Великого: [в 14 т.]. СПб. (Л.); М. 1887–2022.
6. Подъяпольская Е. П. Об истории и научном значении издания «Письма и бумаги императора Петра Великого» // Археографический ежегодник за 1972 г. М.: Наука, 1974. С. 56–70.
7. Российский государственный архив древних актов. Ф. 9 (Кабинет Петра I и его продолжение). Отд. I. Кн. 21.
8. Собрание разных записок и сочинений, служащих к доставлению полного сведения о жизни и деяниях государя императора Петра Великого. Ч. 1–10 / Изданное трудами и иждивением Феодора Туманского. СПб.: Печатано у Шнора, 1787–1788.
9. Тетрати записныя всяким писмам и делам, кому что приказано и в котором числе от его императорского величества Петра Великого 1704, 1705 и 1706 годов: С приложением примечаний о службах тех людей, к которым сей государь писывал / С предисл. и примеч. изд. М. М. Щербатова. СПб.: Типография правительствующего Сената, 1774.
References
1. Archive of Saint Petersburg Institute of History Russian Academy of Sciences. Coll. 277 (Collection of documents of Peter I). Opis’ 1. Delo 3.
2. Bazarova, T. A., & Dimitrov, D. V., & Potanin, M. S., & Proskuryakova, M. E. (2020). Распознать и транскрибировать: Автографы Петра Великого и технологии искусственного интеллекта [To recognize and Transcribe: Autographs of Peter the Great and Artificial Intelligence Technologies]. Vorontsovo pole, 4, 36–41.
3. Bazarova, T. A., & Potanin, M. S., & Proskuryakova, M. E. (2022). “…Он нисколько не заботился о синтаксисе”: Может ли искусственный интеллект прочитать письма Петра I? [“He did not care about the syntax”: Can artificial intelligence read the letters of Peter I?]. Rodina, 6 (June), 112–115.
4. Golikov, I. I. (1837–1843). Деяния Петра Великого, мудрого преобразителя России, собранные из достоверных источников и расположенные по годам [Acts of Peter the Great, the wise reformer of Russia, collected from reliable sources and arranged by years]. Vol. 1–15. Moscow: Printing house of N. Stepanov.
5. Письма и бумаги императора Петра Великого [Letters and papers of Emperor Peter the Great]. (1887–2022). Vol. 1–14. Saint Petersburg (Leningrad), Moscow.
6. Pod’’yapol’skaya, E. P. (1974). Об истории и научном значении издания “Письма и бумаги императора Петра Великого” [On the history and scientific significance of the publication “Letters and Papers of Emperor Peter the Great]. In: S. O. Shmidt (Ed.), Arheograficheskij ezhegodnik za 1972 god (pp. 56–70). Moscow: Nauka.
7. Russian State Archive of Ancient Acts. Fond 9 (Documents from Peter I office). Otdelenie I. Kniga 21.
8. Tumansky, F. O. (Ed.). (1787–1788). Собрание разных записок и сочинений, служащих к доставлению полного сведения о жизни и деяниях государя императора Петра Великого [A collection of various notes and writings that serve to deliver complete information about the life and acts of the Emperor Peter the Great]. Part. 1–10. Saint Petersburg: Printed by Shnor.
9. Shcherbatov, M. M. (Ed.). (1774). Тетрати записныя всяким писмам и делам, кому что приказано и в котором числе от его императорского величества Петра Великого 1704, 1705 и 1706 годов: С приложением примечаний о службах тех людей, к которым сей государь писывал [Notebooks for all sorts of letters and acts, to whom what is ordered and in which number from His Imperial Majesty Peter the Great 1704, 1705 and 1706: With notes on the services of those people to whom this sovereign wrote]. Saint Petersburg: Senate printing house.

Результаты процедуры рецензирования статьи

В связи с политикой двойного слепого рецензирования личность рецензента не раскрывается.
Со списком рецензентов издательства можно ознакомиться здесь.

Автографы Петра I: чтение технологиями искусственного интеллекта и создание электронного архива // Историческая информатика.
Политические и научно-просветительские события последних дней, выступление главы нашего государства на международной конференции «Путешествие в мир искусственного интеллекта» 24 ноября 2022 г. поразили воображение многих гуманитариев. На фоне этой сенсации становится очевидна актуальность рецензируемой статьи. Ее научная новизна определяется как новой постановкой проблемы, так а новыми вариантами ее решения. Статья есть важное событие в практическом внедрении искусственного интеллекта в процесс введения в научный оборот рукописей. Рукописи Петра I читать современному человеку практически невозможно, если не иметь специального образования. Статья начинается с краткой справки о том, что научная идея прочитать рукописи Петра возникла еще в середине XIX в., а в конце XIX в. появились первые публикации документов Петра. Заметим, что распознанием текстов Петра занимался в начале ХХ в. известный библиофил вице-губернатор Архангельской губернии А.Ф. Шидловский, когда обнаружил в архивах Архангельска и в 1909 г. издал рукописи Петра. Авторы статьи отмечают, что чтение, изучение и публикация «Писем и бумаг императора Петра Великого» продвигались медленно и с большими перерывами и не завершены до сих пор. Задача заключалась в том, чтобы использовать современные компьютерные технологии для машинного чтения рукописного наследия, оцифровать и создать единую базу для хранения цифровых копий автографов Петра I, а также создать программное обеспечение для распознавания автографов и размещение ее в открытом доступе в Интернете. Для обучения искусственного интеллекта требовалось выработать новые принципы передачи текста. Они значительно отличаются от современной археографии. Фактически был создан особый алфавит букв и знаков, которыми оперировал Петр. Это значительно облегчает дальнейшую работу. В статье объяснено, насколько кропотливой была выверка значения каждого знака или буквы в бумагах Петра, т.к. машине требовалось их не спутать и правильно прочитать. Результаты этой работы заинтересуют самые разные круги читателей. Текст значительно оживляют и делают понятными иллюстрации, позволяющие увидеть промежуточные результаты работы. В заключительной части статьи сказано, насколько велика точность распознавания текстов (97,4 %). Информация данной статьи разнопланова и внушительна, потому что уже сейчас причитано свыше 170 писем, указов и записок Петра I за 1707–1713 гг., оригиналы которых хранятся в двух архивах. Стиль, структура и содержание статьи выдержаны в единстве и доступны рядовому молодому читателю. Библиография отражает центральные архивы, в которых имеются документы Петра, и главные исследования по проблемам изучения трудночитаемых текстов. Статью рекомендую опубликовать.