Перевести страницу на:  
Please select your language to translate the article


You can just close the window to don't translate
Библиотека
ваш профиль

Вернуться к содержанию

Филология: научные исследования
Правильная ссылка на статью:

Методы приема и обработки текста при создании авторских словарей (на примере авторского словаря к серии книг о Гарри Поттере "Harry Potter Lexicon Encyclopedia")

Борунов Артем Борисович

ORCID: 0000-0003-2507-7218

кандидат филологических наук

доцент кафедры романо-германских языков Московский государственный гуманитарно-экономический университет

107150, Россия, г. Москва, ул. Лосиноостровская, 49

Borunov Artem Borisovich

PhD in Philology

Associate Professor of the Department of Romano-Germanic Languages Moscow State University of Humanities and Economics

107150, Russia, g. Moscow, ul. Losinoostrovskaya, 49

borunov.artem@yandex.ru
Другие публикации этого автора
 

 

DOI:

10.7256/2454-0749.2017.2.20612

Дата направления статьи в редакцию:

02-10-2016


Дата публикации:

29-06-2017


Аннотация: В данной статье рассматриваются методы и приемы обработки текста при создании авторских словарей, что является предметом исследования. в качестве объекта был выбран авторский словарь к серии книг о Гарри Поттере. Автор подробно рассматривает методику выборки слов для составления авторского словаря. Основной целью статьи является определение методов обработки текста и их применение при создании авторского словаря. В работе представлен теоретический обзор основных приемов обработки авторского текста. В текст статьи были включены англоязычные примеры для иллюстрации теоретических положений. Методами исследования явились метод ручной выборки, анализ и синтез полученных данных, описание на материале конкретного исследуемого произведения. Основными выводами проведенного исследования являются идеи о важности данной кропотливой лексикографической работе. Особым вкладом автора в исследование темы является подробное описание этапов работы над составлением авторского словаря англоязычного автора. Новизна исследования заключается в описании методика поэтапной ручной обработки материала, которая дополняется машинной обработкой.


Ключевые слова:

авторские словари, методы обработки текста, обработка текста, ручная выборка данных, этапы работы, Словарь Гарри Поттера, лингвистический анализ, прикладная лексикография, структура словаря, современный английский язык

Abstract: In his research Borunov examines methods and techniques of text processing used to create author's dictionaries, the latter being the subject of the research. The object of the research is the author's dictionary devoted to a series of novels about Harry Potter. The author analyzes the methods used to select words for the author's dictionary. The main purpose of the article is to define methods of text processing and use of these methods in the process of creating the author's dictionary. Borunov provides a theoretical review of the main text processing methods. The article also contains English-language examples to illustrate theoretical provisions. The research methods include the method of manual selection, analysis and synthesis of data, and description based on a particular text under analysis. The main conclusions of the research is the ideas about the important role of such diligent lexicographic research. The author's contribution to the topic is a detailed description of the stages of work on creating the author's dictionary by an English-speaking author. The novelty of the research is caused by the fact that the author describes the method of stage-by-stage manual processing of the material completed with computer processing. 


Keywords:

author’s dictionaries, methods of text processing, text processing, manual selection of data, stages of work, Harry Potter Lexicon Encyclopedia, linguistic analysis, applied lexicography, structure of the dictionary, modern English

Само понятие «обработка текста» в современных изданиях трактуется как процесс создания, редактирования и хранения текстовых документов на компьютере с помощью специальной программы — текстового процессора, который отвечает за ввод, редактирование, форматирование и печать текстов и документов [8:1]. Однако, в данной статье речь будет идти далеко не о машинных технологиях, а о ручном процессе работы над текстом для создания авторского словаря к произведению того или иного писателя.

За последнее десятилетие наметился прогресс в области обработки текстов на естественном языке. Задачи обработки текстов на естественном языке интересуют специалистов уже более полувека [6:254], за это время были разработаны методы решения задач информационного поиска [4:23], машинного перевода и т. п. Из задач касательно методов обработки текстов для составления писательских словарей, можно назвать: извлечение и понимание авторского стиля и языка писателя, определение эмоциональной окраски текста, анализ реального влияния источников информации (например, книга должна быть настолько содержательной и интересной читателям, что составление авторского словаря к ней не будет напрасной тратой времени). Перейти к методам приема и обработки текста, возможно лишь после проведения  лингвистического анализа текста. Лингвистический анализ текста – это вид языкового анализа, направленного на выявление системы языковых средств, с помощью которых передается идейно-тематическое и эстетическое содержание литературно-художественного произведения. В этом случае лингвистический анализ смыкается с анализом литературоведческим [7:321]. Традиционные филологические методики имеющие целью толкование литературного произведения, делают человека внимательным к тонким нюансам мысли и чувства [5:121]. Для глубокого анализа необходимо рассматривать литературное произведение в определённой исторической обстановке – в ряду его сверстников и предшественников.

Обработка текста при создании авторских словарей проходит в несколько следующих поочередных этапов, представленных данной моделью:

1. Исходный текст       2. Разбиение на слова и предложения       3. Анализ отдельных слов       4. Стилистический анализ       5. Алгоритм решения прикладной задачи [10:1].

На первом этапе поступают непосредственно сами символы, происходит лексический анализ, а именно разделение на слова и предложения. На втором этапе проводится обработка отдельных слов, которая часто сводится к морфологическому анализу — определению характеристик слова (граммем) и основной словоформы.

На третьем этапе необходимо выделить слова наиболее подходящие для составления словника. В данной работе мы будем рассматривать процесс включения слов в авторский словарь на примере одной из авторских лексикографических работ. Чтобы определиться с выбором слова для составления словаря нужно, чтобы каждое конкретное слово попадало под следующие характеристики:

1. Однократное, или многократное употребление слова лишь в отдельно взятом произведении, или группе произведений автора.

2. Необычное, несвойственное сочетание букв в слове.

3. Слова, имеющие этимологию происхождения другого языка, и не свойственные языку произведения.

4. Выделение всех устаревших слов, индивидуальных образований, терминов, жаргонизмов, вульгаризмов, кроме того, в словарь языка писателя должны включаться символы, цифры, фотокопии, гравюры, рисунки, использованные писателем. 

5. Кроме того, любое слово, попадающее под категорию топонима или имени собственного, также непременно должно быть включено либо непосредственно в сам словник, либо в приложение.

На четвертом этапе после того как мы определились с включением всех авторских слов, необходимо переходить к четвертому этапу, а именно стилистическому анализу. На этом этапе лексикографу необходимо еще раз внимательно ознакомиться со стилем писателя, и при включении всех необходимых слов в словарь, сохранить стилистическую, эмоциональную, оценивающую характеристику, которой автор в произведении наделил каждое конкретное слово. 

На пятом и заключительном этапе подводятся итоги по составлению словаря, и именно на этом этапе нам необходимо обдумать мега-, макро-, и микроструктуру самого словаря. В данной работе проведем анализ по составлению структуры словаря на примере авторского словаря к серии книг о Гарри Поттере, а именно Harry Potter Lexicon Encyclopedia [12]. Рассмотрим все пять этапов более подробно, и выявим ту работу, которая должна быть проделана на определенных этапах.

Создание авторских словарей – работа трудоемкая и кропотливая, особенно в тех случаях, когда не писатель создает словари к своим произведениям, а лексиколог, или литературовед. На первом этапе, для написания авторского словаря филологу необходимо ознакомиться с текстом несколько раз, применив известную журналистскую практику трех видов чтения: поверхностное, углубленное, шлифовочное [5:24].  Однако, в данном случае уже при углубленном изучении материла, автору будет понятен авторский стиль, его литературные приемы, набор, словарных единиц, использованных в его тексте. И именно здесь можно переходить ко второму этапу, на котором нам необходимо разбить текст на слова и предложения, и провести морфологический анализ, определить части речи.

 Так как на 3 этапе исследователь разобрал основные характеристики слов, которые непременно должны быть включены в авторский словарь, теперь необходимо определиться с методами их обнаружения и закрепления в словнике. При приеме и обработке текста сам процесс нахождения и включения слов в справочник проходит несколько этапов, которые мы опишем ниже [9]. В качестве примера, мы возьмем слово”dementors – дементоры“ из уже вышеупомянутого источника [12], и проанализируем его по следующим этапам.  

1) Для начала, найти примеры использования слова в тексте. Если данное слово привязано к контексту, из которого вычленить смысл слова невозможно, то необходимо поискать использование данного слова на других ресурсах, таких как Google Books, например. Такое слово, или словосочетание непременно будет фигурировать либо в самом тексте, либо в цитатах героев. Рассмотрим слово “dementors” – дементоры. Данное слово постоянно появляется как в самом тексте, так и цитатах героев, из которых понятно его лексикологическое значение

2) Далее необходимо понять, значение слова в найденных примерах. Рассмотрим цитату: "When dementors get near me, I can hear Voldemort murdering my mum." - Harry Potter. Когда дементоры рядом со мной, я слышу, как Волан де Морт убивает мою маму. Из данного примера сразу становится понятно, что данные существа являются отрицательными героями книги, и их появление не сулит ничего хорошего.

3) После нужно определить часть речи, к которой относится исследуемое слова, для понятия смысла или нескольких смыслов, которое оно может в себе нести. “Дементоры” – существительное.

4) Далее необходимо определить грамматические характеристики анализируемого слова. Например, дементоры – существительное, множественное число, мужской род.  

5) После этого следует переходить к описанию слова легкодоступными словами, чтобы понимание смысла слова не вызвало трудностей у читателя. Например: “Dementors are - horrible, spectral creatures, hooded and robed, which feed on human emotions.” “Дементоры  - это отвратительные, призрачные существа, одетые в мантии с капюшонами, которые питаются человеческими эмоциями”.

6) Далее необходимо дать более подробную информацию о слове, детальное описание, все предметы и вещества с ним связанные. Например: Even before a Dementor is seen, its presence is obvious; they are surrounded by an unnatural darkness and terrible icy cold. Dementors affect even Muggles, although the Muggles can’t see the foul, black creatures. They were the guards at Azkaban and made that place horrible indeed. The Ministry used Dementors as guards in its courtrooms as well (GF30, DH13). A Dementor's last and worst weapon is called the Dementor's Kiss. The Dementor puts back its hood and clamps its jaws on the mouth of the victim and sucks out his soul, leaving him an empty shell, alive but completely, irretrievably "gone" [13:82].There are certain defenses one can use against Dementors, specifically the Patronus Charm.

Даже если вы еще не видите самого дементора, его присутствие всегда очевидно, так как его всегда окружает неестественная темнота, и пронизывающий вас до дрожи холод. Дементоров могут чувствовать даже Магглы, хотя они их и не видят. Дементоры являлись стражами Азкабана, и действительно, наполняли то место ужасом. Министерство также держало дементоров в качестве охраны в залах суда. Самым страшным оружием является поцелуй Дементора, когда он высасывает из человека всю радость и тепло и опустошает его душу, не оставляя ничего кроме страданий. Есть специальное заклинание Экспекто Патронум, способное прогнать прочь дементоров.

7) На последнем этапе нам необходимо найти все места появления данного слова в книге.  Dementors – references: on the Hogwarts Express, on the Quidditch match, during the description by Lupin, etc. Дементоры – ссылки: На поезде Хоггвартс Экспресс, на матче по игре в Квиддич, во время объяснения на уроке профессора Люпина, и т.д. 

Таким образом, когда весь словник составлен, и обработка текста на 3 этапе завершена, мы переходим 4 четвертому, а именно стилистическому анализу нашего словника. На данном этапе нам нужно удостовериться в том, что индивидуальный стиль писателя сохранен, и все слова, словосочетания, фразеологизмы, топонимы, имена собственные переданы верно. Лингвистическая природа авторского текста не может быть полностью выявлена, если мы будем рассматривать его как отдельно взятое произведение, имеющее сугубо вербальную природу. Мы должны рассматривать авторский текст в комплексе вербальных и невербальных компонентов и во взаимодействии с другими текстами, находящимися рядом, из других произведений писателя [3:8].

В завершении обработки текста, мы переходим к пятому, заключительному этапу, а именно к алгоритму решения прикладной задачи. Поскольку у каждого словаря есть своя определенная структура, в частности у авторского, то издателям словаря необходимо ей четко следовать при составлении словаря. Напомним, что авторский словарь состоит из мега-, макро-, и микро- структуры [11]. Рассмотрим процесс создания авторского словаря на примере уже использованного источника [12]. Для начала, автору необходимо определиться с мегаструктурой словаря, которая включает в себя:

1.Претворяющий текст (предисловие, аннотация, научный обзор, раздел «Как пользоваться словарем», список сокращений, или аббревиатур, используемых в словаре, и их объяснения). В авторском словаре о Гарри Поттере помимо выше перечисленных также присутствуют дополнительные параметры: форум, блог, интерактивный поиск, магазин, служба поддержки, и.т.д.

2.Корпус словаря (словник в алфавитном или идеографическом порядке). Чаще всего авторы выбирают алфавитный порядок словника, для удобства пользования, что и было сделано в конкретном издании.

3.Заключающий текст (библиография, приложения, вложенные тексты). В данном словаре дается лишь список библиографии, а именно всех книг, на базе которых и был составлен весь справочник. Также есть раздел ономастики, в котором указаны все имена из серии книг.

На уровне макроструктуры идет составление словника, основного корпуса справочника, что было уже рассмотрено ранее. На уровне микроструктуры идет непосредственно анализ включаемого слова в писательский словарь. Поскольку мы уже рассмотрели процесс включения термина в словник, и выявили обязательные пункты, которые должны присутствовать при разъяснении каждого отдельного слова, перейдем непосредственно к анализу самой макроструктуры и проанализируем какие из следующих пунктов представлены в изучаемом нами справочнике. В данный раздел входит:

1.Вокабула (заголовочное слово, словосочетание). Под этим термином понимается слово, или словосочетание, разъясняемое в словарной статье (в словарях). Примером может служить любое взятое слово, которое мы сейчас и разберем на конкретном примере. Рассмотрим слово potions, активно используемое в этой книге, что в переводе означает зелья. Сразу же напротив слова в энциклопедии идет разъяснение его значения:  Potions are magical liquids created by mixing various ingredients in a cauldron according to very specific rules. These mixtures must usually be drunk to give their magical effect. Severus Snape was the Potions Master at Hogwarts. The Potions classroom is located in a chilly, dark dungeon. Зелье это волшебная жидкость, которая создается за счет смешивания различных ингредиентов в котле, согласно определенным правилам. Такая смесь непременно должна быть выпита, для достижения наибольшего эффекта. Северус Снэйп был Мастером по искусству зельеварения. Классная комната, предназначенная для проведения уроков по зельеварению, находится в подземелье.

2.Транскрипция (не всегда) В данном издании транскрипция не предоставлена. 

3.Дефиниция (определение, раскрывающее семантику слова) Пример раскрытия значения слова указан в пункте 1.

4.Стилистические пометы. Данный термин обозначает разновидность словарной пометы, лексикографический прием указания на стилистические особенности разъясняемой словарной единицы. Зачастую, такой прием лучше всего может быть отображен употреблением цитаты из книги с вводимым в словарь определением. Например, возьмем имя Hermione Jean Granger. Это главная героиня романа Джоулинг – Гермиона Грейнджер. Сразу после ее имени мы видим следующую цитату: "But you're Muggles! We must have a drink! What's that you've got there? Oh, you're changing Muggle money. Molly, look!"

     - Arthur Weasley upon meeting the Grangers in Gringotts

“Но вы ведь Магглы! Мы с вами просто обязаны выпить! Что это у вас там? Ничего себе у вас Маггловские деньги. Молли посмотри! ”

- Артур Уизли во время встречи с родителями Гермиона в Гринготсе. 

Из данной цитаты сразу становится понятно, на что указывает данная стилистическая помета, а именно на происхождение главной героини, то, что она не такая, как все они, не волшебница, и данный факт, сразу примечается читателем. Традиция вводить цитаты в качестве пояснения берет свое начало с XVI в., когда первые писательские глоссарии служили примером для словарных статей первых толковых словарей английского литературного языка, так как содержали в себе огромное количество цитат из определенных работ писателя [1:10-15].

6.Этимолого-диалектическая справка – этимология слова, история развития, способы образования. Рассмотрим следующий пример, на котором явно будут видны необходимые нам характеристики: Draco Malfoy – Драко Малфой. Один из отрицательных героев в книге. Рассмотрим значение имени. Draco = a large serpent, dragon (in Latin); tyrannical Athenian lawgiver. 'Draco' is also the constellation that contained 'Thuban,' the ancient Egyptian's pole star (several Egyptian pyramids were aligned on it).  Драко в латинском языке означает огромная змея, дракон, тиранический Афинский учредитель законов. “Драко” также  означает созвездие, в которое входит “Тубан”, существовавшая в древние времена Египта путеводная звезда (во время создания нескольких пирамид, их даже выстраивали в ряд, так чтобы они находились прямо под этой звездой) Фамилия Малфой с французского означает плохая вера.   

7. Дифференцированные слои лексики. В специальных писательских словарях детализированное лексикографическое исследование получают определенные слои лексики авторского словоупотребления. Данные материалы становятся надежным подспорьем для пользователей, не имеющих достаточных  профессиональных знаний в определенной предметной области, и содержат информацию о реалиях и понятиях упомянутых в книге. [2:190-192]. Например, в конкретно нами рассматриваемом словаре, весь источник разделен на 12 абзацев, 12 определенных пластов лексики, из которой и состоит исследуемый материал.

В завершении можно сказать, что теперь, когда мы рассмотрели основные методы приема и обработки текста при создании авторских словарей, становится ясно, что составление справочников к художественным произведениям писателей является сложной и трудоемкой работой. Современные издания часто прибегают к волонтерской помощи в данном деле, поскольку для детального анализа и обработки текста необходимо быть полностью погруженным в материал произведения, знать все слова и термины, быть знакомым практически со всеми произведениями писателя. Немаловажно и то, что при обработке текста крайне важно сохранить стиль писателя, все стилистические приемы и окказиональные языковые средства, а также нормативные и ненормативные средства языка. Обработка текста, зачастую сталкивается с рядом проблем, и прежде всего которые связаны с вопросом  о включении тех или иных слов. Для выполнения правильной и достоверной обработки языкового материала, автору необходимо строго следовать плану написания авторских словарей и вышеизложенным в работе пунктам. 

Библиография
1. Карпова О. М. Роль писательских словарей в формировании английской национальной лексикографии // Вестник Воронежского государственного университета. Серия «Лингвистика и межкультурная коммуникация», 2009. № 4. С. 10-15.
2. Карпова О. М. Термины в художественном тексте и писательском словаре // Коммуникация: теория и практика в различных социальных контекстах. Communicating Across Differences: Материалы Международной научно-практической конференции 3-6 июня 2002 года. Ч. 1. Пятигорск: Изд-во ПГЛУ, 2002. С. 190-192.
3. Коньков В.И. Русская речь в средствах массовой информации. – СПб.: Издательский дом СПбГУ, 2011. – С. 8.
4. Маннинг К., Рагхаван П., Шютце Х. Введение в информационный поиск. М.: Вильямс, 2011. — С. 23.
5. Накорякова К. М. Литературное редактирование.-М.: Издательство ИКАР, 2004. – С. 24
6. Норвиг П., Рассел С. Искусственный интеллект. Современный подход. М.: Вильямс, 2007. — С. 254.
7. Словарь лингвистических терминов / Сост. Т.В. Жеребило. Изд. 5-е, испр. и доп. – Назрань: ООО «Пилигрим», 2010. – С. 321.
8. http://translate.academic.ru/Обработка%20текстов/ru/en/1 Дата обращения 12.06.2016
9. http://www.wikihow.com/Write-a-Dictionary-Definition Дата обращения 12.06.2016
10. http://www.osp.ru/os/2013/04/13035562/ Дата обращения 13.06.2016
11. http://webkonspect.com/?room=profile&id=4689&labelid=50373 Дата обращения 13.06.2016
12. http://www.hp-lexicon.org/ Дата обращения 14.06.2016
13. S.V. Ark. The Lexicon: An Unauthorized Guide to Harry Potter Fiction and Related Material/ RDR Books, 2009. P. 82.
References
1. Karpova O. M. Rol' pisatel'skikh slovarei v formirovanii angliiskoi natsional'noi leksikografii // Vestnik Voronezhskogo gosudarstvennogo universiteta. Seriya «Lingvistika i mezhkul'turnaya kommunikatsiya», 2009. № 4. S. 10-15.
2. Karpova O. M. Terminy v khudozhestvennom tekste i pisatel'skom slovare // Kommunikatsiya: teoriya i praktika v razlichnykh sotsial'nykh kontekstakh. Communicating Across Differences: Materialy Mezhdunarodnoi nauchno-prakticheskoi konferentsii 3-6 iyunya 2002 goda. Ch. 1. Pyatigorsk: Izd-vo PGLU, 2002. S. 190-192.
3. Kon'kov V.I. Russkaya rech' v sredstvakh massovoi informatsii. – SPb.: Izdatel'skii dom SPbGU, 2011. – S. 8.
4. Manning K., Ragkhavan P., Shyuttse Kh. Vvedenie v informatsionnyi poisk. M.: Vil'yams, 2011. — S. 23.
5. Nakoryakova K. M. Literaturnoe redaktirovanie.-M.: Izdatel'stvo IKAR, 2004. – S. 24
6. Norvig P., Rassel S. Iskusstvennyi intellekt. Sovremennyi podkhod. M.: Vil'yams, 2007. — S. 254.
7. Slovar' lingvisticheskikh terminov / Sost. T.V. Zherebilo. Izd. 5-e, ispr. i dop. – Nazran': OOO «Piligrim», 2010. – S. 321.
8. http://translate.academic.ru/Obrabotka%20tekstov/ru/en/1 Data obrashcheniya 12.06.2016
9. http://www.wikihow.com/Write-a-Dictionary-Definition Data obrashcheniya 12.06.2016
10. http://www.osp.ru/os/2013/04/13035562/ Data obrashcheniya 13.06.2016
11. http://webkonspect.com/?room=profile&id=4689&labelid=50373 Data obrashcheniya 13.06.2016
12. http://www.hp-lexicon.org/ Data obrashcheniya 14.06.2016
13. S.V. Ark. The Lexicon: An Unauthorized Guide to Harry Potter Fiction and Related Material/ RDR Books, 2009. P. 82.