Перевести страницу на:  
Please select your language to translate the article


You can just close the window to don't translate
Библиотека
ваш профиль

Вернуться к содержанию

Программные системы и вычислительные методы
Правильная ссылка на статью:

Лучинин З.С. Структура данных для документо-ориентированных баз данных

Аннотация: В статье приводится подход, который позволяет уменьшить нагрузку при запросах к нереляционной СУБД, благодаря использованию алгоритмов деревовидных структур хранения данных. Производительность операций по обработке данных различна в зависимости от используемых структур данных. Исследование древовидных структур, таких как B + деревья, объединения деревьев в журнальную структуру или фрактальные деревья показало, что в алгоритмах с их использованием операции с данными осуществляются быстрее, чем в MySQL. В работе рассмотрен алгоритм LSM дерева в применении к документо-ориентированным базам данных. Описана работа алгоритма при выполнении основных операций (создание, чтение, редактирование и удаление) с данными. В основу предложенного алгоритма работы с индексом ставят B деревья или B+ деревья. Недостатками данных структур являются трудоемкость балансировки дерева при добавлении нового значения в индекс и ресурсоемкость, так как индекс хранится в оперативной памяти. Дерево слияния со структурой журнала (Log-Structured Merge-Trees, LSM) является структурой данных, обеспечивающей низкую стоимость операции индексирования и высокую скорость добавления и удаления данных Алгоритм на основе LSM-дерева можно использовать при горизонтальном масштабировании. Каждый узел образует отсортированную последовательность данных по ключу. Диапазон ключей каждого сервера хранится на мастер-сервере, что позволяет без дополнительных запросов обратиться к серверу, на котором хранятся запрашиваемые данные. Таким образом, достигается увеличение скорости поиска данных и балансировка нагрузки по доступным серверам.


Ключевые слова:

базы данных, документо-ориентированные базы данных, структура данных, B + деревья, LSM деревья, нереляционные системы, поиск данных, обработка данных, производительность операций, древовидные структуры

Abstract: One of the main tasks of artificial intelligence is to simplify the process of human-computer interaction by providing, in particular, the opportunity to communicate in natural language via natural language interface – software that accepts text message in natural language and either translate it into some formal language, or performs some actions based on the message received. In order to understand the meaning of the text the system needs to parse each word of a sentence and analyze the interrelation between the words. Parsing words in agglutinative languages at the first glance seems quite complicated, since such languages are characterized by a variety of derivational and inflectional affixes. However, the affixes in agglutinative languages express only one meaning, which leads to stringing affixes for different grammatical meanings. Another feature of the affixes is that they may be adjoined to the base from both sides. Also in agglutinative languages there’s usually no different types of declension and conjugation. One of the agglutinative languages is Bashkir languages, for which the Bashmorph software for automatic morphology analysis is created. The Bashmorph can determine the meaning of the entered word and detect its form, case and mood, check if it is plural or singular. Based on such program the frequency dictionaries, automatic translators, search engines can be built. Technical progress poses new challenges, brings new terms and changes the environment. All these changes are reflected in language which is a mean of communication between people, and in the future, between man and machine. Creation of natural language interfaces for agglutinative languages is an important task for preservation and further development of such languages.


Keywords:

parser, grammar, parsing, agglutinating language, multiagent system, natural language interface, explainer, agent, human-computer interaction, intercommunicating system.


Эта статья может быть бесплатно загружена в формате PDF для чтения. Обращаем ваше внимание на необходимость соблюдения авторских прав, указания библиографической ссылки на статью при цитировании.

Скачать статью

Библиография
1. Jeremy Cole B+Tree index structures in InnoDB. Ссылка на ресурс в Интернете: http://blog.jcole.us/2013/01/10/btree-index-structures-in-innodb/
2. Patrick O'Neil The Log-Structured Merge-Tree (LSM-Tree). Ссылка на ресурс в Интернете: http://goo.gl/2OcRQ
References
1. Shishkin D.V. Sistema postroeniya estestvenno-yazykovykh interfeysov, orientirovannaya na klassifikatsiyu tekstov v ierarkhicheski strukturirovannoy predmetnoy oblasti. // Materialy mezhdunarodnoy konferentsii molodykh uchenykh po matematicheskomu modelirovaniyu i informatsionnym tekhnologiyam, 2002 g, Novosibirsk
2. Zenkov G.S., Sapozhnikova I.A. Vvedenie v yazykoznanie. Uchebnoe posobie dlya studentov distantsionnogo obucheniya KGNU. Bishkek: IIMOPKGNU, 1998.-218 s.
3. Dokumentatsiya k morfologicheskomu analizatoru bashkirskogo yazyka bashmorph: http://lcph.bashedu.ru/index.php?go=parserdoc
4. Orekhov B.V., Slobodyan E.A. Problemy avtomaticheskoy morfologii agglyutinativnykh yazykov i parser bashkirskogo yazyka // Informatsionnye tekhnologii i pis'mennoe nasledie: materialy mezhdunarodnoy nauchnoy konferentsii (Ufa, 2010 g.) / otv. red. V. A. Baranov. — Ufa; Izhevsk: Vagant, 2010. — S. 167–171.
5. Denisenko V.A., Ksalov A.M. Razrabotka parsera glagolov agglyutinativnogo yazyka dlya sistemy kommunikatsii mul'tiagentnogo kollektiva // Izvestiya KBNTs RAN № 2 (46) 2012
6. Kabardino-cherkesskiy yazyk v 2-kh tt / gl. red. M. A. Kumakhov. – Nal'chik : El'-Fa, 2006.
7. V.A. Denisenko, A.M. Ksalov, F.M. Goshokova. Algoritm vyvoda neopredelennoy formy glagola agglyutinativnogo yazyka na osnove grammatik. // Izvestiya KBNTs RAN № 5 (49) 2012
8. Denisenko V.A., Ksalov A.M. Parser glagolov agglyutinativnogo yazyka dlya sistemy kommunikatsii mul'tiagentnogo kollektiva. Materialy Vtoroy mezhdunarodnoy konferentsii «Avtomatizatsiya upravleniya i intellektual'nye sistemy i sredy», Krasnaya polyana, 15-23 dekabrya 2011.