Перевести страницу на:  
Please select your language to translate the article


You can just close the window to don't translate
Библиотека
ваш профиль

Вернуться к содержанию

Программные системы и вычислительные методы
Правильная ссылка на статью:

Труб И.И. Аналитическое вероятностное моделирование bitmap-индексов

Аннотация: Объектом исследования являются двоичные (bitmap)-индексы как средство повышения эффективности обработки поисковых запросов и построения отчетов в современных СУБД. Предметом исследования является математическая модель зависимости количества индексов, необходимых для построения выборки, удовлетворяющей запросу, от интенсивности добавления записей в базу данных и заданного диапазона значений запроса. Данная характеристика является наиболее значимой для оценки производительности обработки запроса, так как определяет количество операций дизъюнкции над битовыми строками, которое необходимо выполнить для получения результирующей выборки. Данная задача возникла целиком из практических потребностей ввиду критического влияния быстродействия построения отчетов на потребительскую ценность коммерческих продуктов - приложений СУБД. Методологией исследования является вероятностное аналитическое моделирование на основе представления исходных данных в виде пуассоновских процессов, а также использование аппарата математического анализа (интегральное исчисление и суммирование рядов) для получения конечных результатов. Новизна исследования заключается в разработке математической модели, предложенной для данного объекта исследования, которая позволяет ставить широкий спектр задач анализа и оптимизации. Поставленная задача решена - получены формулы для распределения количества индексов и среднего количества индексов в одном запросе. Для каждого результата проведена оценка его достоверности на основе альтернативного подхода или правдоподобных рассуждений. Поставлены задачи построения вероятностной модели для распределений произвольного вида и оптимизации обработки запросов с помощью иерархических bitmap-индексов. Следует отметить, что сформулированная в работе задача и полученные результаты имеют и самостоятельное теоретическое значение в рамках теории массового обслуживания безотносительно к прикладной области.


Ключевые слова:

интегрирование и суммирование, уравнения баланса, теория массового обслуживания, Пуассоновский поток, поисковый запрос, база данных, дизъюнкция, двоичные индексы, комбинаторика, анализ и оптимизация

Abstract: The study is devoted to bitmap-indexes as a tool of improving efficiency of processing search queries and reporting in the current database. The subject of research is mathematical model of dependence of the number of indexes, required to build a sample that meets the request, on the intensity of adding records to the database and query the specified range of values. This characteristic is most significant for evaluating query processing performance because it determines the number of disjunction operations on bit strings, required to get a result set. This problem arose entirely from the practical needs due to the critical impact of the speed of building of reports on customer value commercial products - database applications. The methodology of this study is probabilistic analytical modeling based on representations of the original data in the form of Poisson process and the use of the apparatus of mathematical analysis (integral calculus and summation rows) to get the final results. The novelty of the research is to develop a suggested mathematical model, which allows to put a wide range of problems of the analysis and optimization. The problem is solved – the author presents the formula for the distribution of the number of indexes, and the average number of indexes in a single query. For each result author evaluated reliability on the basis of an alternative approach or plausible reasoning. The paper sets the tasks of constructing a probabilistic model for the distribution of any type of query processing and optimization using hierarchical bitmap-indexes. It should be noted, that formulated problem and the results obtained have an independent theoretical value within the queuing theory without regard to the application area.


Keywords:

integration and summation, balance equations, queueing theory, poisson distribution, fetch request, database, combinatorics, disjunction, bitmap-indexes, analysis and optimization


Эта статья может быть бесплатно загружена в формате PDF для чтения. Обращаем ваше внимание на необходимость соблюдения авторских прав, указания библиографической ссылки на статью при цитировании.

Скачать статью

Библиография
1. Bitmap-индексы в Cache на глобалах. URL: https://habrahabr.ru/company/intersystems/blog/174657/ (дата обращения 16.11.2016)
2. Труб И.И. СУБД Cache: работа с объектами. М.: Диалог-МИФИ, 2006. 480 с.
3. Шарма В. Bitmap-индекс или B*tree-индекс: какой и когда применять? URL: http://citforum.ru/database/oracle/bb_indexes/ (дата обращения 16.11.2016)
4. Труб И.И. Об оптимальной стратегии генерирования результатов запросов к Internet-серверу баз данных // Автоматика и телемеханика. 2003. № 6. С. 95-103.
5. Клейнрок Л. Вычислительные системы с очередями. М.: Мир, 1979. 595 с.
6. СУБД Oracle. Администрирование, разработка и программирование. Индексы. URL: http://oracledb.ru/sql/ddl-i-obekty-sxemy/indeksy.html (дата обращения 16.11.2016)
7. Клейнрок Л. Теория массового обслуживания. М.: Машиностроение, 1979. 432 с.
8. Кирстен В., Ирингер М., Кюн М., Рериг Б. СУБД Cache 5: объектно-ориентированная разработка приложений. 2-е изд. М.: Бином, 2005. 416 с.
9. Градштейн И.С., Рыжик И.М. Таблицы интегралов, сумм, рядов и произведений. 4-е изд. М.: Государственное издательство физико-математической литературы, 1963. 1100 с.
10. Артамонов Г.Т., Брехов О.М. Аналитические вероятностные модели функционирования ЭВМ. М.: Энергия, 1978. 368 с.
References
1. Bitmap-indeksy v Cache na globalakh. URL: https://habrahabr.ru/company/intersystems/blog/174657/ (data obrashcheniya 16.11.2016)
2. Trub I.I. SUBD Cache: rabota s ob'ektami. M.: Dialog-MIFI, 2006. 480 s.
3. Sharma V. Bitmap-indeks ili B*tree-indeks: kakoy i kogda primenyat'? URL: http://citforum.ru/database/oracle/bb_indexes/ (data obrashcheniya 16.11.2016)
4. Trub I.I. Ob optimal'noy strategii generirovaniya rezul'tatov zaprosov k Internet-serveru baz dannykh // Avtomatika i telemekhanika. 2003. № 6. S. 95-103.
5. Kleynrok L. Vychislitel'nye sistemy s ocheredyami. M.: Mir, 1979. 595 s.
6. SUBD Oracle. Administrirovanie, razrabotka i programmirovanie. Indeksy. URL: http://oracledb.ru/sql/ddl-i-obekty-sxemy/indeksy.html (data obrashcheniya 16.11.2016)
7. Kleynrok L. Teoriya massovogo obsluzhivaniya. M.: Mashinostroenie, 1979. 432 s.
8. Kirsten V., Iringer M., Kyun M., Rerig B. SUBD Cache 5: ob'ektno-orientirovannaya razrabotka prilozheniy. 2-e izd. M.: Binom, 2005. 416 s.
9. Gradshteyn I.S., Ryzhik I.M. Tablitsy integralov, summ, ryadov i proizvedeniy. 4-e izd. M.: Gosudarstvennoe izdatel'stvo fiziko-matematicheskoy literatury, 1963. 1100 s.
10. Artamonov G.T., Brekhov O.M. Analiticheskie veroyatnostnye modeli funktsionirovaniya EVM. M.: Energiya, 1978. 368 s.