Перевести страницу на:  
Please select your language to translate the article


You can just close the window to don't translate
Библиотека
ваш профиль

Вернуться к содержанию

Программные системы и вычислительные методы
Правильная ссылка на статью:

Бахрушин В.Е. Программная реализация методов анализа нелинейных статистических связей в системе R

Аннотация: Существующие программные средства статистического анализа данных (SPSS, Statistica и др.) обычно предлагают для поиска корреляции лишь методы, пригодные для выявления линейной связи между числовыми данными, а также некоторые показатели связи для ранговых, качественных и смешанных данных. Однако реальная связь между количественными данными часто бывает нелинейной. Это приводит к тому, что имеющиеся средства не позволяют выявлять такие связи и могут приводить к ошибочным выводам об отсутствии корреляции. Универсальным показателем наличия статистической связи между двумя рядами числовых данных является выборочный коэффициент детерминации. Для его определения используют два подхода, один из которых базируется на аппроксимации неизвестной функции связи кусочно-постоянной функцией, а второй - на сглаживании имеющихся данных. В работе предложена программная реализация обоих методов средствами системы R. Достоинством этой системы является возможность использования большого числа специализированных библиотечных функций, предназначенных для статистического анализа, а также написания авторских программ для решения нестандартных задач. Тестирование разработанных приложений на модельных примерах показало их корректную работу и возможность использования для решения прикладных задач нелинейного корреляционного анализа.


Ключевые слова:

Нелинейная связь, Коэффициент детерминации, Программное обеспечение, Язык R, Сглаживание данных, Корреляционное отношение, Коэффициент корреляции Пирсона, Тестирование, Группирование данынх, Кусочно-постоянная функция

Abstract: existing software for data statistical analysis (SPSS, Statistica etc.) usually offer for defining correlations just methods applicable for finding linear relationships in numerical data, along with some relation indicators for rank, qualitative and mixed data. However actual relation between quantitative data is often nonlinear. This leads to the fact that present means do not allow identifying such relations, which can lead to false conclusions about the absence of correlation. An universal indicator of present statistical correlation between two rows of numerical data is sample coefficient of determination. There are two approaches to calculated that coefficient: first is based on the approximation of some unknown function with piecewise constant function, second is based on the smoothing available data. The article proposes software realization for both methods in R system. The advantage of this system is in the availability of a large number of specialized library functions for statistical analysis, as well as in writing programs for non-standard tasks. Testing of the developed application on model examples proved their correctness allowing the use for solving practical problems in nonlinear correlation analysis.


Keywords:

nonlinear relationship, coefficient of determination, software, R programming Language, data smoothing, correlation ratio, Pearson correlation coefficient, testing, data grouping, piecewise constant function


Эта статья может быть бесплатно загружена в формате PDF для чтения. Обращаем ваше внимание на необходимость соблюдения авторских прав, указания библиографической ссылки на статью при цитировании.

Скачать статью

Библиография
1. Бахрушин В.Є. Методи аналізу даних. – Запоріжжя: КПУ, 2011. – 268 с.
2. Гайдышев И. Анализ и обработка данных. Специальный справочник – СПб.: Питер, 2001. – 752 с.
3. Бююль А., Цёфель П. SPSS: Искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей. – СПб.: ДиаСофтЮП, 2005 – 608 с.
4. Халафян А.А. Statistica 6. Статистический анализ данных. – М.: ООО Бином-Пресс, 2008. – 512 с.
5. Кендэл М. Ранговые корреляции. – М.: Статистика, 1975. – 216 с.
6. Gauthier T. D. Detecting Trends Using Spearman’s Rank Correlation Coefficient // Environmental Forensics. – 2001. No 2. – P. 359 – 362.
7. Бахрушин А.В., Бахрушин В.Е. Тестирование гипотез о нелинейных связях с использованием языка программирования R // Системные технологии: Регіональний міжвузівський збірник наукових праць. Дніпропетровськ, 2013. – № 3(86). – С. 168 – 172.
8. Бахрушин В.Е. Методы оценивания характеристик нелинейных статистических связей // Системні технології: Регіональний міжвузівський збірник наукових праць. Дніпропетровськ, 2011. – № 2(73). – С. 9 – 14.
9. Андерсон Т. Статистический анализ временных рядов. – М.: Мир, 1976. – 755 с.
10. Бахрушин В.Є., Павленко В.Є., Петрова С.В. Застосування показників нелінійної кореляції для побудови й аналізу крос-кореляційних функцій // Складні системи і процеси. – 2009, № 2. – С. 78 – 85.
11. Бахрушин В.Е., Павленко В.Е., Петрова С.В. Применение выборочного коэффициента детерминации для построения и анализа кросс-корреляционных функций // Фундаментальные физико-математические проблемы и моделирование технико-технологических систем / Под ред. Ю.М. Соломенцева, Б.Н. Четверушкина, А.В. Боголюбова и др. – М.: МГТУ “СТАНКИН”, Янус-К, 2010. – Вып. 13. – С. 4
12. Статистический анализ данных в системе R / А.Г. Буховец, П.В. Москалев, В.П. Богатова, Т.Я. Бирючинская; Под ред. проф. Буховца А.Г. – Воронеж: ВГАУ, 2010. – 124 с
References
1. Bakhrushin V.Є. Metodi analіzu danikh. – Zaporіzhzhya: KPU, 2011. – 268 s.
2. Gaydyshev I. Analiz i obrabotka dannykh. Spetsial'nyy spravochnik – SPb.: Piter, 2001. – 752 s.
3. Byuyul' A., Tsefel' P. SPSS: Iskusstvo obrabotki informatsii. Analiz statisticheskikh dannykh i vosstanovlenie skrytykh zakonomernostey. – SPb.: DiaSoftYuP, 2005 – 608 s.
4. Khalafyan A.A. Statistica 6. Statisticheskiy analiz dannykh. – M.: OOO Binom-Press, 2008. – 512 s.
5. Kendel M. Rangovye korrelyatsii. – M.: Statistika, 1975. – 216 s.
6. Gauthier T. D. Detecting Trends Using Spearman’s Rank Correlation Coefficient // Environmental Forensics. – 2001. No 2. – P. 359 – 362.
7. Bakhrushin A.V., Bakhrushin V.E. Testirovanie gipotez o nelineynykh svyazyakh s ispol'zovaniem yazyka programmirovaniya R // Sistemnye tekhnologii: Regіonal'niy mіzhvuzіvs'kiy zbіrnik naukovikh prats'. Dnіpropetrovs'k, 2013. – № 3(86). – S. 168 – 172.
8. Bakhrushin V.E. Metody otsenivaniya kharakteristik nelineynykh statisticheskikh svyazey // Sistemnі tekhnologії: Regіonal'niy mіzhvuzіvs'kiy zbіrnik naukovikh prats'. Dnіpropetrovs'k, 2011. – № 2(73). – S. 9 – 14.
9. Anderson T. Statisticheskiy analiz vremennykh ryadov. – M.: Mir, 1976. – 755 s.
10. Bakhrushin V.Є., Pavlenko V.Є., Petrova S.V. Zastosuvannya pokaznikіv nelіnіynoї korelyatsії dlya pobudovi y analіzu kros-korelyatsіynikh funktsіy // Skladnі sistemi і protsesi. – 2009, № 2. – S. 78 – 85.
11. Bakhrushin V.E., Pavlenko V.E., Petrova S.V. Primenenie vyborochnogo koeffitsienta determinatsii dlya postroeniya i analiza kross-korrelyatsionnykh funktsiy // Fundamental'nye fiziko-matematicheskie problemy i modelirovanie tekhniko-tekhnologicheskikh sistem / Pod red. Yu.M. Solomentseva, B.N. Chetverushkina, A.V. Bogolyubova i dr. – M.: MGTU “STANKIN”, Yanus-K, 2010. – Vyp. 13. – S. 4
12. Statisticheskiy analiz dannykh v sisteme R / A.G. Bukhovets, P.V. Moskalev, V.P. Bogatova, T.Ya. Biryuchinskaya; Pod red. prof. Bukhovtsa A.G. – Voronezh: VGAU, 2010. – 124 s