Перевести страницу на:  
Please select your language to translate the article


You can just close the window to don't translate
Библиотека
ваш профиль

Вернуться к содержанию

Программные системы и вычислительные методы
Правильная ссылка на статью:

Динамическое распределение слотов RACH для минимизации коллизий в сетях NB-IoT на основе алгоритмов обучения с подкреплением

Шаброва Анна Сергеевна

ORCID: 0009-0009-1675-1558

студент; кафедра Информационная безопасность; МГТУ им. Н.Э. Баумана

105005, Россия, г. Москва, ул. 2-я Бауманская, 5, стр. 4

Shabrova Anna Sergeevna

Student; Department of Information Security; Bauman Moscow State Technical University

5, 2nd Baumanskaya str., building 4, Moscow, 105005, Russia

shabrova.anna.2410@list.ru
Другие публикации этого автора
 

 
Князев Максим Андреевич

ORCID: 0009-0007-3931-7442

аспирант; кафедра информационной безопасности ; ФГБОУ ВО «МИРЭА – Российский технологический университет», Институт Искусственного Интеллекта

119454, Россия, г. Москва, пр-т Вернадского, 78

Knyazev Maxim Andreevich

Postgraduate student; Department of Information Security ; MIREA – Russian Technological University, Institute of Artificial Intelligence

78 Vernadsky Ave., Moscow, 119454, Russia

maxiknyaz@mail.ru
Другие публикации этого автора
 

 
Колесников Александр Владимирович

ORCID: 0009-0008-9669-804X

к.т.н.; кафедра Информационная безопасность; МГТУ им. Н.Э. Баумана

105005, Россия, г. Москва, Басманный р-н, ул. 2-я Бауманская, д. 5 стр. 4

Kolesnikov Alexander Vladimirovich

Ph.D; Department of Information Security; Bauman Moscow State Technical University

5, 2nd Baumanskaya str., building 4, Basmanny district, Moscow, 105005, Russia

avkolesnikov@bmstu.ru

DOI:

10.7256/2454-0714.2025.2.73848

EDN:

TPWJOS

Дата направления статьи в редакцию:

27-03-2025


Дата публикации:

10-04-2025


Аннотация: Предметом исследования является управление доступом к каналам случайного доступа (Random Access Channel, RACH) в сетях узкополосного Интернета вещей (Narrowband Internet of Things, NB-IoT), испытывающих перегрузки при высокой плотности размещения устройств. Объектом исследования выступают процедуры динамического распределения слотов RACH с использованием методов машинного обучения. Основное внимание уделяется применению алгоритмов обучения с подкреплением (Reinforcement Learning, RL), в частности методов Q-learning и Deep Q-Network (DQN). Авторы детально рассматривают проблему перегрузки каналов и связанных с ней коллизий, приводящих к задержкам передачи данных и повышенному энергопотреблению устройств. Анализируется недостаточная эффективность традиционных статических методов управления слотами и обосновывается необходимость внедрения динамического подхода, способного адаптироваться к изменяющимся условиям сети. В исследовании использовались методы машинного обучения, включающие Q-learning и DQN, а также симуляционное моделирование в среде NS-3 с интеграцией RL-агента для динамического перераспределения RACH-слотов. Научная новизна исследования заключается в разработке и интеграции специализированного RL-агента, позволяющего осуществлять адаптивное распределение слотов RACH на основе текущего состояния сети NB-IoT. Основными выводами проведённого исследования являются подтверждённая высокая эффективность предложенного динамического подхода, обеспечившего снижение числа коллизий на 74%, увеличение числа успешных подключений на 16% и улучшение энергоэффективности устройств на 15% по сравнению с традиционными статическими методами. Перспективность дальнейших исследований состоит в масштабировании предложенного подхода на сети с большим числом устройств, изучении мультиагентных RL-подходов, экспериментальной проверке и интеграции разработанного метода с реальными сетями NB-IoT, а также в разработке гибридных моделей управления, сочетающих алгоритмы обучения с подкреплением с другими методами машинного обучения.


Ключевые слова:

NB-IoT, Reinforcement Learning, Q-learning, DQN, коллизии, NS-3, обучение с подкреплением, RACH, IoT, Интернет вещей

Abstract: The subject of this research is the adaptive management of access to Random Access Channels (RACH) in Narrowband Internet of Things (NB-IoT) networks, which frequently face congestion due to high device density and limited channel capacity. The study focuses on the practical application of Reinforcement Learning algorithms, specifically Q-learning and Deep Q-Network (DQN), to address this issue. The authors thoroughly examine the problem of RACH overload and the resulting collisions that cause delays in data transmission and increased energy consumption in connected devices. The article analyzes the limitations and inefficiency of traditional static slot allocation methods and justifies the necessity of implementing a dynamic, learning-based approach capable of adapting to constantly changing network conditions. The research aims to significantly minimize collision rates, improve connection success rates, and reduce the overall energy consumption of NB-IoT devices. The research methodology involved the use of advanced machine learning methods, including Q-learning and DQN, together with simulation modeling conducted in the NS-3 environment, integrating a dedicated RL-agent for dynamic and intelligent RACH slot allocation. The main conclusions of the study highlight the demonstrated effectiveness of the adaptive RL-based approach for optimizing access to communication slots in NB-IoT networks. The scientific novelty lies in the development and integration of a specialized RL-agent capable of dynamically managing slot distribution based on real-time network conditions. As a result of implementing the proposed approach, the number of collisions was reduced by 74%, the number of successful connections increased by 16%, and the energy efficiency of the devices improved by 15% in comparison with traditional static methods. These results clearly demonstrate the practical applicability, and scalability of adaptive RL-based management techniques for enhancing both the performance and reliability of real-world NB-IoT networks.


Keywords:

NB-IoT, Reinforcement Learning, Q-learning, DQN, collisions, NS-3, reinforcement learning, RACH, IoT, Internet of Things

ВВЕДЕНИЕ

Современные тенденции цифровой трансформации привели к интенсивному росту количества устройств Интернета вещей (Internet of Things, IoT), которые активно используются в различных областях – от бытовых устройств до промышленных и инфраструктурных решений. Одной из наиболее востребованных технологий для обеспечения коммуникации таких устройств является стандарт Narrowband Internet of Things (NB-IoT), отличающийся низкими скоростями передачи данных и высокой энергоэффективностью. Однако увеличение плотности размещения устройств усложнило работу процедур случайного доступа (Random Access Channel, RACH), предназначенных для установления первичной связи устройств с базовыми станциями [4].

Традиционные статические методы распределения временных слотов, используемых в процедурах RACH, перестают отвечать современным требованиям по причине недостаточной адаптивности к динамическим изменениям нагрузки и непредсказуемости поведения большого количества устройств [5]. Следствием этого является увеличение числа коллизий, рост задержек при передаче данных и повышенное энергопотребление устройств, что в совокупности негативно отражается на общей производительности и надежности функционирования сети [3].

В связи с этим возникает необходимость в разработке и внедрении новых адаптивных механизмов, способных оперативно реагировать на изменяющиеся условия сетевой нагрузки и эффективно минимизировать вероятность возникновения коллизий [6]. Одним из перспективных направлений решения данной задачи является применение алгоритмов обучения с подкреплением (Reinforcement Learning, RL), которые позволяют системам принимать оптимальные решения на основе накопленного опыта взаимодействия с окружающей средой [8].

Цель настоящего исследования заключается в разработке и экспериментальном подтверждении эффективности применения RL-алгоритмов (Q-learning и DQN) для динамического управления процедурой распределения временных слотов RACH в сетях NB-IoT. В работе будет проведён сравнительный анализ результатов практического применения предложенного подхода с традиционным статическим методом по эксплуатационным метрикам числа коллизий, успешности подключения устройств, задержки передачи данных и показателям энергопотребления.

Результаты исследования могут быть использованы для оптимизации функционирования реальных NB-IoT сетей, повышения их производительности и энергоэффективности, а также служить основой для дальнейших исследований в области адаптивного и интеллектуального управления сетями IoT.

ТЕКУЩЕЕ СОСТОЯНИЕ ТЕХНОЛОГИИ

Narrowband Internet of Things (NB-IoT) представляет собой специализированный стандарт, разработанный консорциумом 3rd Generation Partnership Project (3GPP), предназначенный для передачи небольших объёмов данных с высокой энергоэффективностью и низкими требованиями к полосе пропускания [9]. Технология позволяет обслуживать большое количество устройств, даже в условиях затрудненного покрытия, таких как подвальные помещения и удалённые сельские территории, что увеличивает актуальность решения проблемы коллизий. Проблема минимизации коллизий в сетях NB-IoT является актуальной и активно изучается многими исследователями ввиду растущего числа устройств, подключаемых к сетям IoT [1].

В мировой практике для минимизации коллизий применяются как алгоритмические, так и технологические методы. Одним из традиционных подходов является модификация алгоритмов случайного доступа путём интеграции механизмов динамического управления интервалами повторных попыток и перераспределения временных слотов.

Однако в последние годы особое внимание уделяется применению методов машинного обучения, в частности обучения с подкреплением (Reinforcement Learning, RL), для решения задачи перегрузки и минимизации коллизий. RL является методом машинного обучения, где агент обучается взаимодействовать с окружающей средой, принимая оптимальные решения на основе накопленного опыта с целью максимизации получаемой награды [8]. Популярными алгоритмами в этом направлении являются Q-learning и Deep Q-Network (DQN), которые позволяют эффективно адаптировать стратегии управления ресурсами сети в зависимости от текущего состояния и динамики нагрузки. Исследование «Transmission Control in NB-IoT With Model-Based Reinforcement Learning» подтверждает эффективность применения RL для адаптивного управления слотами доступа, существенно снижая вероятность возникновения коллизий [7]. В работе «Analysis of the Effect of the Reliability of the NB-Iot Network on the Intelligent System» представлен детальный анализ и конкретные рекомендации по снижению задержек и коллизий с использованием подобных подходов [2].

Также перспективным направлением считается мультиагентный подход, основанный на распределённом управлении сетевыми ресурсами, где множество агентов совместно принимают решения, адаптируясь к изменениям нагрузки и неопределённости среды.

Несмотря на многообразие предложенных методов, актуальной остаётся задача создания универсальных, масштабируемых и высокоэффективных решений, пригодных для практического применения в реальных условиях эксплуатации сетей NB-IoT. В контексте обозначенной задачи подход, основанный на RL-алгоритмах, представленный в настоящем исследовании, является перспективным направлением для эффективного и адаптивного управления сетевыми ресурсами и минимизации числа коллизий.

Задачи и инструменты

Для достижения поставленной цели исследования были сформулированы и решены следующие задачи:

- проведён анализ текущего состояния технологии NB-IoT и выявлены основные проблемы, связанные с процедурами случайного доступа;

- спроектирована модель сети NB-IoT, состоящая из трёх различных типов устройств, отражающих специфику их применения;

- выполнено моделирование работы сети и поведения устройств с применением дискретно-событийного симулятора NS-3;

- разработан RL-агент для динамического управления распределением временных слотов доступа;

- проведена серия экспериментов с использованием RL-агента и без его применения (с традиционным статическим подходом);

- зафиксированы и обработаны результаты экспериментальных исследований;

- выполнен сравнительный анализ результатов по числу коллизий, статусу подключений, задержке передачи данных и энергопотреблению устройств;

- сформулированы выводы о преимуществах и эффективности предложенного подхода на основе проведённого анализа.

В исследовании использовался дискретно-событийный сетевой симулятор NS-3 – широко используемая платформа с открытым исходным кодом, написанная на языке C++ с поддержкой интеграции модулей на Python. NS-3 позволил реализовать детализированную модель NB-IoT сети, отражающую реалистичные условия её функционирования, включая различные типы устройств и паттерны генерации трафика. Благодаря высокой точности моделирования была осуществлена серия симуляций, что позволило собрать и проанализировать данные.

РАЗРАБОТКА МОДЕЛИ СЕТИ NB-IOT И ИНТЕГРАЦИЯ RL-АГЕНТА

Для разработки детализированной модели сети NB-IoT в среде NS-3 было выполнено несколько последовательных этапов моделирования и конфигурации. На начальном этапе был сформирован набор узлов сети: создано 50 независимых узлов, соответствующих устройствам NB-IoT, и отдельный узел, выполняющий функции базовой станции. Узлы были объединены в единую сетевую топологию типа «точка-точка» (Point-to-Point), при которой каждое устройство напрямую взаимодействует с базовой станцией через отдельный канал связи [11].

Для дополнительного контроля корректности реализации модели и наглядной демонстрации процессов обмена данными был использован интегрированный в NS-3 инструмент визуализации NetAnim. Данный инструмент позволил в режиме реального времени визуально представить сформированную топологию сети, расположение устройств и базовой станции, а также пронаблюдать динамические процессы взаимодействия узлов и обмена пакетами данных между ними (см. рисунок 1).

Рисунок 1 – Визуализация топологии сети

Конфигурация используемых каналов связи между узлами была задана с высокой пропускной способностью в 1 Гбит/с и минимальной задержкой передачи данных в 1 мс. Такие параметры были выбраны для того, чтобы свести к минимуму влияние канальных характеристик на результаты симуляции и обеспечить возможность сфокусироваться на исследовании эффективности работы механизма RACH. После завершения конфигурации каналов связи на всех узлах был установлен стек интернет-протоколов IPv4, обеспечивающий корректную передачу пакетов данных по сети.

Для реализации механизма случайного доступа RACH был использован специально разработанный компонент DynamicSlotManager. Данный компонент моделирует реальное поведение устройств NB-IoT в процессе доступа к слотам. В рамках базовой модели были размещены пять временных RACH-слотов с длительностью 10 мс. Устройства осуществляли попытки доступа к слотам и в случае возникновения коллизии переходили в режим ожидания с последующей повторной передачей пакета после случайного временного интервала задержки (backoff).

Для более точного моделирования поведения устройств NB-IoT было разработано специализированное сетевое приложение NbIotDeviceApp, реализованное в виде отдельного класса в симуляторе NS-3. Данное приложение позволяет имитировать три различных типа устройств, отличающихся режимами и регулярностью отправки данных:

- периодические устройства (PERIODIC), отправляющие данные с фиксированными интервалами (каждые 60 секунд);

- спорадические устройства (SPORADIC), отправляющие пакеты данных случайным образом и с непредсказуемой частотой, характерной для различных аварийных датчиков и устройств событийного типа;

- устройства с низким приоритетом (LOW_PRIORITY), характеризующиеся нерегулярной отправкой данных и допускающие значительные задержки при передаче информации.

Распределение узлов по указанным типам было задано следующим образом: 30% устройств периодического типа, 40% спорадического и 30% устройств с низким приоритетом. Размер пакетов данных, отправляемых устройствами, составлял 50 байт. Энергетические затраты каждого устройства на отправку одного пакета данных были смоделированы в размере 0.2 Дж, при этом изначальный запас энергии устройств был установлен равным 10 Дж.

Для интеграции алгоритма обучения с подкреплением (RL) в симуляционную модель был разработан специальный внешний Python-модуль rl_agent.py, реализующий логику RL с использованием методов Q-learning и Deep Q-Network (DQN). Взаимодействие между симулятором NS-3 и внешним Python-агентом обеспечивалось через специально созданный интеграционный слой на стороне NS-3 с использованием Python C API. Этот слой осуществлял вызов функций RL-агента [10], передачу агенту данных о текущем состоянии сети (число коллизий, количество успешных и неуспешных попыток подключения, текущее распределение слотов) и получение нового оптимизированного распределения слотов доступа.

На этапе инициализации агент устанавливал начальные параметры обучения (коэффициенты обучения, дисконта, вероятность случайного выбора действий) и формировал начальное равномерное распределение слотов доступа для каждого устройства.

Каждые 30 секунд агент получал от симулятора NS-3 актуальные метрики состояния сети и на их основе оценивал текущее состояние системы.

Используя стратегию ε-жадности, агент выбирал действие, направленное на оптимизацию текущей ситуации (уменьшение коллизий, повышение успешности подключений и энергоэффективности).

После выбора действия RL-агент рассчитывал новое оптимальное распределение слотов доступа, передавая полученные конфигурации обратно в симулятор NS-3, где они непосредственно применялись в работе устройств сети.

После применения новых конфигураций RL-агент фиксировал изменения состояния сети, рассчитывал полученную награду и корректировал значения Q-функции, готовясь к следующему циклу анализа.

Экспериментальные исследования проводились на интервале в 3600 секунд (один час), в течение которого каждые 10 секунд фиксировались метрики состояния сети для последующего анализа и сравнительной оценки эффективности предложенного подхода с использованием RL-агента по сравнению с традиционным статическим методом управления слотами.

СРАВНИТЕЛЬНЫЙ АНАЛИЗ РЕЗУЛЬТАТОВ ЭКСПЕРМИЕНТОВ

Для оценки эффективности интегрированного RL-алгоритма были проведены два комплекса экспериментов: первый – с традиционным статическим подходом к распределению слотов RACH, второй – с применением адаптивного алгоритма обучения с подкреплением (RL). Время проведения каждого эксперимента составляло 3600 секунд, с идентичными исходными условиями и параметрами сети.

Анализ числа и доли коллизий показал существенное преимущество применения RL-алгоритма. При статическом подходе количество коллизий достигло 50 за весь период симуляции, что соответствует доле 2.84% от общего числа попыток доступа. В случае применения RL-алгоритма число коллизий значительно сократилось – до 13, снизив долю коллизий до 0.65%. Таким образом, адаптивный подход позволил уменьшить количество коллизий на 74%, а долю коллизий – на 77%.

Средняя задержка при обоих подходах удерживалась на низком уровне и составила примерно 0.01 секунды. Несмотря на отсутствие заметной разницы в средней задержке, снижение числа коллизий при использовании RL-алгоритма способствует более стабильной работе сети, уменьшая необходимость повторных попыток доступа, что в долгосрочной перспективе приводит к общему повышению эффективности передачи данных.

Энергопотребление устройств является важным показателем для сетей NB-IoT. В ходе эксперимента с традиционным статическим распределением слотов средний остаточный заряд устройств составил 3.7 Дж, в то время как при использовании адаптивного RL-подхода – 3.12 Дж. Это свидетельствует об улучшении энергоэффективности на 15%, вызванном сокращением числа повторных передач данных вследствие снижения коллизий.

Количество успешно переданных пакетов данных за время проведения экспериментов также улучшилось. При использовании статического подхода было зафиксировано 1710 успешных подключений. В случае использования RL-алгоритма это значение выросло до 1990 успешных подключений, что соответствует приросту успешных подключений на 16%. Данный результат подтверждает высокую эффективность адаптивного подхода с точки зрения повышения успешности передачи данных.

Сводная таблица сравнительного анализа результатов экспериментов представлена ниже:

Таблица 1. Результаты моделирования без RL-агента и с его использованием

Метрика

Статическое распределение

RL-алгоритм

Изменение

Число коллизий

50

13

↓74%

Доля коллизий (%)

2.84

0.65

↓77%

Средняя задержка (сек.)

0.01

0.01

стабильно

Среднее энергопотребление (Дж)

3.7

3.12

↓15%

Число успешных подключений

1710

1990

↑16%

Полученные результаты демонстрируют преимущества предложенного адаптивного подхода на основе алгоритмов обучения с подкреплением перед традиционными методами распределения слотов RACH в сетях NB-IoT. Адаптивность RL-алгоритма к текущей сетевой нагрузке позволяет значительно улучшить основные показатели производительности сети, подтвердив возможность практического применения данного подхода в реальных условиях.

РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЙ И ИХ ОБСУЖДЕНИЕ

Результаты проведенного исследования подтверждают высокую эффективность использования алгоритмов обучения с подкреплением для динамического управления процедурой доступа к временным слотам RACH в сетях NB-IoT. По сравнению с традиционным статическим подходом, применение RL-агента позволило существенно улучшить ключевые эксплуатационные показатели. Количество коллизий было сокращено на 74%, при этом доля коллизий в общем количестве попыток подключения снизилась на 77%. Также удалось увеличить число успешных подключений на 16% и улучшить энергоэффективность устройств на 15%.

Полученные данные подтверждают целесообразность внедрения адаптивных методов управления сетевыми ресурсами на основе RL-алгоритмов в реальные NB-IoT-сети, так как это позволяет существенно повысить общую производительность и надежность функционирования сети.

В рамках дальнейших исследований представляется целесообразным масштабировать предложенный подход с целью изучения поведения алгоритмов обучения с подкреплением при увеличении количества устройств и усложнении сценариев генерации трафика. Это позволит более точно оценить производительность разработанных решений в условиях, максимально приближенных к реальным эксплуатационным условиям.

Дополнительным перспективным направлением является исследование мультиагентных подходов, при которых одновременно несколько RL-агентов управляют различными аспектами сетевого взаимодействия. Предполагается, что это позволит обеспечить дополнительный прирост эффективности в управлении ресурсами сети и снизить вероятность коллизий за счет координации агентов.

Важной задачей будущих исследований является экспериментальная проверка возможности интеграции разработанных RL-алгоритмов с реальным сетевым оборудованием и тестирование в действующих сетях. Это позволит выявить потенциальные ограничения и сложности, возникающие при переходе от симуляции к практическому применению.

Авторы убеждены, что результаты настоящей работы могут служить основой для дальнейших исследований и способствовать совершенствованию технологий интеллектуального управления сетями Интернета вещей.

ВКЛАД АВТОРОВ / AUTHORS’ CONTRIBUTION

Авторы внесли равный вклад в написание статьи / The authors contributed equally to the writing of the article.

Библиография
1. Liu Y., Deng Y., Jiang N. [и др.]. Analysis of Random Access in NB-IoT Networks With Three Coverage Enhancement Groups: A Stochastic Geometry Approach // IEEE Transactions on Wireless Communications. – 2021. – Т. 20, № 1. – С. 549-563. DOI: 10.1109/twc.2020.3026331. EDN: WLBLVU.
2. Jia G., Zhu Y., Li Y., Zhu Z. Analysis of the Effect of the Reliability of the NB-IoT Network on the Intelligent System // Special Section on Innovation and Application of Internet of Things and Emerging Technologies in Smart Sensing. – 2019. – № 7. – С. 112809-112820.
3. Sahithya R., Pouria Z., Mohieddine E. S., Majid N. Evaluation, Modeling and Optimization of Coverage Enhancement Methods of NB-IoT // Electrical Engineering Department. – 2019. – № 1. – С. 1-17.
4. Chougrani H., Kisseleff S., Martins W. A., Chatzinotas S. NB-IoT Random Access for Nonterrestrial Networks: Preamble Detection and Uplink Synchronization // IEEE Internet of Things Journal. – 2022. – Т. 9, № 16. – С. 14913-14927. DOI: 10.1109/jiot.2021.3123376. EDN: RVWLFC.
5. Agiwal M., Kumar M. M., Jin H. Power Efficient Random Access for Massive NB-IoT Connectivity // Sensors. – 2019. – № 19. – С. 1-24.
6. Jiang N., Deng Y., Nallanathan A. Deep Reinforcement Learning for Real-Time Optimization in NB-IoT Networks // School of Electronic Engineering and Computer Science. – 2018. – № 1. – С. 1-31.
7. Alcaraz J., Losilla F., Gonzalez-Castaño F.-J. Transmission Control in NB-IoT With Model-Based Reinforcement Learning // IEEE Access. – 2023. – № 11. – С. 57991-58005. DOI: 10.1109/access.2023.3284990. EDN: KTFAKS.
8. Anbazhagan S., Mugelan R.K. Next-Gen Resource Optimization in NB-IoT Networks: Harnessing Soft Actor-Critic Reinforcement Learning // Computer Networks. – 2024. – № 252. – С. 110670-110684. DOI: 10.1016/j.comnet.2024.110670. EDN: XHDOCK.
9. Шорин О.А., Асланян В.А. Подходы к интеграции технологии NB-IoT с сетью 5G // Экономика и качество систем связи. – 2024. – № 3. – С. 56-62. EDN: CXRPPW.
10. Намиот Д.Е., Ильюшин Е.А. Архитектура LLM агентов // International Journal of Open Information Technologies. – 2025. – Т. 13, № 1. – С. 2307-8162.
11. Исаева О.С. Построение цифрового профиля устройств Интернета вещей // Информационные и математические технологии в науке и управлении. – 2023. – Т. 30, № 2. – С. 36-44. DOI: 10.25729/ESI.2023.30.2.004. EDN: EFPGJP.
References
1. Liu, Y., Deng, Y., Jiang, N., et al. (2021). Analysis of random access in NB-IoT networks with three coverage enhancement groups: A stochastic geometry approach. IEEE Transactions on Wireless Communications, 20(1), 549-563.
2. Jia, G., Zhu, Y., Li, Y., & Zhu, Z. (2019). Analysis of the effect of the reliability of the NB-IoT network on the intelligent system. Special Section on Innovation and Application of Internet of Things and Emerging Technologies in Smart Sensing, 7, 112809-112820.
3. Sahithya, R., Pouria, Z., Mohieddine, E. S., & Majid, N. (2019). Evaluation, modeling and optimization of coverage enhancement methods of NB-IoT. Electrical Engineering Department, 1, 1-17.
4. Chougrani, H., Kisseleff, S., Martins, W. A., & Chatzinotas, S. (2022). NB-IoT random access for nonterrestrial networks: Preamble detection and uplink synchronization. IEEE Internet of Things Journal, 9(16), 14913-14927. https://doi.org/10.1109/jiot.2021.3123376
5. Agiwal, M., Kumar, M. M., & Jin, H. (2019). Power efficient random access for massive NB-IoT connectivity. Sensors, 19, 1-24.
6. Jiang, N., Deng, Y., & Nallanathan, A. (2018). Deep reinforcement learning for real-time optimization in NB-IoT networks. School of Electronic Engineering and Computer Science, 1, 1-31.
7. Alcaraz, J., Losilla, F., & Gonzalez-Castaño, F.-J. (2023). Transmission control in NB-IoT with model-based reinforcement learning. IEEE Access, 11, 57991-58005. https://doi.org/10.1109/access.2023.3284990
8. Anbazhagan, S., & Mugelan, R. K. (2024). Next-gen resource optimization in NB-IoT networks: Harnessing soft actor-critic reinforcement learning. Computer Networks, 252, 110670-110684. https://doi.org/10.1016/j.comnet.2024.110670
9. Shorin, O. A., & Aslanyan, V. A. (2024). Approaches to integration of NB-IoT technology with 5G network. Economics and Quality of Communication Systems, 3, 56-62.
10. Namiot, D. E., & Ilyushin, E. A. (2025). Architecture of LLM agents. International Journal of Open Information Technologies, 13(1), 2307-8162.
11. Isaeva, O. S. (2023). Construction of a digital profile of Internet of Things devices. Information and Mathematical Technologies in Science and Management, 30(2), 36-44. https://doi.org/10.25729/ESI.2023.30.2.004

Результаты процедуры рецензирования статьи

В связи с политикой двойного слепого рецензирования личность рецензента не раскрывается.
Со списком рецензентов издательства можно ознакомиться здесь.

Представленная статья на тему «Динамическое распределение слотов RACH для минимизации коллизий в сетях NB-IoT на основе алгоритмов обучения с подкреплением» соответствует тематике журнала «Программные системы и вычислительные методы» и посвящена вопросу создания универсальных, масштабируемых и высокоэффективных решений, пригодных для практического применения в реальных условиях эксплуатации сетей NB-IoT.
В качестве цели авторы указывают разработку и экспериментальное подтверждение эффективности применения RL-алгоритмов (Q-learning и DQN) для динамического управления процедурой распределения временных слотов RACH в сетях NB-IoT.
Для достижения поставленной цели авторы сформулировали следующие задачи:
- провести анализ текущего состояния технологии NB-IoT и выявлены основные проблемы, связанные с процедурами случайного доступа;
- спроектировать модель сети NB-IoT, состоящая из трёх различных типов устройств, отражающих специфику их применения;
- выполнить моделирование работы сети и поведения устройств с применением дискретно-событийного симулятора NS-3;
- разработать RL-агент для динамического управления распределением временных слотов доступа;
- провести серия экспериментов с использованием RL-агента и без его применения (с традиционным статическим подходом);
- зафиксировать и обработаны результаты экспериментальных исследований;
- выполнить сравнительный анализ результатов по числу коллизий, статусу подключений, задержке передачи данных и энергопотреблению устройств;
- сформулировать выводы о преимуществах и эффективности предложенного подхода на основе проведённого анализа.
В списке литературы представлены зарубежные источники по теме исследования. Стиль и язык изложения материала является достаточно доступным для широкого круга читателей. Статья по объему соответствует рекомендуемому объему от 12 000 знаков.
Практическая значимость статьи четко обоснована, авторы указывают, что результаты исследования могут быть использованы для оптимизации функционирования реальных NB-IoT сетей, повышения их производительности и энергоэффективности, а также служить основой для дальнейших исследований в области адаптивного и интеллектуального управления сетями IoT.
Статья достаточно структурирована - в наличии введение, результаты исследований и их обсуждение, внутреннее членение основной части (текущее состояние технологии, разработка модели сети Nb-Iot и интеграция Rl-агента, сравнительный анализ результатов экспермиентов).
Авторами при проведении исследования использовался дискретно-событийный сетевой симулятор NS-3 – широко используемая платформа с открытым исходным кодом, написанная на языке C++ с поддержкой интеграции модулей на Python.
К недостаткам можно отнести следующие моменты: из содержания статьи не прослеживается научная новизна. Отсутствует четкое выделение предмета, объекта исследования.
Рекомендуется четко обозначить научную новизну исследования, сформулировать предмет, объект. Также будет целесообразным добавить о перспективах дальнейшего исследования, расширить список литературы, указав работы отечественных авторов.
Статья «Динамическое распределение слотов RACH для минимизации коллизий в сетях NB-IoT на основе алгоритмов обучения с подкреплением» требует доработки по указанным выше замечаниям. После внесения поправок рекомендуется к повторному рассмотрению редакцией рецензируемого научного журнала.

Результаты процедуры повторного рецензирования статьи

В связи с политикой двойного слепого рецензирования личность рецензента не раскрывается.
Со списком рецензентов издательства можно ознакомиться здесь.

Статья посвящена актуальной проблеме минимизации коллизий в сетях Narrowband Internet of Things (NB-IoT) через динамическое распределение слотов Random Access Channel (RACH) с использованием алгоритмов обучения с подкреплением (Reinforcement Learning, RL). Авторы предлагают инновационный подход на основе Q-learning и Deep Q-Network (DQN), направленный на повышение эффективности работы сети.
Исследование выполнено на высоком научном уровне с применением современных методов моделирования. Авторы использовали дискретно-событийный симулятор NS-3 для создания детализированной модели сети NB-IoT, включающей три типа устройств с различными паттернами генерации трафика. Интеграция RL-агента, реализованного на Python, позволила динамически управлять распределением слотов RACH. Эксперименты проводились в контролируемых условиях с фиксацией ключевых метрик: числа коллизий, задержки передачи данных, энергопотребления и успешности подключений.
Работа отвечает на вызовы, связанные с ростом числа устройств IoT и перегрузкой сетей. Проблема коллизий в NB-IoT, усугубляемая статическими методами распределения ресурсов, требует адаптивных решений. Применение RL-алгоритмов, как демонстрируют авторы, является перспективным направлением для повышения производительности и энергоэффективности сетей.
Основной вклад статьи заключается в:
1. Разработке RL-агента для динамического управления слотами RACH, что позволило сократить число коллизий на 74%.
2. Экспериментальном подтверждении преимуществ RL-подхода перед статическими методами, включая улучшение энергоэффективности на 15% и увеличение успешных подключений на 16%.
3. Предложении масштабируемой модели, пригодной для дальнейших исследований, включая мультиагентные системы и интеграцию с реальным оборудованием.
Статья отличается четкой логической структурой, последовательным изложением и глубиной проработки темы. Введение обосновывает актуальность исследования, раздел «Текущее состояние технологии» содержит обзор литературы, а методическая часть детализирована и воспроизводима. Результаты представлены наглядно, включая сравнительную таблицу, что облегчает восприятие данных. Стиль изложения соответствует академическим стандартам, терминология использована корректно.
Авторы убедительно демонстрируют эффективность RL-алгоритмов для управления ресурсами NB-IoT. Полученные результаты имеют значительную практическую ценность и могут быть применены для оптимизации реальных сетей. Статья вносит весомый вклад в область интеллектуального управления IoT и открывает направления для дальнейших исследований, таких как мультиагентные системы и тестирование в промышленных условиях.
Материал будет востребован исследователями в области IoT, телекоммуникаций и машинного обучения, а также инженерами, занимающимися развертыванием и оптимизацией NB-IoT сетей. Четкие выводы и практические рекомендации делают статью полезной для широкого круга специалистов.
Статья соответствует высоким академическим стандартам, обладает значительной научной новизной и практической ценностью. Уверен, что работа вызовет интерес у научного сообщества и послужит основой для дальнейших исследований в данной области.
Рекомендация: принять к публикации без доработок.