Модификации матричного метода муравьиных колоний для параметрической оптимизации с применением GPU с технологией CUDA

Ю. П. Титов

doi:10.26089/NumMet.v27r104

https://doi.org/10.26089/NumMet.v27r104

Модификации матричного метода муравьиных колоний для параметрической оптимизации с применением GPU с технологией CUDA

Авторы

Ю. П. Титов

Ключевые слова:

метод муравьиных колоний

параметрическая задача

оптимизация

CUDA

Tesla V100

Аннотация

Статья посвящена разработке и исследованию матричных модификаций метода муравьиных колоний (ACO) для решения параметрических задач оптимизации с использованием графических процессоров (GPU) на архитектуре CUDA. В отличие от большинства существующих исследований, фокусирующихся на задаче коммивояжера (TSP), предложенный метод специализирован для поиска оптимальных значений независимых параметров, что приводит к иной структуре графа и обуславливает необходимость разработки новых схем распараллеливания. Представлены оригинальные схемы параллелизма, включающие разделение алгоритма на три этапа и введение “параметрического параллелизма по измерениям задачи. Разработаны и протестированы различные стратегии распараллеливания и управления памятью: от базовой модификации MatrixACO-Basic до оптимизированных версий MatrixACO-Optimization (с warp-редукцией и оптимизацией хэш-таблицы) и MatrixACO-Transported (с транспонированным хранением данных). Эксперименты проводились на графических ускорителях NVIDIA Tesla V100 16GB SXM2, платформе Jetson ORIN и различных персональных компьютерах с использованием многомерных тестовых функций. Результаты показывают, что для задачи с 128 параметрами оптимизированная версия MatrixACO-Optimization обеспечивает время обработки одного слоя графа, равное 0.13 мс, что соответствует ускорению более чем в 30 раз по сравнению с оптимизированной CPU-реализацией на основе OpenMP, а в случае задачи с 65536 параметрами способствует ускорению почти в 45 раз. Для задачи с 512 параметрами GPU-реализация демонстрирует на 76% более высокую энергоэффективность по сравнению с CPU-версией, а также почти восьмикратное (в 7.9 раза) снижение Energy-Delay Product. Исследование подтверждает необходимость создания специализированных GPU-реализаций для параметрических задач и выявляет отличную масштабируемость предложенных алгоритмов.

Загрузки

Опубликован

2026-02-27

Выпуск

Том 27 (2026): Выпуск 1.

Раздел

Параллельные программные средства и технологии

Автор

Ю. П. Титов

МАИ

• доцент

Библиографические ссылки

A. Colorni, M. Dorigo and M. Vittorio, “Distributed Optimization by Ant Colonies,” Proceedings of the First European Conference on Artificial Life. Paris, France, January 1991 (Elsevier Publishing, 1991), pp. 134–142.
M. Dorigo and L. M. Gambardella, “Ant Colony System: a Cooperative Learning Approach to the Traveling Salesman Problem,” Evolutionary Computation, IEEE Transactions. textbf1.1, 53–66 (1997).
doi 10.1109/4235.585892
B. Bullnheimer, R. Hartl and C. Strauss, “An improved Ant System Algorithm for the Vehicle Routing Problem,” Annals of Operations Research 89, 319–328 (1999).
doi 10.1023/A:1018940026670
L. M. Gambardella, E. D. Taillard and M. Dorigo, “Ant colonies for the quadratic assignment problem,” Journal of the Operational Research Society. 50 (2), 167–176 (1999).
K. L. Huang and C. J. Liao, “Ant Colony Optimization Combined with Taboo Search for the Job Shop Scheduling Problem,” Computers & Operations Research. 35 (4), 1030–1046 (2008).
doi 10.1016/j.cor.2006.07.003
M. Dorigo, V. Maniezzo and A. Colorni, “Positive Feedback as a Search Strategy,” In Technical Report 91-016, Politecnico di Milano, Italy, 1991.
L. M. Gambardella and M. Dorigo, “Ant-Q: A Reinforcement Learning Approach to the Traveling Salesman Problem,” In Machine Learning Proceedings 1995, Morgan Kaufmann , pp. 252–260.
doi 10.1016/B978-1-55860-377-6.50039-6
B. Bullnheimer, R. F. Hartl and C. Strauss, “Applying the Ant System to the Vehicle Routing Problems,” Annals of Operations Research. 79, 109–123 (1998).
doi 10.1007/978-1-4615-5775-3_20
T. Stützle and H. H. Hoos, “MAX–MIN Ant System,” Future Generation Computer Systems. 16 (8), 889–914 (2000).
doi 10.1016/S0167-739X(00)00043-1
O. Cordon, I. F. de Viana, F. Herrera, “Analysis of the best-worst ant system and its variants on the TSP,” Soft Computing. 9 (2–3), 177–192 (2002).
M. Randall, A. A. Lewis, “A Parallel Implementation of Ant Colony Optimization,” Journal of Parallel and Distributed Computing. 62 (9), 1421–1432 (2002).
doi 10.1006/jpdc.2002.1854
M. Dorigo, T. Stützle, Ant Colony Optimization(MIT Press, Cambridge, Massachusetts, 2004).
H. Bai, D. OuYang, X. Li, at al., “MAXMIN Ant System on GPU with CUDA,” In 2009 Fourth International Conference on Innovative Computing, Information and Control (ICICIC), Kaohsiung, Taiwan, December 7–9, 2009 (IEEE Computer Society), pp. 801–804.
doi 10.1109/ICICIC.2009.255
D. M. Chitty, “Applying ACO to Large Scale TSP Instances,” In: F. Chao et al. (Eds.) Advances in Computational Intelligence Systems. UKCI 2017 (Intelligent Systems and Computing, Springer, Cham), 650 (2018).
doi 10.1007/978-3-319-66939-7_9
R. Skinderowicz, “The GPU-based parallel Ant Colony System,” Journal of Parallel and Distributed Computing. 98, 48–60 (2016)
doi 10.1016/j.jpdc.2016.04.014
D. Zhang, X. You, S. Liu, K. Yang,” Multi-Colony Ant Colony Optimization Based on Generalized Jaccard Similarity Recommendation Strategy,” IEEE Access. 7, 157303-157317 (2019)
doi 10.1109/ACCESS.2019.2949860
R. Skinderowicz,” Implementing a GPU-based parallel MAX–MIN Ant System,” Future Generation Computer Systems. 106, 277–295 (2020)
doi 10.1016/j.future.2020.01.011
Z. B. Huan, G. T. Fu, T. H. Fa, at al.,” High Performance Ant Colony System Based on GPU Warp Specialization with a Static-Dynamic Balanced Candidate Set Strategy,” Future Generation Computer Systems. 125, 136–150 (2021).
doi 10.1016/j.future.2021.06.041
I. N. Sinitsyn, Y. P. Titov,” Control of Set of System Parameter Values by the Ant Colony Method,” Autom. Remote Control, 84, 893–903 (2023).
doi 10.1134/S0005117923080106
V. Sudakov, Y. Titov,” Matrix-Based ACO for Solving Parametric Problems Using Heterogeneous Reconfigurable Computers and SIMD Accelerators,” Mathematics, 13 (1284), (2025).
doi 10.3390/math13081284
V. A. Sudakov, Y. P. Titov,” Investigation of the Parametric Graph Model in the Ant Colony Method,” Math. Models Comput. Simul. 17, 126–136 (2025).
doi 10.1134/S2070048224700996
I. N. Sinitsyn, Y. P. Titov, “Investigation of algorithms for cyclic search for additional solutions when optimizing the order of hyperparameters by the ant colony method,” High Availability Systems. 19 (1), 59–73 (2023).
http://radiotec.ru/en/journal/Highly_available_systems/number/2023-1/article/23354 Cited February 25, 2026.
Y. P. Titov, Implementation of ACO Algorithm Modifications on CUDA for SIMD Compute Processor Operation [Electronic resource].
https://github.com/kalengul/ACO_SIMD Cited January 23, 2026.
S. K. Mishra,” Some New Test Functions for Global Optimization and Performance of Repulsive Particle Swarm Method,” University Library of Munich, Germany, MPRA Paper. 2718 (2006).
https://mpra.ub.uni-muenchen.de/2718/ Cited February 25, 2026.
B. N. Chetverushkin, V. A. Sudakov, Y. P. Titov,” Graph Condensation for Large Factor Models,” Dokl. Math. 109, 246–251 (2024).
doi 10.1134/S1064562424702090

Лицензия

Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.

https://doi.org/10.26089/NumMet.v27r104

Модификации матричного метода муравьиных колоний для параметрической оптимизации с применением GPU с технологией CUDA

Авторы

Ключевые слова:

Аннотация

Загрузки

Опубликован

Выпуск

Раздел

Автор

Ю. П. Титов

Библиографические ссылки

Лицензия

Язык

Информация

Отправить статью