DOI: https://doi.org/10.26089/NumMet.v27r104

Модификации матричного метода муравьиных колоний для параметрической оптимизации с применением GPU с технологией CUDA

Авторы

  • Ю.П. Титов

Ключевые слова:

метод муравьиных колоний
параметрическая задача
оптимизация
CUDA
Tesla V100

Аннотация

Статья посвящена разработке и исследованию матричных модификаций метода муравьиных колоний (ACO) для решения параметрических задач оптимизации с использованием графических процессоров (GPU) на архитектуре CUDA. В отличие от большинства существующих исследований, фокусирующихся на задаче коммивояжера (TSP), предложенный метод специализирован для поиска оптимальных значений независимых параметров, что приводит к иной структуре графа и обуславливает необходимость разработки новых схем распараллеливания. Представлены оригинальные схемы параллелизма, включающие разделение алгоритма на три этапа и введение “параметрического параллелизма по измерениям задачи. Разработаны и протестированы различные стратегии распараллеливания и управления памятью: от базовой модификации MatrixACO-Basic до оптимизированных версий MatrixACO-Optimization (с warp-редукцией и оптимизацией хэш-таблицы) и MatrixACO-Transported (с транспонированным хранением данных). Эксперименты проводились на графических ускорителях NVIDIA Tesla V100 16GB SXM2, платформе Jetson ORIN и различных персональных компьютерах с использованием многомерных тестовых функций. Результаты показывают, что для задачи с 128 параметрами оптимизированная версия MatrixACO-Optimization обеспечивает время обработки одного слоя графа, равное 0.13 мс, что соответствует ускорению более чем в 30 раз по сравнению с оптимизированной CPU-реализацией на основе OpenMP, а в случае задачи с 65536 параметрами способствует ускорению почти в 45 раз. Для задачи с 512 параметрами GPU-реализация демонстрирует на 76% более высокую энергоэффективность по сравнению с CPU-версией, а также почти восьмикратное (в 7.9 раза) снижение Energy-Delay Product. Исследование подтверждает необходимость создания специализированных GPU-реализаций для параметрических задач и выявляет отличную масштабируемость предложенных алгоритмов.



Загрузки

Опубликован

2026-02-27

Выпуск

Раздел

Параллельные программные средства и технологии

Автор

Ю.П. Титов

МАИ

• доцент


Библиографические ссылки

  1. A. Colorni, M. Dorigo and M. Vittorio, “Distributed Optimization by Ant Colonies,” Proceedings of the First European Conference on Artificial Life. Paris, France, January 1991 (Elsevier Publishing, 1991), pp. 134–142.
  2. M. Dorigo and L. M. Gambardella, “Ant Colony System: a Cooperative Learning Approach to the Traveling Salesman Problem,” Evolutionary Computation, IEEE Transactions. textbf1.1, 53–66 (1997).
    doi 10.1109/4235.585892
  3. B. Bullnheimer, R. Hartl and C. Strauss, “An improved Ant System Algorithm for the Vehicle Routing Problem,” Annals of Operations Research 89, 319–328 (1999).
    doi 10.1023/A: 1018940026670.
  4. L. M. Gambardella, E. D. Taillard and M. Dorigo, “Ant colonies for the quadratic assignment problem,” Journal of the Operational Research Society. 50 (2), 167–176 (1999).
  5. K. L. Huang and C. J. Liao, “Ant Colony Optimization Combined with Taboo Search for the Job Shop Scheduling Problem,” Computers & Operations Research. 35 (4), 1030–1046 (2008).
    doi 10.1016/j.cor.2006.07.003
  6. M. Dorigo, V. Maniezzo and A. Colorni, “Positive Feedback as a Search Strategy,” In Technical Report 91-016, Politecnico di Milano, Italy, 1991.
  7. L. M. Gambardella and M. Dorigo, “Ant-Q: A Reinforcement Learning Approach to the Traveling Salesman Problem,” In Machine Learning Proceedings 1995, Morgan Kaufmann , pp. 252–260.
    doi 10.1016/B978-1-55860-377-6.50039-6
  8. B. Bullnheimer, R. F. Hartl and C. Strauss, “Applying the Ant System to the Vehicle Routing Problems,” Annals of Operations Research. 79, 109–123 (1998).
    doi 10.1007/978-1-4615-5775-3_20
  9. T. Stützle and H. H. Hoos, “MAX–MIN Ant System,” Future Generation Computer Systems. 16 (8), 889–914 (2000).
    doi 10.1016/S0167-739X(00)00043-1
  10. O. Cordon, I. F. de Viana, F. Herrera, “Analysis of the best-worst ant system and its variants on the TSP,” Soft Computing. 9 (2–3), 177–192 (2002).
  11. M. Randall, A. A. Lewis, “A Parallel Implementation of Ant Colony Optimization,” Journal of Parallel and Distributed Computing. 62 (9), 1421–1432 (2002).
    doi 10.1006/jpdc.2002.1854
  12. M. Dorigo, T. Stützle, Ant Colony Optimization(MIT Press, Cambridge, Massachusetts, 2004).
  13. H. Bai, D. OuYang, X. Li, at al., “MAXMIN Ant System on GPU with CUDA,” In 2009 Fourth International Conference on Innovative Computing, Information and Control (ICICIC), Kaohsiung, Taiwan, December 7–9, 2009 (IEEE Computer Society), pp. 801–804.
    doi 10.1109/ICICIC.2009.255
  14. D. M. Chitty, “Applying ACO to Large Scale TSP Instances,” In: F. Chao et al. (Eds.) Advances in Computational Intelligence Systems. UKCI 2017 (Intelligent Systems and Computing, Springer, Cham), 650 (2018).
    doi 10.1007/978-3-319-66939-7_9
  15. R. Skinderowicz, “The GPU-based parallel Ant Colony System,” Journal of Parallel and Distributed Computing. 98, 48–60 (2016)
    doi 10.1016/j.jpdc.2016.04.014
  16. D. Zhang, X. You, S. Liu, K. Yang,” Multi-Colony Ant Colony Optimization Based on Generalized Jaccard Similarity Recommendation Strategy,” IEEE Access. 7, 157303-157317 (2019)
    doi 10.1109/ACCESS.2019.2949860
  17. R. Skinderowicz,” Implementing a GPU-based parallel MAX–MIN Ant System,” Future Generation Computer Systems. 106, 277–295 (2020)
    doi 10.1016/j.future.2020.01.011
  18. Z. B. Huan, G. T. Fu, T. H. Fa, at al.,” High Performance Ant Colony System Based on GPU Warp Specialization with a Static-Dynamic Balanced Candidate Set Strategy,” Future Generation Computer Systems. 125, 136–150 (2021).
    doi 10.1016/j.future.2021.06.041
  19. I. N. Sinitsyn, Y. P. Titov,” Control of Set of System Parameter Values by the Ant Colony Method,” Autom. Remote Control, 84, 893–903 (2023).
    doi 10.1134/S0005117923080106
  20. V. Sudakov, Y. Titov,” Matrix-Based ACO for Solving Parametric Problems Using Heterogeneous Reconfigurable Computers and SIMD Accelerators,” Mathematics, 13 (1284), (2025).
    doi 10.3390/math13081284
  21. V. A. Sudakov, Y. P. Titov,” Investigation of the Parametric Graph Model in the Ant Colony Method,” Math. Models Comput. Simul. 17, 126–136 (2025).
    doi 10.1134/S2070048224700996
  22. I. N. Sinitsyn, Y. P. Titov, “Investigation of algorithms for cyclic search for additional solutions when optimizing the order of hyperparameters by the ant colony method,” High Availability Systems. 19 (1), 59–73 (2023).
    http://radiotec.ru/en/journal/Highly_available_systems/number/2023-1/article/23354 Cited February 25, 2026.
  23. Y. P. Titov, Implementation of ACO Algorithm Modifications on CUDA for SIMD Compute Processor Operation [Electronic resource].
    https://github.com/kalengul/ACO_SIMD Cited January 23, 2026.
  24. S. K. Mishra,” Some New Test Functions for Global Optimization and Performance of Repulsive Particle Swarm Method,” University Library of Munich, Germany, MPRA Paper. 2718 (2006).
    https://mpra.ub.uni-muenchen.de/2718/ Cited February 25, 2026.
  25. B. N. Chetverushkin, V. A. Sudakov, Y. P. Titov,” Graph Condensation for Large Factor Models,” Dokl. Math. 109, 246–251 (2024).
    doi 10.1134/S1064562424702090