Поиск типичных подпоследовательностей временного ряда на графическом процессоре
Авторы
-
М. Л. Цымблер
-
А. И. Гоглачев
Ключевые слова:
временной ряд
поиск типичных подпоследовательностей
матричный профиль
мера MPdist
параллельный алгоритм
графический процессор
Аннотация
Поиск типичных подпоследовательностей временного ряда является одной из актуальных задач интеллектуального анализа временных рядов. Данная задача предполагает нахождение набора подпоследовательностей временного ряда, которые адекватно отражают течение процесса или явления, задаваемого этим рядом. Поиск типичных подпоследовательностей дает возможность резюмировать и визуализировать большие временные ряды в широком спектре приложений: мониторинг технического состояния сложных машин и механизмов, интеллектуальное управление системами жизнеобеспечения, мониторинг показателей функциональной диагностики организма человека и др. Предложенная недавно концепция сниппета формализует типичную подпоследовательность временного ряда следующим образом. Сниппет представляет собой подпоследовательность, на которую похожи многие другие подпоследовательности данного ряда в смысле специализированной меры схожести, основанной на евклидовом расстоянии. Поиск типичных подпоследовательностей с помощью сниппетов показывает адекватные результаты для временных рядов из широкого спектра предметных областей, однако соответствующий алгоритм имеет высокую вычислительную сложность. В настоящей работе предложен новый параллельный алгоритм поиска сниппетов во временном ряде на графическом ускорителе. Распараллеливание выполнено с помощью технологии программирования CUDA. Разработаны структуры данных, позволяющие эффективно распараллелить вычисления на графическом процессоре. Представлены результаты вычислительных экспериментов, подтверждающих высокую производительность разработанного алгоритма.
Раздел
Параллельные программные средства и технологии
Библиографические ссылки
- S. Imani, F. Madrid, W. Ding, et al., “Matrix Profile XIII: Time Series Snippets: A New Primitive for Time Series Data Mining,” in Proc. 9th IEEE Int. Conf. on Big Knowledge (ICBK). Singapore, November 17-18, 2018 , doi{10.1109/ICBK.2018.00058}.
- S. Kumar, P. Tiwari, and M. Zymbler, “Internet of Things is a Revolutionary Approach for Future Technology Enhancement: A Review,” J. Big Data 6 (2019). doi{10.1186/s40537-019-0268-2}.
- M. L. Zymbler, Ya. A. Kraeva, E. A. Latypova, et al., “Cleaning Sensor Data in Intelligent Heating Control System,” Vestn. Yuzhn. Ural. Gos. Univ. Ser. Vychisl. Mat. Inf. 10 (3), 16-36 (2021). doi{10.14529/cmse210302}.
- S. A. Ivanov, K. Yu. Nikolskaya, G. I. Radchenko, et al., “Digital Twin of a City: Concept Overview,” Vestn. Yuzhn. Ural. Gos. Univ. Ser. Vychisl. Mat. Inf. 9 (4), 5-23 (2020). doi{10.14529/cmse200401}.
- V. V. Epishev, A. P. Isaev, R. M. Miniakhmetov, et al., “Physiological Data Mining System for Elite Sports,” Vestn. Yuzhn. Ural. Gos. Univ. Ser. Vychisl. Mat. Inf. 2 (1), 44-54 (2013). doi{10.14529/cmse130105}.
- S. M. Abdullaev, O. U. Lenskaya, A. O. Gayazova, et al., “Short-Range Forecasting Algorithms Using Radar Data: Translation Estimate and Life-Cycle Composite Display,” Vestn. Yuzhn. Ural. Gos. Univ. Ser. Vychisl. Mat. Inf. 3 (1), 17-32 (2014). doi{10.14529/cmse140102}.
- M. M. Dyshaev and I. M. Sokolinskaya, “Representation of Trading Signals Based on Kaufman Adaptive Moving Average as a System of Linear Inequalities,” Vestn. Yuzhn. Ural. Gos. Univ. Ser. Vychisl. Mat. Inf. 2 (4), 103-108 (2013). doi{10.14529/cmse130408}.
- A. Mueen, E. J. Keogh, Q. Zhu, et al., “Exact Discovery of Time Series Motifs,” in Proc. 2009 SIAM Int. Conf. on Data Mining (SDM), Sparks, USA, April 30-May 2, 2009 , doi{10.1137/1.9781611972795.41}.
- L. Ye and E. J. Keogh, “Time Series Shapelets: a New Primitive for Data Mining,” in Proc. 15th ACM SIGKDD Int. Conf. on Knowledge Discovery and Data Mining, Paris, France, June 28-July 1, 2009 , doi{10.1145/1557019.1557122}.
- P. Indyk, N. Koudas, and S. Muthukrishnan, “Identifying Representative Trends in Massive Time Series Data Sets Using Sketches,” in Proc. 26th Int. Conf. on Very Large Data Bases (VLDB), Cairo, Egypt, September 10-14, 2000 ,
https://www.vldb.org/conf/2000/P363.pdf . Cited December 18, 2021.
- S. Gharghabi, S. Imani, A. Bagnall, et al., “An Ultra-fast Time Series Distance Measure to Allow Data Mining in More Complex Real-world Deployments,” Data Min. Knowl. Discov. 34, 1104-1135 (2020). doi{10.1007/s10618-020-00695-8}.
- M. L. Zymbler and Ya. A. Kraeva, “Discovery of Time Series Motifs on Intel Many-Core Systems,” Lobachevskii J. Math. 40 (12), 2124-2132 (2019). doi{10.1134/S199508021912014X}.
- M. L. Zymbler and Ya. A. Kraeva, “Parallel Algorithm for Time Series Motif Discovery on Graphic Processor,” Vestn. Yuzhn. Ural. Gos. Univ. Ser. Vychisl. Mat. Inf. 9 (3), 17-34 (2020). doi{10.14529/cmse200302}.
- E. Keogh and J. Lin, “Clustering of Time-Series Subsequences is Meaningless: Implications for Previous and Future Research,” Knowl. Inf. Syst. 8, 154-177 (2005). doi{10.1007/s10115-004-0172-7}.
- A. Reiss and D. Stricker, “Introducing a New Benchmarked Dataset for Activity Monitoring,” in Proc. 16th Int. Symposium on Wearable Computers (ISWC), Newcastle, United Kingdom, June 18-22, 2012 , doi{10.1109/ISWC.2012.13}.
- C.-C. M. Yeh, Y. Zhu, L. Ulanova, et al., “Matrix Profile I: All Pairs Similarity Joins for Time Series: A Unifying View That Includes Motifs, Discords and Shapelets,” in Proc. IEEE 16th Int. Conf. on Data Mining (ICDM), Barcelona, Spain, December 12-15, 2016 , doi{10.1109/ICDM.2016.0179}.
- D. Kirk, “NVIDIA CUDA Software and GPU Parallel Computing Architecture,” in Proc. 6th Int. Symposium on Memory Management (ISMM’07), Montreal, Canada, October 21-22, 2007 , doi{10.1145/1296907.1296909}.
- Z. Zimmerman, K. Kamgar, N. S. Senobari, et al., “Matrix Profile XIV: Scaling Time Series Motif Discovery with GPUs to Break a Quintillion Pairwise Comparisons a Day and Beyond,” in Proc. {ACM Symposium on Cloud Computing (SoCC’19), Santa Cruz, USA, November 20-23, 2019}, doi{10.1145/3357223.3362721}.