Исследование эффективности различных методов сжатия при передаче данных из основной памяти в память сопроцессора Intel Xeon Phi
Авторы
-
П.С. Костенецкий
-
К.Ю. Беседин
Ключевые слова:
СУБД
сжатие данных
Intel Xeon Phi
LZSS compression
RLE compression
Null Suppression
Аннотация
Одной из важнейших особенностей работы с многоядерными сопроцессорами и графическими ускорителями является необходимость передачи данных по шине PCI Express (Peripheral Component Interconnect), которая для ряда задач становится узким местом. В настоящей статье исследуется применение сжатия для ускорения обмена данными с сопроцессором Intel Xeon Phi при параллельной обработке баз данных. Рассматриваются три алгоритма сжатия: LZSS (Lempel-Ziv-Storer-Szymanski), Null Suppression и RLE (Run-Length Encoding). Приводится описание реализаций выбранных методов для Intel Xeon Phi. Проведен ряд вычислительных экспериментов, в которых показано, что выбранные методы сжатия могут быть использованы для повышения эффективности обработки баз данных на многоядерном сопроцессоре при выполнении определенных условий относительно обрабатываемых данных. Показано, что в случаях, когда метод сжатия позволяет осуществлять обработку сжатых данных без предварительной распаковки, такая обработка позволяет дополнительно увеличить эффективность применения сжатия. Статья рекомендована к публикации Программным комитетом Международной суперкомпьютерной конференции «Научный сервис в сети Интернет: многообразие суперкомпьютерных миров» (http://agora.guru.ru/abrau2014)
Раздел
Раздел 1. Вычислительные методы и приложения
Библиографические ссылки
- Беседин К.Ю., Костенецкий П.С. Моделирование обработки запросов на гибридных вычислительных системах с многоядерными сопроцессорами и графическими ускорителями // Программные системы: теория и приложения. 2014. 5, № 1. 91-110.
- Беседин К.Ю., Костенецкий П.С. Применение многоядерных сопроцессоров в параллельных системах баз данных // Тр. Международной научной конференции «Параллельные вычислительные технологии» (ПаВТ’2013). 1-5 апреля 2013 г., Челябинск. Челябинск: Издательский центр ЮУрГУ, 2013. 583.
- Костенецкий П.С., Соколинский Л.Б. Моделирование иерархических многопроцессорных систем баз данных // Программирование. 2013. 39, № 1. 13-22.
- Костенецкий П.С. Обработка запросов на кластерных вычислительных системах с многоядерными ускорителями // Вестн. Южно-Уральского гос. ун-та. Серия: Вычислительная математика и информатика. 2012. № 2. 59-67.
- Костенецкий П.С., Лепихов А.В., Соколинский Л.Б. Технологии параллельных систем баз данных для иерархических многопроцессорных сред // Автоматика и телемеханика. 2007. № 5. 112-125.
- Abadi D.J., Madden S.R., Ferreira M.C. Integrating compression and execution in column-oriented database systems // Proc. ACM SIGMOD Int. Conf. on Management of Data. Chicago, USA. June 26-29, 2006. New York: ACM Press, 2006. 671-682.
- Abadi D.J., Madden S.R., Hachem N. Column-stores vs. row-stores: how different are they really? // Proc. ACM SIGMOD Int. Conf. on Management of Data. Vancouver, Canada. June 10-12, 2008. New York: ACM Press, 2008. 967-980.
- Binnig C., Hildenbrand S., Färber F. Dictionary-based order-preserving string compression for main memory column stores // Proc. ACM SIGMOD Int. Conf. on Management of Data Providence. Rhode Island, USA. June 29-July 2, 2009. New York: ACM Press, 2009. 283-296.
- Fang W., He B., Luo Q. Database compression on graphics processors // Proc. 36th Int. Conf. on Very Large Data Bases. Singapore. September 13-17, 2010. Singapore: VLDB Endowment, 2010. 670-680.
- Graefe G., Shapiro L.D. Data compression and database performance // Proc. ACM/IEEE-CS Symp. on Applied Computing. Kansas City, USA. April 3-5, 1991. New York: IEEE Press, 1991. 22-27.
- Iyer B.R., Wilhite D. Data compression support in databases // Proc. 20th Int. Conf. on Very Large Data Bases. Santiago de Chile, Chile. September 12-15, 1994. San Francisco: Morgan Kaufmann Publ., 1994. 695-704.
- Jeffers J., Reinders J. Intel Xeon Phi coprocessor high-performance programming. Waltham: Morgan Kaufmann Publ., 2013.
- Kirk D.B., Hwu W.W. Programming massively parallel processors: a hands-on approach. Waltham: Morgan Kaufmann Publ., 2013.
- Kostenetskiy P.S., Sokolinsky L.B. Analysis of hierarchical multiprocessor database systems // Proc. 2007 Int. Conf. on High Performance Computing, Networking and Communication Systems (HPCNCS-07). Orlando, USA. July 9-12, 2007. Tallahassee: ISRST, 2007. 245-251.
- Ng W.K., Ravishankar C.V. Block-oriented compression techniques for large statistical databases // IEEE Trans. on Knowledge and Data Engineering. 1997. 9, N 2. 314-328.
- Ozsoy A., Swany M. CULZSS: LZSS lossless data compression on CUDA // Proc. 2011 IEEE Int. Conf. on Cluster Computing. Washington, D.C., USA. September 26-30, 2011. New York: IEEE Press, 2011. 403-416.
- Roth M.A., van Horn S.J. Database compression // ACM SIGMOD Record. 1993. 22, N 3. 31-39.
- Storer J.A., Szymanski T.G. Data compression via textual substitution // Journal of the ACM. 1982. 29, N 4. 928-951.
- Wu L., Storus M., Cross D. Cs315a: final project CUDA WUDA SHUDA: CUDA compression project. Stanford: Stanford Univ., 2009.