Расширяемая система мониторинга вычислительного кластера
Ключевые слова:
управление вычислительными кластерами
системы мониторинга
системы виртуализации
Аннотация
Рассматривается архитектура системы мониторинга вычислительных ресурсов. Предложены концепции расширения функциональности существующих систем с использованием триггеров событий и механизмов уведомлений. Разработанная система мониторинга реализована на языке программирования java. Затронуты вопросы еe применения в задачах управления вычислительным кластером, в том числе совместно с системой виртуализации XEN. Представлены результаты проведенных экспериментов с созданной системой мониторинга.
Раздел
Раздел 2. Программирование
Библиографические ссылки
- Barth W. Nagios system and network monitoring. San Francisco: No Starch Press, 2006.
- Massie M.L., Chun B.N., Culler D.E. The Ganglia distributed monitoring system: design, implementation, and experience. Berkeley: Berkeley Univ. Press, 2003.
- Mukherjee B., Heberlein T.L., Levitt K.N. Network intrusion detection // IEEE Network. 1994. N 8. 26-41.
- Spafford E.H., Zamboni D. Data collection mechanisms for intrusion detection systems. CERIAS Tech. Rep. West Lafayette: Purdue Univ. Press, 2000.
- Писарев А.В., Пересветов В.В. Нейросетевые компоненты мониторинга вычислительного кластера // Тр. конференции «Информационные и коммуникационные технологии в образовании и научной деятельности». Хабаровск: Изд-во Тихоокеанского гос. ун-та, 2008. 319-323.
- Benveniste A., Fabre E., Jard C., Haar S. Diagnosis of asynchronous discrete event systems, a net unfolding approach. IRISA Tech. Rep. RR-4181. Rennes, 2001.
- Yingquan W., Christoforos N.H. Distributed non-concurrent fault identification in discrete event systems // Proc. of Multiconference on Computational Engineering in Systems Applications. Lille, 2003.
- Birman K.P., Joseph T.A. Exploiting virtual synchrony in distributed systems // Proc. of the 11th ACM Symposium on Operating Systems Principles. Austin, 1987. 123-138.
- Aguilera M., Strom R., Sturman D., Astley M., Chandra T. Matching events in a content-based subscription system // Proc. of the 18th ACM Symposium on Principles of Distributed Computing. Atlanta, 1999. 53-61.
- Snoeren A., Conley K., Gifforfd D. Mesh-based content routing using XML // Proc. of the 18th ACM Symposium on Operating Systems Principles. Banff, 2001. 160-173.
- Bonnet P., Gehrke J., Seshadri P. Towards sensor database systems // Proc. of the 2nd International Conference on Mobile Data Management. Hong Kong, 2001.
- http://sourceforge.net/projects/grate
- Tарасов А.Г. Трeхуровневая система мониторинга расширенной функциональности // Тр. международной конференции «Параллельные вычислительные технологии». Челябинск: Изд-во ЮУрГУ, 2008. 464-469.
- Scottie M., Minnich R. Supermon: a high-speed cluster monitoring system // Proc. of IEEE Cluster Computing. Chicago, 2002. 39-46.
- Тарасов А.Г. Мониторинг вычислительного кластера с использованием java-технологий // XXX Дальневосточная математическая школа-семинар имени акад. Е. В. Золотова. Хабаровск: Изд-во ДВГУПС, ИПМ ДВО РАН, 2005. 201.
- Пересветов В.В., Сапронов А.Ю., Тарасов А.Г. Вычислительный кластер бездисковых рабочих станций. Препринт № 83 ВЦ ДВО РАН. Хабаровск, 2005.
- Пересветов В.В., Сапронов А.Ю., Тарасов А.Г., Шаповалов Т.С. Удалeнный доступ к вычислительному кластеру ВЦ ДВО РАН // Вычислительные технологии. 11. Новосибирск: Изд-во ИВТ СО РАН, 2006. 45-51.
- Пересветов В.В., Сапронов А.Ю., Тарасов А.Г., Шаповалов Т.С. Организация работы вычислительного кластера в режиме удалeнного доступа. Препринт № 110 ВЦ ДВО РАН. Хабаровск, 2007.