Е.И. Гончаров1, В.И. Мунерман2, И.Н. Синицын3
1,2 Смоленский государственный университет (г. Смоленск, Россия)
3 ФИЦ (Информатика и управление) РАН (Москва, Россия)
1 drbenvey1996@mail.ru, 2 vimoon@gmail.com, 3 sinitsin@dol.ru
Постановка проблемы. Современные системы высокой доступности должны обладать высокой скоростью реакции на запросы пользователей. К числу таких систем относятся системы, основанные на взаимодействии с базами данных. Способы организации баз данных для таких систем зависит от специфики решаемых ими задач. Для систем, используемых для анализа больших объемов данных и формирования отчетов в управлении производствами, маркетинге и финансовых технологиях, целесообразно использование массовой обработки данных. Особенность OLAP систем и их основной недостаток состоит в том, что им в существующих технологиях характерна предварительная подготовка агрегированной информации для последующего к ней обращения, которое реализуется только унарными и тривиальными операциями, такими как транспонирование, сечение и свертка. Следовательно, любое изменение данных, но основе которых строится куб, приводит к полной его перестройке как в плане изменения размерности отдельных индексов, так и в плане изменения размерности всего куба – числа его индексов.
Цель. Решить актуальную задачу разработки таких СУБД и машин баз данных, которые могли бы обеспечить включение в обработку результирующего гиперкуба с целью его корректировки.
Результаты. В качестве возможного решения этой задачи рассмотрены задачи, связанные с многомерным представлением и обработкой данных на основе алгебры многомерных матриц. Проведен ретроспективный анализ многомерных систем баз данных и систем массовой обработки данных на основе алгебры многомерных матриц. Предложен метод параллельной реализации умножения многомерных матриц и архитектура соответствующего ей программно-аппаратного комплекса.
Практическая значимость. Применение предложенного подхода позволяет использовать разработанные и активно эксплуатируемые СУБД и машины баз данных, подобные таким как, например, Terradata, а также программные средства, реализующие, частично, операции алгебры многомерных матриц. Эти операции могут быть реализованы при использовании стандартных программных средств типа TensorFlow и лечь в основу проектирования многомерно-матричной машины баз данных с предложенной архитектурой.
- Tincat Group / [Электронный ресурс] //: [сайт]. URL: http://www.tincat-group.com/mv/Nelson-GIRLS-1965.html (дата обращения: 19.10.2023).
- Lombardi L. Mathematical structure of nonarithmatic data processing procedures. Journal of ACM, 1962. V. 9. № 1. P. 136–159. Русский перевод: Ломбарди Л. Математическая структура процедур обработки нечисловой информации // Современное программирование: Сб. статей. М.: Радио и связь. 1967. С. 5–39.
- Глушков В.М., Гладун В.П., Лозинский Л.С., Погребинский С.Б. Обработка информационных массивов в автоматизированных системах управления / Под общ. ред. акад. В.М. Глушкова; АН УССР, Ин-т кибернетики. Киев: Наукова думка. 1970. 181 с.
- Codd E.F. A Relational Model of Data for Large Shared Data Banks. Communications of the ACM. 1970. V. 13. № 6. P. 377–387.
- Соколов Н.П. Введение в теорию многомерных матриц. Киев: Наукова думка. 1972. 176 с.
- Гендель Е. Г., Мунерман В. И. Применение алгебраических моделей для синтеза процессов обработки файлов. УСиМ. 1984. № 4. С. 69–72.
- Гендель Е. Г., Мунерман В. И., Шкляр Б.Ш. Оптимизация процессов обработки данных на базе алгебраических моделей. Управляющие системы и машины. Киев: Наукова думка. 1985. № 6. С. 91–95.
- Мунерман В.И. Массовая обработка данных. Алгебраические модели и методы: монография. М.: ИНФРА-М. 2023. 229 с. (Научная мысль). DOI 10.12737/1906037. Текст: электронный. – URL: https://znanium.com/catalog/product/1906037 (дата обращения: 10.03.2024). – Режим доступа: по подписке.
- Codd E. F., Codd S. B., Salley C. T. Providing OLAP (on-line analytical processing) to user-analysts. An IT Mandate. White Paper. Arbor Software Corporation. 1993. Т. 4.
- OLE DB for OLAP. URL: https://help.sap.com/doc/saphelp_nw74/7.4.16/en-us/03/cf903c47c95875e10000000a11405a/content. htm?no_cache=true (дата обращения: 06.11.2023).
- XML for Analysis Specification. URL: http://xml.coverpages.org/xmlaV11-20021120.pdf (дата обращения: 06.11.2023).
- Tsuji T., Hara A., Higuchi K. An extendible multidimensional array system for MOLAP. Proceedings of the 2006 ACM symposium on applied computing. 2006. P. 503–510.
- ClearScape Analytics™. URL: https://www.teradata.com/platform/clearscape-analytics (дата обращения: 02.04.2024).
- Гончаров Е.И. Реализация (λ, µ)-свернутого произведения многомерных матриц средствами операции tensordot из библиотек для тензорной алгебры. Современные информационные технологии и ИТ-образование, [S.l.]. 2022. V. 18. № 4. P. 781–789. ISSN 2411-1473. Доступно на: <http://sitito.cs.msu.ru/index.php/SITITO/article/view/893>. Дата доступа: 13 mar. 2024 doi: https://doi.org/10.25559/SITITO.18.202204.781-789.
- PostgreSql // Documentation URL: https://www.postgresql.org/docs/current/cube.html (дата обращения: 02.04.2024).
- Захаров В.Н., Мунерман В.И. Параллельная реализация обработки интенсивно используемых данных на основе алгебры многомерных матриц // Аналитика и управление данными в областях с интенсивным использованием данных: XVII Международная конференция DAMDID/RCDL. 2015. С. 217–223.
- Yandex Cloud Создать кластер GPU// URL: https://yandex.cloud/ru/docs/compute/operations/gpu-cluster/gpu-cluster-create?utm_referrer=https%3A%2F%2Fwww.google.com%2F(дата обращения: 02.04.2024).
- Google ИИ-кластеры на базе TPU v4 и оптических коммутаторов. URL: https://servernews.ru/1084691(дата обращения: 02.04.2024).
- Run Cloud TPU applications on GKE. URL: https://cloud.google.com/tpu/docs/kubernetes-engine-setup(дата обращения: 02.04.2024).