350 руб
Журнал «Информационно-измерительные и управляющие системы» №1 за 2025 г.
Статья в номере:
Исследование «парадокса нормализации» в фактографических реляционных базах данных на платформе PostgreSQL
Тип статьи: научная статья
DOI: https://doi.org/10.18127/j20700814-202501-05
УДК: 004.652.42
Авторы:

М.М. Матюшин1, М.Ю. Конышев2, О.В. Рудакова3, О.В. Тараканов4

1–3 АО «ЦНИИмаш» (Московская обл., г. Королев, Россия)
4 ФГУП «НТЦ «Орион» (Москва, Россия)
1 mccm@mcc.rsa.ru, 2 misha-kon@mail.ru, 3 rudakovaov@mcc.rsa.ru, 4 ole_g66@list.ru

Аннотация:

Постановка проблемы. Алгоритм нормализации отношения реляционной базы данных предполагает последовательное проецирование исходной таблицы для выполнения частных требований каждой нормальной формы. Процедура выборки данных из совокупности таблиц основана на их каскадном соединении (JOIN), которое, в зависимости от реализации (производителя и версии системы управления базами данных – СУБД), создает необходимость выполнения рекурсивных вычислений. Это означает увеличение задержек в базе данных при выполнении многотабличных запросов. Трактовка сущности «парадокса нормализации» заключается в том, что необходимость обеспечения целостности данных путем нормализации отношений приводит к снижению быстродействия базы данных.

Цель. Проверка гипотезы о том, что время выполнения запроса с соединением таблиц в фактографической реляционной базе данных коррелировано с потребной глубиной рекурсии алгоритма, обусловленной числом таблиц, привлеченных для выполнения запроса.

Результаты. Исследован «парадокс нормализации» в фактографической реляционной базе данных под управлением СУБД PostgreSQL. Установлена сила взаимосвязи между степенью нормализованности таблиц базы данных и временем выдачи по запросу с подзапросами, зависящими от глубины рекурсии. Отдельно изучена зависимость времени выдачи от глубины рекурсии и от объема фактографической базы данных. По результатам корреляционного анализа сформулированы выводы, что в базах данных на платформе СУБД PostgreSQL v.12 зависимость между временем выполнения запроса и глубиной требуемой рекурсии для формирования выдачи слабая, а взаимосвязь между временем формирования выдачи и объемом базы данных, определяемым числом учтенных экземпляров объектов учета, ниже средней. Сформулирован вывод о несостоятельности «парадокса нормализации» в формализованных реляционных базах данных под управлением СУБД PostgreSQL v.12, следовательно, необоснованности денормализации баз данных, как способа повышения её быстродействия.

Практическая значимость. Сформулированы научно обоснованные основания обязательности приведения отношений фактографической реляционной базы данных к высшим нормальным формам, не зависимо от сферы и способа её применения. Транспонирование результатов, полученных для платформы PostgreSQL v.12 на базы данных под управлением других популярных СУБД не производилось.

Страницы: 41-51
Для цитирования

Матюшин М.М., Конышев М.Ю., Рудакова О.В., Тараканов О.В. Исследование «парадокса нормализации» в фактографических реляционных базах данных на платформе PostgreSQL // Информационно-измерительные и управляющие системы. 2025. Т. 23. № 1. С. 41−51. DOI: https://doi.org/10.18127/j20700814-202501-05

Список источников
  1. Карпук А.А., Краснопрошин В.В., Циклы в структурах функциональных зависимостей. International Journal of Open Information Technologies. М.: Лаборатория открытых информационных технологий факультета ВМК МГУ им. М.В. Ломоносова. 2017. Т. 5. № 7. С. 38–44.
  2. Мартынов В.В., Прошин Е.Н., Подход к анализу характеристик производительности баз данных // Вестник УГАТУ. Управление ВТ и И. Уфа: УГАТУ. 2009. Т. 13. № 2 (35). С. 198–205.
  3. Мендкович Н.А., Кузнецов С.Д., Оценка эффективности минимизации ограничений запросов к СУБД / Труды Института системного программирования РАН. М.: Институт системного программирования РАН. 2013. Т. 25. С. 113–130.
  4. Брешенков А.В., Белоус В.В., Преобразование заполненных реляционных таблиц ко второй нормальной форме. Наука и образование. Инженерное образование. Электронный журнал. 2007. № 2. Электронный ресурс elibrary.ru/download/elibrary_ 9530726_43884255.pdf
  5. Панченко Б.Е., Исследования доменно-ключевой схемы реляционной базы данных. Кибернетика и системный анализ. Киев: Институт кибернетики им. В.М. Глушкова НАН Украины. 2012. № 6. С. 157–172.
  6. Poolet M. 2002. Database Harmony. Электронный ресурс SQL Server PRO sqlmag.com/business-intelligence/database-harmony (In English, unpubl.).
  7. Григорьев Ю.А., Гасов В.М., Оценка среднего времени выполнения соединения таблиц методами NLJ и HJ в параллельной системе баз данных. Наука и образование (электронное научно-техническое издание). 2012. № 4 апрель. Электронный ресурс http://technomag.edu.ru/doc/380603.html
  8. Тараканов О.В., Пикалова Н.Б., Тараканова В.О., Исследование «парадокса нормализации» в фактографических реляционных базах данных на платформе ORACLE // Научно-тех. вестник информационных технологий, механики и оптики. 2018. Т. 18. № 4. С. 639–645. doi: 10.17586/2226-1494-2018-18-4-639-645.
  9. Блохин В.Г. и др. Современный эксперимент: подготовка, проведение, анализ результатов. М.: Радио и связь. 1997. 232 с.
  10. Pin-Shan Chen P. 1976. The Entity-Relationship Model – Toward a Unified View of Data. ACM Transactions on Database Systems. V. 1. № 1. March. 9–36.
  11. Гмурман В.Е. Теория вероятностей и математическая статистика. М.: Высшая школа. 1972. 367 с.
  12. Pavlo A., Paulson E., Rasin A., Abadi D.J., DeWitt D.J., Madden S., Stonebraker M. A Comparison of Approaches to Large-Scale Data Analysis. SIGMOD '09: Proceedings of the 35th SIGMOD International Conference on Management of Data. 2009. New York, NY, USA. Р. 165–178.
  13. Григорьев Ю.А., Плутенко А.Д., Анализ процесса выполнения запроса на соединение таблиц в строчной параллельной СУБД // Информатика и системы управления. Благовещенск: Амурский государственный университет. 2013. № 4 (38). С. 3–15.
  14. Григорьев Ю.А., Устимов А.И. Сравнение времени выполнения запроса к хранилищу данных в среде MapReduce/Hadoop и СУБД MySQL // Информатика и системы управления. Благовещенск: Амурский государственный университет. 2016. № 3 (49). С. 3–12.
  15. Leis V. et all. How good are query optimizers, really? Proceedings of the VLDB Endowment. 2015. V. 9. № 3. Р. 204–215.
  16. Дудаков Н.С., Морозов П.А., Путято С.А., Якубовский С.В., Модель системы управления хранением данных о воздушной обстановке при решении высокодинамичных задач автоматизации управления силами авиации и ПВО // Информационно-измерительные и управляющие системы. 2022. № 3. С. 4–8.
  17. Слепцова К.А., Комков А.Е., Кузовлев В.И., Представление и обработка информационных ресурсов для управления деятельностью предприятия // Современные наукоемкие технологии. Пенза: Издательский дом «Академия Естествознания». 2016. № 4-1. С. 57–61.
  18. Рогов Е.В. PostgreSQL изнутри. М.: ДМК Пресс. 2022. 660 с.
  19. Саенко И.Б., Куваев В.О. Модели и методика оценки и обеспечения оперативной доступности ресурсов в едином информационном пространстве. Математические методы в технике и технологиях – MMIT. Саратов: Саратовский государственный технический университет им. Ю.А. Гагарина. 2016. № 6 (88). С. 139–141.
  20. Кисляков М.Ю., Логачев Н.С., Петушков А.М. Системно-технические аспекты развития НАКУ КА НСЭН и измерений до 2025 года // Ракетно-космическое приборостроение и информационные системы. 2016. Т. 3. № 1. С. 62–71.
Дата поступления: 19.09.2024
Одобрена после рецензирования: 01.10.2024
Принята к публикации: 14.01.2025