Н.А. Скворцов1
1 ФИЦ ИУ РАН (Москва, Россия)
1 nskv@mail.ru
Постановка проблемы. Неоднородность научных данных делает семантически обоснованное повторное использование особенно актуальным. Исследовательским инфраструктурам необходимы формальные механизмы управления данными, знаниями предметных областей и их повторным использованием на всём жизненном цикле решения задач.
Цель. Разработать сценарии управления источниками данных и результатами исследований в инфраструктурах, основанных на семантических спецификациях, а также обеспечить интероперабельность и повторное использование данных при исследованиях и накопление ресурсов, готовых к многократному применению. Работа направлена на формализацию обнаружения, интеграции и повторного использования данных и сервисов на основе знаний предметных областей.
Результаты. Предложен подход к управлению источниками данных и результатами исследований на основе формальных онтологий и концепции цифровых объектов. Представлены три сценария: семантическое обнаружение и повторное использование зарегистрированных источников, регистрация и интеграция внешних данных и сервисов и повторное использование результатов исследований. Показано, что семантическое аннотирование, логический вывод и регистрация ресурсов в форме цифровых объектов обеспечивают интероперабельность, накопление и корректное повторное использование ресурсов.
Практическая значимость. Сценарии ориентированы на развитие исследовательских инфраструктур с учётом потребностей конкретных предметных областей. Результаты исследований семантически связываются с их предметным контекстом и становятся готовыми к повторному использованию. Это снижает дублирование работы, повышает надёжность исследований и способствует формированию расширяемого графа знаний, обеспечивающего преемственность исследований.
Скворцов Н.А. Сценарии семантической спецификации и повторного использования источников данных в исследовательских инфраструктурах // Системы высокой доступности. 2026. Т. 22. № 1. С. 56−60. DOI: https://doi.org/10.18127/
j20729472-202601-11
- De Smedt K., Koureas D., Wittenburg P. FAIR digital objects for science: From data pieces to actionable knowledge units. Publications. 2020. V. 8. № 2. Article number 21. 17 p. https://doi.org/10.3390/publications8020021
- Wilkinson M. et al. The FAIR Guiding Principles for scientific data management and stewardship. Scientific Data. 2016. V. 3. Article number 160018. https://doi.org/10.1038/sdata.2016.18
- Earth Science Information Partners (ESIP). https://www.esipfed.org/
- OpenAIRE Explore. https://explore.openaire.eu
- EOSC EU Node. https://open-science-cloud.ec.europa.eu/
- Baade F. et al. Introduction to description logic. Cambridge: Cambridge University Press. 2017.
- Skvortsov N., Stupnikov S. Managing data-intensive research problem-solving lifecycle. DAMDID/RCDL 2020. Springer, 2021.
P. 3–18. https://doi.org/10.1007/978-3-030-81200-3_1 - Chaudhri V.K. et al. Knowledge graphs: Introduction, history, and perspectives. AI Magazine. 2022. V. 43. № 1. P. 17–29. https://doi.org/10.1002/aaai.12033
- Skvortsov N.A., Stupnikov S.A. A semantic approach to workflow management and reuse for research problem solving. Data Intelligence. 2022. V. 4. № 2. P. 439–454. https://doi.org/10.1162/dint_a_00142
- PROV-Overview: An overview of the PROV family of documents. W3C Working Group Note. 2013. http://www.w3.org/TR/prov-overview/
- Mason B. et al. The Washington Double Star Catalog. The Astronomical Journal. 2001. V. 122. № 6. https://doi.org/10.1086/323920

