И.М. Зацман1
1 Федеральный исследовательский центр «Информатика и управление» РАН (Москва, Россия)
1 izatsman@yandex.ru
Постановка проблемы. Рассматриваются вопросы детализации понятий, определенных ГОСТом Р 59853-2021 «АС. Термины и определения», обусловленной проектированием в ФИЦ ИУ РАН лексикографической информационной системы. Система включает: двуязычный электронный словарь (в виде словарной базы данных), корпус параллельных текстов и базу лингвистических знаний. Основное ее отличие от отечественных и зарубежных аналогов состоит в том, что по отдельным категориям языковых единиц словарь и корпус связаны не только по словам, но и по их значениям, описания которых могут изменяться во времени. При планировании проекта создания этой системы потребовалось вводить в понятия ГОСТа признаки, указывающие те объекты системы и их трансформации, которые необходимы разработчикам. Например, термин «Обработка информации в АС» включает изменение содержания информации (в системе – это изменение описания языковой единицы). При планировании понадобилось ввести признак степени социализации изменений содержания, который детализирует этот термин, выделяя индивидуальное и коллективное знание экспертов и его эволюцию. Однако только детализация понятий с помощью признаков не дает необходимый перечень основных объектов системы, то есть терминосистема этого ГОСТа не является полной.
Цель. Анализ ГОСТа Р 59853-2021 «АС. Термины и определения» с позиции разработчиков лексикографической информационной системы и поиск причины неполноты стандарта на термины создания и развития АС.
Результаты. Проведенное определение признаков, специфицирующих объекты этой системы и их трансформации, позволяет предположить, что неполнота терминосистемы обусловлена использованием технической парадигмы информатики. В терминосистему предлагается добавить понятие «знание», специфицировать трансформации между данными, информацией и знанием, детализируя их и преобразуя иерархию, разработанную Акоффом.
Практическая значимость. Включение этого термина понадобилось при проектировании лексикографической информационной системы. Его использование дало возможность и специфицировать объекты этой системы, и разделить в ней понятие ГОСТа «обработка данных» на 10 видов.
Зацман И.М. Стандарт на термины создания и развития АС: детализация понятий объектов системы и процессов их обработки // Системы высокой доступности. 2024. Т. 20. № 4. С. 35−43. DOI: https://doi.org/ 10.18127/j20729472-202404-04
- Постановление Президиума РАН от 09.04.2024 г. № 63 «Фундаментальные проблемы лингвистики и задачи корпусных исследований языков». https://new.ras.ru/upload/iblock/51b/t0ydiqrywi856zei2mot6rsz9nhe6gvm.pdf
- Geyken A., Wiegand F., Würzner K.-M. On-the-fly Generation of Dictionary Articles for the DWDS Website // Proceedings of eLex 2017 conference. Brno: Lexical Computing CZ s. r. o. 2017. P. 560–570.
- Digitales Wörterbuch der deutschen Sprache. https://www.dwds.de
- Klein W., Geyken A. Das Digitale Wörterbuch der Deutschen Sprache (DWDS) // Lexicographica. 2010. V. 26. № 2010. P. 79–96. doi: 10.1515/9783110223231.1.79.
- Didakowski J., Lemnitzer L., Geyken A. Automatic example sentence extraction for a contemporary German dictionary // Proceedings of the 15th EURALEX International Congress. Oslo, Norway: University of Oslo. 2012. P. 343–349.
- Lemnitzer L., Pölitz C., Didakowski J., Geyken A. Combining a rule-based approach and machine learning in a good-example extraction task for the purpose of lexicographic work on contemporary standard German // Proceedings of eLex 2015 conference. Ljubljana: Institute for Applied Slovene Studies / Lexical Computing Ltd. 2015. P. 21–31.
- Гончаров А.А., Зацман И.М., Кружков М.Г. Темпоральные данные в лексикографических базах знаний // Информатика и её применения. 2019. Т. 13. Вып. 4. С. 90–96.
- Гончаров А.А., Зацман И.М., Кружков М.Г. Эволюция классификаций в надкорпусных базах данных // Информатика и её применения. 2020. Т. 14. Вып. 4. С. 108–116.
- Гончаров А.А., Зацман И.М., Кружков М.Г. Представление новых лексикографических знаний в динамических классификационных системах // Информатика и её применения. 2021. Т. 15. Вып. 1. С. 86–93.
- Гончаров А.А., Зацман И.М., Кружков М.Г., Лощилова Е.Ю. Отражение эволюции лексикографических знаний в динамических классификационных системах // Информатика и её применения. 2021. Т. 15. Вып. 4. С. 41–49.
- Zatsman I. Finding and filling lacunas in linguistic typologies // 15th Forum (International) on Knowledge Asset Dynamics Proceedings. Matera, Italy: Institute of Knowledge Asset Management. 2020. P. 780–793.
- Zatsman I. Three-dimensional encoding of emerging meanings in AI-systems // 21st European Conference on Knowledge Management Proceedings. Reading, UK: Academic Publishing International Ltd. 2020. P. 878–887.
- Ackoff R. From data to wisdom // J. Appl. Systems Analysis. 1989. V. 16. P. 3–9.
- Rowley J. The wisdom hierarchy: Representations of the DIKW hierarchy // J. Inf. Sci. 2007. V. 33. № 2. P. 163–180. doi: 10.1177/ 0165551506070706.
- Зацман И.М. Трансформации объектов первого и второго порядка в лексикографической информационной системе // Информатика и её применения. 2024. Т. 18. Вып. 2. С. 82–91.
- Zatsman I. Building digital spiral models of knowledge generation // 19th Forum (International) on Knowledge Asset Dynamics Proceedings. Matera, Italy: Arts for Business Institute. 2024. P. 2185–2196
- Зацман И.М. Трансформация иерархии Акоффа в научной парадигме информатики // Информатика и её применения. 2023. Т. 17. Вып. 3. С. 107–113.
- Zatsman I. Digital spiral model of knowledge creation and encoding its dynamics // 18th Forum (International) on Knowledge Asset Dynamics Proceedings. Matera, Italy: Arts for Business Institute. 2023. P. 581–596.
- Добровольский Д.О., Зацман И.М. Модель извлечения знания из параллельных текстов лексикографической информационной системы // Информатика и её применения. 2024. Т. 18. Вып. 3. С. 97–105.
- Nonaka I. The knowledge-creating company // Harvard Business Review. 1991. V. 69. № 6. P. 96–104.
- Нонака И., Такеучи Х. Компания – создатель знания / Пер. c англ. М.: Олимп-бизнес. 2003. 384 с. (Nonaka I., Takeuchi H. The knowledge-creating company. Oxford, NY, USA: Oxford University Press. 1995. 284 p.).
- Зацман И.М. Интерфейсы третьего порядка в информатике // Информатика и её применения. 2019. Т. 13. Вып. 3. С. 82–89.
- Симонович С.В. Информатика. Базовый курс. СПб.: Питер. 2011. 640 с.
- Berman F., Rutenbar R., Hailpern B., Christensen H., Davidson S., Estrin D., Franklin M., Martonosi M., Raghavan P., Stodden V., Szalay A.S. Realizing the potential of data science // Communications of the ACM. 2018. V. 61. Iss. 4. P. 67–72.
- Stodden V. The data science life cycle: a disciplined approach to advancing data science as a science // Communications of the ACM. 2020. V. 63. Iss. 7. P. 58–66.