350 rub
Journal Neurocomputers №3 for 2010 г.
Article in number:
Application of neural networks to quantitative structure-activity relationship problem with the use of fuzzy description of three-dimensional molecular structure
Authors:
D. A. Devetyarov, M. I. Kumskov
Abstract:
Artificial neural networks (ANN) are widely used in quantitative structure-activity relationship (QSAR) problem to search for new chemical compounds with preset properties. The paper suggests the methodology of ANN application to fuzzy description of molecular structure in QSAR problem. The interpretation rules of "structure-property" model as artificial neural networks are described. The use of fuzzy description allows us to carry out the automatic search for the optimal description of the molecular structure and to efficiently process molecules with flexible structure. We suggest separating the stage of training ANNs from the stage of their application in order to lower the computational costs. As a result, we suggest constructing the prediction model by the use of other machine learning methods and then interpreting the result (the prediction model) as an ANN. For example, in this paper we construct models using the Group Method of Data Handling (GMDH) applied to preliminarily identified clusters of objects. The paper describes the algorithm of interpretation of the machine learning methods as ANNs. Classification of a new molecule to one of the clusters or outliers can be implemented by the use of perceptrons - radial basis functions. Linear models constructed by GMDH and voting of linear models are suggested to implement using multilayer perceptrons. The approach above was applied to prediction of toxicity of chemical compounds. The computational experiments were carried out for both fuzzy and non-fuzzy descriptors as well as with different sets of parameter values used when constructing the descriptors. The results demonstrated that constructed ANN prediction models allow us to achieve prediction accuracy of 87.9% on leave-one-out cross validation.
Pages: 14-19
References
  1. Стьюпер Э., Брюггер У., Джурс П. Машинный анализ связи химической структуры и биологической активности: Пер. с англ. М.: Мир. 1982.
  2. Кадыров Ч. Ш., Тюрина Л. А., Симонов В. Д., Семенов В. А. Машинный поиск химических препаратов с заданными свойствами. Ташкент: Фан. 1989.
  3. Баскин И. И., Палюлин В. А., Зефиров Н. С.Применение искусственных нейронных сетей для прогнозирования свойств химических соединений // Нейрокомпьютеры: разработка и применение. 2005. № 1-2. С. 98-101.
  4. Baskin, I. I., Palyulin, V. A., and Zefirov, N. S., Neural Networks in Building QSAR Models // In: Artificial Neural Networks: Methods and Protocols. Livingstone D. S., Ed. Humana Press, Springer Science + Business Media. 2008. P. 139-160.
  5. Баскин И. И. Моделирование свойств химических соединений с использованием искусственных нейронных сетей и фрагментных дескрипторов // Автореф. дисс. ... докт. физ.-мат. наук, М. 2010.
  6. Джурс О. П., Айзенауэр Т. Распознавание образов в химии: Пер.с англ. М.: Мир. 1977.
  7. Голендер В. Е., Розенблит А. Б. Логико-комбинаторные методы конструирования лекарств. Рига: Зинатне. 1983.
  8. Devetyarov D. A., Zaharov A. M., Kumskov M. I., and Ponomareva, L. A., Fuzzy logic application for construction of 3D descriptors of molecules in QSAR problem // Pattern Recognition and Image Analysis: New Inform. Tech.(PRIA-8-2007). Yoshkar-Ola. 2007. V. 2. P. 249-252.
  9. Прикладные нечеткие системы / под ред. Т. Тэрано, К. Асаи, М. Сугэно. М. Мир. 1993.
  10. Кумсков М. И. Методология прогнозирования свойств химических соединений и ее программная реализация // Автореф. дисс. - докт. физ.-мат. наук. М. 1997.
  11. Karelson, M., Molecular Descriptors in QSAR/QSPR. Wiley-Interscience. 2000.
  12. Svitanko, I. V., Kumskov, M. I., Zyryanov, I. L., and Suslov, I. A., A method for describing the molecular electrostatic potential in determining structure-activity relationship / Mendeleev Comm. 1994. No. 5. P. 161-162.
  13. Svitanko, I. V., Devetyarov, D. A., Tcheboukov, D. E., Dolmat, M. S., Zakharov, A. M., Grigoryeva, S. S., Chichua, V. T., Ponomareva, L. A.,and Kumskov, M. I., QSAR modeling on the basis of 3D descriptors representing the electrostatic molecular surface (ambergris fragrances) // Mendeleev Comm. 2007. V. 17. No. 2. P. 90-91.
  14. Айвазян С. А., Бухштабер В. М., Енюков И. С., Мешалкин Л. Д. Прикладная статистика. Т. 3: Классификация и снижение размерности / под ред. С. А. Айвазяна. - М.: Финансы и статистика. 1989.
  15. ГОСТ Р ИСО/МЭК 12207-99. Информационная технология. Процессы жизненного цикла программных средств / М.: ИПК Издательство стандартов. 2000.
  16. Кумсков М. И., Митюшев Д. Ф. Применение метода группового учета аргументов для построения коллективных оценок свойств органических соединений на основе индуктивного перебора их «структурных спектров» // Проблемы управления и информатики. 1996. № 4. С. 127-149.
  17. Kumskov, M. I. and Mityushev, D. F., Group Method of Data Handling (GMDH) as Applied to Collective Property Estimation of Organic Compounds by an Inductive Search of Their Structural Spectra // Pattern Recognition and Image Analysis. 1996. V. 6. No. 3. P. 497-509.
  18. Кохов В. А. Метод количественного определения сходства графов на основе структурных спектров // Изв. РАН, Техн. Кибернетика. 1994. No. 5. С. 143-159.
  19. Дидэ Э., Боши С., Бросье Ж. и др. Методы анализа данных. Подход, основанный на методе динамических сгущений / Пер. с франц. М.: Финансы и статистика. 1985.
  20. Рязанов В. В. Оптимальные коллективные решения в задачах распознавания и классификации // Автореф. дисс. ... докт. физ.-мат. наук. М.: ВЦРАН. 1994.
  21. Haykin, S., Neural Networks: a Comprehensive Foundation - Macmillan. NY. 1994.