CARBOHYDRATE STRUCTURE DATABASE И ДРУГИЕ УГЛЕВОДНЫЕ БАЗЫ ДАННЫХ КАК ВАЖНЕЙШИЙ ЭЛЕМЕНТ ГЛИКОИНФОРМАТИКИ

Ф.В. Тоукач, А.И. Ширковская

Институт органической химии им. Н.Д. Зелинского РАН, Москва, Россия

KEYWORDS: CSDB, углеводы, базы данных, гликоинформатика

Биоорганическая химия, 2022, т.3 (тематический), стр. 0-0 [in Russian]


Углеводы – один из наиболее химически разнообразных классов биомакромолекул. Объем накопленной информации о них многократно превышает уровень, позволяющий ориентироваться в этом океане данных без специальных средств – баз данных (БД) гликомики и прогностических сервисов, использующих данные из этих баз. Существующие БД не полностью совместимы друг с другом как по покрытию, так и по форматам данных и возможностям, предоставляемым пользователям, и направлены на решение отдельных задач. Главные проблемы нынешних БД – наличие ошибок, пробелы в полноте покрытия и отсутствие общепризнанного углеводного языка. Наиболее востребованы углеводные БД с широким покрытием для обеспечения единого информационного пространства данных по структуре, свойствам и функциям углеводов, связанных с таксономией и свойствами их природных источников.

В рамках проекта Carbohydrate Structure Database (CSDB) была создана архитектура БД, направленная на создание расширяемого проекта гликоинформатики с непрерывной поддержкой и регулярным обновлением данных. Она была реализована в программном продукте, лишенном основных недостатков других БД гликомики. За 15 лет своего существования CSDB стала основным источником данных по углеводам микроорганизмов и платформой для множества сервисов углеводной тематики. Проект нацелен на создание современной и всеобъемлющей базы природных углеводов со свободным доступом, ежегодным обновлением и дополнением содержимого, поиском и устранением ошибок (в том числе в публикациях), появлением новых сервисов.



ScienceНаука: CSDB ScienceДом : Наука