ИДЕТИФИКАЦИЯ ТРЕХМЕРНОЙ СТРУКТУРЫ БЕЛКОВ ПО ОДНОМЕРНОЙ С ИСПОЛЬЗОВАНИЕМ НЕЯВНЫХ ГОМОЛОГИИ ПУТЕМ СРАВНЕНИЯ С ПРОФИЛЕМ ИЗВЕСТНЫХ СЕМЕЙСТВ

Сюняев Ш. Р., Родченков И. В., Богопольский Г. А., Власов П. К., Ройтберг М. А., Кузнецов Е. Н., Туманян В. Г.
Институт молекулярной биологии им. В.А.Энгельгардта РАН, 117984 Москва
Предсказание трехмерной структуры белка по его одномерной структуре путем сравнения с имеющимися в базе данных образцами трехмерных структур позволяет также сделать вывод о функции соответствующего белка. В настоящее время для предсказания типа третичной структуры (фолда) на первый план вышел так называемый профильный метод. Профиль строится путем анализа множественного выравнивания с использованием специально модифицированных методов математической статистики. Мы разработали два новых метода построения профилей. В первом оцениваются веса последовательностей в данной позиции множественного выравнивания с помощью статистики с учетом зависимых псевдоотсчетов. Второй - использует новую меру сходства последовательностей, исключающую избыточность информации, вносимую гомологичными последовательностями. Число независимых наблюдений аминокислоты определенного типа в данной позиции множественного выравнивания вычисляется из общего сходства соответствующего подмножества последовательностей на основе статистического подхода, который позволяет быстро подсчитать позиционно-специфичные веса последовательностей даже для большого числа последовательностей. Сравнение с лучшими профильными методом и методоми скрытых цепей Маркова показало, что наш подход позволяет правильно идентифицировать большее число белков с одним из тестовых фолдов в банке PDB. Правильность идентификации белка на принадлежность к семейству проверялась путем сравнения с базами данных САТН и SCOP. Таким образом появляется реальная возможность рассклассифицировать большую часть белков в протеоме, приписывая белкам определенную структуру (фолд) и функцию. Наш подход позволяет существенно повысить достоверность вывода, что данный белок имеет определенный фолд, или напротив, что присущий ему тип третичной структуры не представлен в банке.