ПРОСТРАНСТВЕННОЕ СТРОЕНИЕ БЕЛКОВ 10

Автор:mb. Дата:Июль 8, 2011

Сегодняшнюю, заключительную лекцию я посвящу функционированию белков.

Об этом можно говорить очень много, так что мой рассказ даст вам только несколько картинок из жизни работающих белков ≈ картинок, подчеркивающих значение пространственной организации белков для их функции. Некоторые картинки такого рода уже встречались в предыдущих лекциях, ≈ в частности, когда я говорил о мембранных белках. Сегодня я буду говорить только о белках глобулярных, водорастворимых.

Очень грубо, общую схему функционирования белка можно представить в следующем виде:

СВЯЗАТЬ ╝ ТРАНСФОРМИРОВАТЬ ╝ ОТПУСТИТЬ

Уточню: некоторые белки делают только часть из этих действий; слова «СВЯЗАТЬ» и «ОТПУСТИТЬ» могут подразумевать связывание и отпуск нескольких разных молекул; а слово «ТРАНСФОРМИРОВАТЬ» может означать и химическую трансформацию, и изменение конформации (как самого белка, так и субстрата), и/или перемещение (белка или субстрата) в пространстве.

Начнем с белков, чья основная функция ≈ «СВЯЗАТЬ». К ним относятся, например, ДНК-связывающие белки.

а б

Рис.20-1 (а) Структура ДНК (слева) и ряда белков, обладающих характерным ДНК-связывающим мотивом «спираль-изгиб-спираль» (он выделен серым цветом). Для белка ≈ активатора катаболитического гена (САР ≈ catabolite gene activator protein) показан только его С-концевой домен. Все эти белки димерны, и все они опознают большой желобок ДНК своими спиралями a3 (aF у САР), расстояние между которыми в димере близко к периоду двойной спирали ДНК (33.8 ). Картинки взяты из [6]. (б) Изгибание ДНК связавшимся с ней димерным САР-белком (справа, черный). Связывание его с ДНК требует присутствия циклоАМФ (cAMP).

Для связывания с ДНК, поверхность белка ≈ причем на большом протяжении ≈ должна быть приблизительно комплементарна поверхности двойной спирали (Рис.20-1а). Тогда выступы белковой поверхности смогут глубоко внедриться в желобок ДНК, и уже там его боковые группы смогут провести тонкое опознание конкретной ДНКовой последовательности (Рис.20-2) и связаться с той, для которой этот белок предназначен. Все показанные белки на Рис.20-1 ≈ димеры, и именно в такой форме они комплементарны ДНКовому дуплексу. При этом две одинаковые ДНК-опознающие a-спирали такого димера узнают палиндром в двойной спирали ДНК ≈ т.е. такую пару участков в ДНКовом дуплексе, которая одинаково выглядит при перевороте на 180о относительно перпендикулярной к ДНК оси, например

Здесь «-» означают произвольную последовательность ДНК между двумя половинами палиндрома, а «╥» ≈ ось переворота.

Рис.20-2. Характерные узоры, создаваемые разными функциональным группами A ≈ T и C ≈ G пар в большом и малом желобках ДНК. Картинка взята из [5].

ДНК-связывающие a-спирали в таком белковом димере антипараллельны друг дружке, а расстояние между ними близко к периоду двойной спирали ДНК, так что димер садится на один бок двойной спирали ДНК. Однако разный угол наклона этих a-спиралей к соединяющей их центры оси приводит к тому, что все эти белки по-разному изгибают ДНК при связывании. Порой такой изгиб, индуцированный связыванием, довольно велик (Рис.20-1б).
Иногда связывание белка с ДНК требует наличия кофакторов, которые изменяют ≈ точнее, слегка деформируют ≈ структуру белка и переводят его из неактивной формы в активную.
Так, в trp-репрессоре (он ≈ в E.coli ≈ репрессирует оперон, отвечающий за синтез РНК, кодирующей белки, необходимые для синтеза триптофана), ≈ в trp-репрессоре таким кофатором (точнее, корепрессором) является сам триптофан (Рис.20-3). Пока триптофан не связался с белком, расстояние между ДНК-связывающими спиралями в димере trp-репрессора слишком мало (около 28 вместо необходимых 34 ), так что тот не может связать ДНК. Триптофан же, связавшись с белком, отодвигает спирали так, что они становятся комплементарными к желобку в двойной спирали, ≈ и связываются с ней. Так что когда триптофана в клетке много, ≈ он, связываясь с белком, блокирует дальнейший синтез триптофан-синтезирующих белков, и тем самым ≈ свой (триптофана) дальнейший синтез. Этот способ регуляции называется отрицательной обратной связью.

Рис.20-3. Схема действия триптофанового (trp) репрессора. На фоне общего контура димера, обладающего общим сплавленным ядром (core) и двумя идентичными головками (head), показаны только те две спирали (3 и 5), между которыми садится корепрессор ≈ аминокислота Trp. Только при этом обе спирали 5 могут связаться с ДНК. Картинка взята из [5].

Триптофан в данном случае выступает стимулятором ДНК-связывающей активности trp-репрессора и ингибитором синтеза белков, необходимых для синтеза триптофана. Причем это стимулирование trp-репрессора является «аллостерическим», т.к. Trp связывается с белком «в другом месте», ≈ не в том, где с белком должна связываться ДНК.

Мотив «спираль-изгиб-спираль», фигурирующий на Рис.20-1 и Рис.20-3 ≈ характерный, но отнюдь не единственный структурный мотив, связывающий ДНК. Чтобы подчеркнуть это, я вынес три других характерных мотива на Рис.20-4. Я хотел подчеркнуть, что ДНК-связывающие белки могут принадлежать к разным структурным классам (на представленных рисунках есть и a, и a+b белки), и что даже само связывание с ДНК может осуществляться как a-, так и b-структурой.

а б в

Рис.20-4. Еще три характерных ДНК-связывающих белковых мотива. В двух из них ключевая роль принадлежит a-спиралям: (а) «цинковые пальцы» (шарики ≈ ионы Zn) и (б) «лейциновый зиппер». В третьем, met-репрессоре (в) ≈ ключевая роль принадлежит b-шпильке: она специфически связывается с большим желобком ДНК, в то время как a-спирали aВ связываются неспецифически с сахаро-фосфатным остовом ДНК. Цинковый палец, «finger» (этот домен можно отрезать от целого белка и выделить отдельно) ≈ самый маленький из известных глобулярных белков, а лейциновый зиппер ≈ самый простой из них по структуре. Когда лейциновый зиппер не связан с ДНК, он представляет собой просто димер из параллельных a-спиралей, слепившихся по всей длине своими узкими гидрофобными поверхностями. Образующие эти поверхности боковые группы показаны в виде выступов. Однако одна (на каждой спирали) из этих групп ≈ не гидрофобна: желтым пятном отмечен вкрапленный в гидрофобную поверхность полярный Asn. Он необходим для образования именно димера, т.к. его замена на более гидрофобный остаток приводит к тому, что спирали слипаются не по две, а по три и более. Картинки, с небольшими изменениями, взяты из [6] (а) и [5] (б,в). У каждой цепи помечен ее N- и/или С-конец.

До сих пор мы говорили о тех грубых (характерный размер: ~10-30 ) чертах белковой структуры, которые позволяют ей внедриться в желобок ДНК. За опознание же той конкретной ДНКовой последовательности, с которой белок должен связаться, отвечают более мелкие черты белковой поверхности (характерный масштаб ≈ размер атома, ~3 ).
К сожалению, «общий код» выборочного опознавания белками фрагментов ДНК пока не выяснен (и не ясно, есть ли такой сколько-нибудь четкий «код»), ≈ хотя, глядя на детали каждого расшифрованного ДНК-белкового контакта, можно увидеть, какие водородные связи между боковыми группами белка и нуклеотидами, и какие их другие плотные контакты способствовали образованию ДНК-белкового контакта именно в этом месте.

Тонкое, выборочное опознавание белками других молекул удобно рассмотреть на примере иммуноглобинов, или антител ≈ белков, предназначенных (в организмах позвоночных) для тонкого распознавания мелкомасштабных (размером в атом или несколько атомов) антигенных детерминант у самых разных молекул самого разного размера. А аналогичные иммуноглобинам рецепторы Т-клеток опознают таким же образом маленькие антигенные детерминанты у клеток, ≈ например, у клеток, зараженных вирусами.

Иммуноглобины состоят из многих b-структурных доменов и относительно небольших гибких шарниров между ними (Рис.20-5а). Разнообразие сочетаний вариабельных (антиген-связывающих) доменов обеспечивает иммуноглобинам широкий спектр сортов и, соответственно, широкий спектр действия, а твердость этих доменов ≈ высокую селективность действия иммуноглобина каждого сорта. Я не буду пересказывать основы клонально-селекционной теории происхождения огромного разнообразия иммуноглобинов. [Вы должны помнить из других курсов, что в зародышевых клетках представлены не целые гены легких и тяжелых цепей иммуноглобинов, а части, куски этих генов. Там эти части собраны в кассеты, ≈ отдельно много сортов для каждого из трех кусков вариабельного домена тяжелой цепи, отдельно ≈ легкой цепи; отдельно ≈ константные домены каждой цепи, отдельно ≈ шарниры. При образовании соматических иммунных клеток эти куски всячески тасуются ≈ и еще каким-то загадочным образом мутируют в своих гипервариабельных участках ≈ и соединяются в целые гены легких и тяжелых иммуноглобиновых цепей.]

а б в г

Рис.20-5. (а) Общее строение одного из иммуноглобинов (IgG). Отмечены вариабельные (V) и константные (С) домены двух легких (L: из двух доменов каждая) и двух тяжелых (H: из четырех доменов каждая) цепей, а также С-концы всех этих цепей. Домены СН2 гликозилированы. Жирные стрелки указывают на антиген-связывающие «карманы» между доменами VL и VH. (б) Строение домена VН; почти так же выглядят домены VL, СL, СН и прочие. В показанном домене VH выделены гипервариабельные петли; гипервариабельные петли есть и в домене VL. Вместе эти два домена образуют антиген-связывающий карман (в). (г) Антипараллельный b-цилиндр, образованный b-листом домена VH и b-листом домена VL. Антиген-связывающий карман образуют исходящие из этих листов гипервариабельные петли тяжелой и легкой цепи (Н1, Н2, Н3 и L1, L2, L3, соответственно). Картинки (б, в, г) взяты из [5].

Для нас важно сейчас, что антиген опознается вариабельными доменами легкой и тяжелой цепи (VH и VL) совместно, ≈ точнее, их (VH и VL) гипервариабельными петлями, оторачивающими антиген-связывающий карман, находящийся на стыке этих двух доменов (Рис.20-5,б-г). Первичная структура этих петель варьирует от одного сорта молекул иммуноглобина к другому (что и создает огромное разнообразие этих сортов), но, для каждого данного сорта, ≈ не только аминокислотная последовательность, но и конформация всех петель строго фиксирована, а сам антиген-связывающий карман покоится на твердом b-цилиндре, образованном соединившимися в рукопожатии антипараллельными b-листами вариабельных доменов. Поэтому каждая молекула иммуноглобина может сильно связать только определенный антигенный детерминант ≈ и равнодушна к другим.
Рисунок 20-6 показывает, что селективность связывания антигенных детерминант определяется не устройством белка в целом (оно служит лишь как бы фундаментом), а прежде всего комплементарностью формы, обводов связываемой молекулы к форме относительно небольшой вмятины, к форме только самого антиген-связывающего кармана.

Рис.20-6. Специфическое взаимодействие антигена и связывающего его «кармана» антитела. Показаны сближающиеся заряды и образующиеся водородные связи. Картинка взята из [5].

Кроме того, гидрофобные части связываемой молекулы контактируют с гидрофобными частями кармана, его заряды комплементарны зарядам, вкрапленным в карман, а находящиеся на антигене доноры и акцепторы водородных связей комплементарны вкрапленным в карман антитела акцепторам и донорам этих связей. Все это делает связывание ≈ но только связывание строго определенного антигена ≈ крепким.

Такое же, как в антителах, расположение активного центра ≈ в воронке на торце b-цилиндра ≈ наблюдается и во многих других белках, никак с иммуноглобинами не связанных. Например, это ≈ стандартное место активного центра в a/b цилиндрах (где, в отличие от иммуноглобинов, b-структура параллельна). Вообще, изучая структуры белков, легко заметить, что очень часто активный центр помещается в их «стандартном дефекте», в стандартно расположенной (т.е. определяемой мотивом укладки цепи, а не боковыми группами) вмятине в архитектуре белковой глобулы (Рис.20-7): такая вмятина автоматически способствует окружению субстрата одновременно многими боковыми цепями белка.

Рис.20-7. Стандартные вмятины в архитектурах белковых глобул часто определяют место-положение (не функцию!) активного центра. Слева: активный центр (active site) в воронке при верхушке b/a-бочонка с параллельным b-цилиндром; сходное расположение активного центра в воронке при верхушке антипараллельного b-цилиндра смотри на Рис.20-5г. Справа: активный центр в щели (crevice), образующейся в укладке Россманна в месте расхождения правых b-a-b суперспиралей, идущих в разные стороны (в суперспирали b1-a-b2 цепь идет от нас, в суперспирали b4-a-b5 ≈ к нам). Картинки взяты из [5].

Столь же обычным местом активного центра является место стыка доменов. Рисунок 20-8 показывает активный центр сериновых протеаз типа трипсина, ≈ он находится на стыке двух b-структурных доменов.

Рис.20-8. Положение активного центра в сериновых протеазах типа трипсина. Показаны части активного центра: каталитического центра, где выделены боковые группы «триады переноса заряда» ≈ Ser195 (оранжевый), His57 (синий) и Asp102 (малиновый), и субстрат-связывающего центра, где зеленым изображены NH-группы, образующие оксианионовую дыру, голубым ≈ неспецифическая субстрат-связывающая площадка, и желтым – группы, выстилающие специфический субстрат-связывающий карман.

Здесь естественно начать рассказ о белках, чья главная функция ≈ химически ТРАНСФОРМИРОВАТЬ связавшиеся с ними молекулы.

Сериновые протеазы ≈ классический лекционный объект, используемый для рассказа о простой ферментативной реакции, и я не буду отступать от этой традиции.
Сериновые протеазы разрезают полипептидные цепи, т.е. проводят реакцию

Реакция гидролиза пептидной цепи идет, когда в среде достаточно много воды, и сама по себе, но очень медленно, за многие годы, ≈ то есть гидролиз (при наличии свободной воды) термодинамически выгоден, но требует преодоления очень высокого активационного барьера. Если же свободной воды в среде нет ≈ реакция идет в другую сторону, в сторону синтеза полипептида и выделения воды, но тоже очень медленно.
В присутствии же фермента реакция гидролиза пептида (или, при отсутствии свободной воды, реакции его синтеза из более мелких фрагментов) занимает доли секунды, ≈ то есть фермент резко снижает ее активационный барьер. Посмотрим, как он это делает.

Прежде всего рассмотрим основные компоненты активного центра фермента.
Он состоит из каталитического центра, ответственного за проведение химической трансформации, и субстрат-связывающего центра, призванного правильно подставить субстрат под удар каталитического резака (или, точнее, сварочно/режущего аппарата ≈ так как фермент равно ускоряет и прямую, и обратную реакцию).
Катализ ≈ в сериновых протеазах ≈ непосредственно осуществляется боковой цепью серина (называемого «Ser195″ ≈ по его расположению в цепи химотрипсина ≈ во всех белках семейства трипсина; именно он, трипсин, изображен на Рис.20-8). Напомню химическую формулу боковой группы серина: ≈СН2-ОН. Однако для того, чтобы серин мог катализировать гидролиз ≈ его (серин) нужно подготовить. Пока кислород находится в форме ≈ОН группы, он не активен, а активным он становится после утери Н+ и перехода в форму ≈О-. Этим отрывом атома Н от Ser195 занимаются два остальных члена «триады переноса заряда» ≈ His57 (он-то и принимает оторванный атом Н) и «вспомогательный» Asp102. Мутации обоих этих остатков ≈ не говоря уже о мутации каталитического серина ≈ практически губят каталитическую активность трипсиновых протеаз.
Субстрат-связывающий центр состоит (Рис.20-8, 20-9) из оксианионовой дыры, связывающей кислород расщепляемой пептидной группы, из неспецифической пептид-связывающей площадки (отвечающей ≈ вместе с оксианионовой дырой ≈ за то, что расщепляемая пептидная группа займет правильное положение относительно активированного О-атома боковой группы Ser195), и из специфического субстрат-связывающего кармана, отвечающего за распознавание той аминокислоты, по карбоксилу которой производится расщепление пептида.

Рис.20-9. Схема ферментативного гидролиза пептида.

Общий ход реакции иллюстрируется рисунком 20-9. Эта схема была получена ценой многолетних исследований многих групп. Для ее построения привлекались и данные по катализу разных субстратов, и по химическим модификациям фермента, а равно и белково-инженерные исследования (которые показали, какие точки фермента вовлечены в катализ), и исследования ферментов в комплексе с нерасщепляемыми аналогами субстратов, и рентгенструктурные работы (показавшие, где образуются водородные связи), и так далее.

Что же делает фермент, как он ускоряет химическую реакцию? Для ответа на этот вопрос давайте сравним ферментативную реакцию (Рис.20-9) с аналогичной реакцией, протекающей спонтанно, ≈ в присутствии воды, но без фермента (Рис.20-10).

Рис.20-10. Схема спонтанного, не ферментативного гидролиза пептида в воде по тому же, что на Рис.20-9, химическому механизму.

Мы видим, что ферментативная реакция идет в две стадии ≈ сначала отщепляется С-концевой пептид и образуется комплекс N-концевого пептида с О-атомом серина, а затем этот N-пептид заменяет свою связь с О-атомом серина на связь с О-атомом воды. Без фермента же реакция идет в одну стадию, в которой отщепляется С-концевой пептид и образуется комплекс N-концевого пептида с О-атомом воды. Мы видим также, что все эти три реакции идут через тетраэдрический активированный комплекс, ≈ точнее, активированный комплекс, где рядом с тетраэдрическим С-атомом находится донор протона (His+ в ферменте или, в воде, ≈ ОН3+).
То, что на пути ферментативной реакции находится два активированных комплекса (а не один, как в ферментативной) ≈ не может, само по себе, ускорить реакцию. Однако ускоряет ее то, что активированный комплекс в связи с ферментом менее нестабилен (а именно его нестабильность и лимитирует скорость реакции), чем активированный комплекс в воде.
Активированный комплекс на ферменте стабилизируется следующим образом.
Во-первых, отрицательный заряд атома О-, образующийся при тетраэдризации С-атома, на ферменте втягивается в оксианионовую дыру, где стоят два уже нацеленных в эту дыру протона. Связь с этими положительно заряженными протонами понижает свободную энергию этого отрицательного заряда O- и, следовательно, энергию тетраэдризации С-атома ≈ по сравнению с не-ферментативной реакцией, где такой заранее устроенной «дыры» нет, то есть приводит к понижению энергии (энтальпии) переходного состояния, или к так называемому энтальпийному катализу.
Во-вторых, рядом с тетраэдрическим С-атомом стоит, с протоном наготове, His+ ≈ а он примерно столь же стабилен, как «безпротонный» His0. В воде роль донора протона должен играть ион ОН3+, ≈ ион, концентрация которого, вследствие его нестабильности, в воде крайне мала ≈ порядка 10-7 моля на литр. Его «вылавливание» из воды понижает энтропию и соответственно повышает свободную энергию активированного комплекса. Поэтому энтропия препятствует сбору «до кучи» всех компонентов активированного комплекса в воде ≈ и не мешает этому сбору на ферменте, где все эти компоненты уже собраны вместе. При этом энтропия «вылавливания» фермента субстратом оплачивается его прилипанием к субстрат-связывающему карману. Этот облегченный сбор всех компонентов активированного комплекса понижает его свободную энергию на ферменте ≈ по сравнению с оной в не-ферментативной реакции ≈ и приводит к так называемому энтропийному катализу.
В сумме, энтропийная и энтальпийная компоненты катализа ускоряют ферментативную реакцию примерно в 1010 раз по сравнению с не-ферментативной.

Если прилипание субстрата к ферменту достаточно сильно, а концентрация субстрата не слишком низка, то энтропийный катализ понижает наблюдаемый порядок реакции по концентрации субстрата. Теперь ее скорость зависит лишь от концентрации фермента, а от концентрации субстрата (или субстратов) в растворе не зависит. Этот эффект особенно силен тогда, когда речь идет о реакции, в которую вовлечено несколько молекул-субстратов, например ≈ при синтезе пептида из двух фрагментов в отсутствии воды.

Основное и в химическом, и в ферментативном катализе ≈ понижение свободной энергии переходного состояния, ≈ т.е. снижение максимума свободной энергии, преодолеваемого по ходу реакции (Рис.20-11). Снижения этой свободной энергии можно достигнуть за счет энтропии, за счет сбора на ферменте всех необходимых компонентов реакции. И его же можно достигнуть ≈ или усилить ≈ за счет свободной энергии преимущественного связывания именно переходного состояния обрабатываемой молекулы, ≈ а не ее начального состояния ≈ «субстрата» и/или состояния конечного ≈ «продукта». Кстати, если субстрат или продукт будут связываться очень уж сильно (сильнее, чем переходное состояние), ≈ фермент будет ими просто ингибироваться (он потеряет свою функцию «ОТПУСТИТЬ» ≈ и выйдет из игры).

Рис.20-11. Схема, поясняющая важность стабилизации катализатором именно переходного (самого нестабильного по ходу реакции) состояния субстрата/продукта и важность жесткости катализатора для снижения свободно-энергетического барьера реакции (DF#) и увеличения ее скорости (k). Рисунок, для наглядности, изображает просто комплементарность обводов переходного состояния к обводам активного центра фермента, в то время как в действительности основную роль обычно играет комплементарное взаимодействие их электронных облаков. Свободные энергии (F) начального и конечного состояний не меняются катализатором. Рисунок подчеркивает, что ускорение реакции зависит величины DDF#, т.е. от силы связывания ферментом именно переходного состояния: эффективность катализа связана с тем, что оно связывается сильнее, чем и начальный субстрат, и конечный продукт.

При преимущественном связывании переходного состояния ведущую роль может играть как связывание его деформированной электронной системы (вспомним «оксианионовую дыру» сериновых протеаз), так и преимущественное связывание деформированной ≈ опять-таки в переходном состоянии ≈ конформации всей молекулы.
Последнее особенно ярко проявляется в каталитической функции искусственных «абзимов» (antybody enzyme) ≈ антител, отобранных так, чтобы, связывая переходное состояние субстрата, они катализировали бы его химическое превращение (Рис.20-12). Некоторые абзимы способны направить на снижение активационного барьера почти всю энергию, выгаданную при связывании субстрата ≈ то есть почти вся она прилагается к деформации именно обрабатываемой химической связи. И хотя имеющиеся абзимы ≈ не очень мощные ферменты (они ускоряют спонтанную реакцию максимум на 5 порядков ≈ а не на 10-15, как естественные ферменты ≈ ведь в них еще не умеют встраивать доноры и акцепторы электронов), ≈ возможность их создания подтверждает важность преимущественного связывания именно переходного состояния.

Рис.20-12. Принципиальная схема химического превращения, катализируемого абзимом ≈ искусственно выработанным антителом к переходному состоянию реакции, которая спонтанно идет медленно. В переходном (┤) состоянии изображенной реакции изомеризации имеется ≈ в отличие и от начального, и от конечного ее состояний ≈ плоская система из трех колец. Для выработки антител к переходному состоянию такой формы используется тоже включающая три кольца, но стабильная молекула, изображенная внизу.

Теория катализа за счет преимущественного связывания переходных состояний была обоснована Холденом и Полингом еще в 30-40-х годах. В последние годы переходные состояния для ряда энзиматических реакций были «прощупаны» методами белковой инженерии, т.е. путем целенаправленной замены аминокислот активного центра фермента. При этом удалось выяснить (и увидеть, при помощи рентгена), какие из аминокислотных остатков фермента отвечают за слипание разных компонентов, потребных для создания активированного комплекса, и какие ≈ за преимущественное связывание именно и только переходного состояния реакции, дотоле гипотетического, так как его устройство не было видно структурному эксперименту.
Так, в тирозил-тРНК синтетазе, исследованной А.Ферштом., были найдены те остатки (Thr40 и His 45, см. Рис.20-13), что связываются с g-фосфатом АТФ только в перехдном состоянии, ≈ что и отличает это переходное состояние от просто связанных субстратов или продуктов реакции.

Рис.20-13. Предполагаемое строение переходного состояния в реакции образования тирозил-АМФ из тирозина и АТФ на ферменте тирозил-тРНК синтетазе. В целях наглядности, кольцо тирозина заштриховано, и кольца аденозина ≈ тоже. Атакующий тирозин активированный пяти-координатный a-фосфор (Р) АТФ находится в центре рисунка, а g-фосфат АТФ ≈ в его верхней части. Этот g-фосфат образует водородные связи с Thr 40 и His 45 только в переходном состоянии реакции; при простом, непродуктивном связывании субстратов этих Н-связей нет. Картинка взята из [9].

Перехдное состояние очень нестабильно (по определению: максимально нестабильно!), и прямо увидеть его нельзя. Так что рентген, видящий лишь стабильное расположение субстрата на ферменте, не видит его (субстрата) связывания с Thr40 и His 45 (видимое расстояние слишком велико), между тем как замены Thr40 и His 45 на маленькие аланины снижают активность мутантного белка более чем в миллион раз ≈ хотя эти замены почти совсем не влияют на связывание «мутантом» субстратов реакции. Это свидетельствует, что их (Thr40 и His 45) связывание с g-фосфатом АТФ происходит только в переходном состоянии ≈ при напряженном (пяти-координатном) состоянии g-фосфата, атакованного СО-группой тирозина.

Говоря о ферментативной реакции, мы не можем упускать из виду также ее очень высокую специфичность.
Так, сериновые протеазы щепят полипептид только после определенных аминокислот: химотрипсин ≈ после ароматических, трипсин ≈ после положительно заряженных, эластаза ≈ только после самых маленьких. Этот эффект [он называется опознаванием субстрата по принципу "ключ (субстрат) ≈ замок (фермент)"] достигается четкой структурой той специфической части субстрат-связывающего «кармана» (Рис.20-14), куда должна улечься последняя (как на трипсине) или предпоследняя (как на папаине) перед точкой щепления боковая группа пептида.

Рис.20-14. Устройство специфического сайта субстрат-связывающего кармана в разных сериновых протеазах. Картинка взята из [5].

Протеазы еще могут позволить себе изредка ошибаться в выборе точки щепления.
Но есть белки, от которых требуется колоссальная точность работы. Это, например, аминоацил-тРНК синтетазы: они «заряжают» тРНК нужными аминокислотами, и от точности их работы зависит точность синтеза белков. Поэтому они не могут позволить себе ошибаться чаще, чем однажды на много тысяч синтезов аминоацил-тРНК, ≈ а опознавание аминокислоты специфическим субстрат-связывающим карманом допускает порядка 1% ошибок. Для устранения этих ошибок используется эффект «двойного сита» (Рис.20-15). Этот эффект обеспечивается специальной конструкцией фермента.

Рис.20-15. Схема «двойного сита» для механизма редактирования работы изолейцил-тРНК синтетазы

У фермента аминоацил-тРНК синтетазы два активных центра: центр синтеза и центр гидролиза. Причем гидролиз аминоацил-тРНК на аминоацил-тРНК синтетазе не есть просто реакция, в точности обратная синтезу: обе эти реакции идут с выделением свободных фосфатов, т.е. обе ≈ с понижением свободной энергии.
При этом субстрат-связывающий карман центра гидролиза меньше, чем карман центра синтеза аминоацил-тРНК.
Принцип сита ≈ не пропускать частицы, большие, чем ячейки сита.
На первом сите ≈ при синтезе аминоацил-тРНК ≈ тРНК заряжается «правильной» аминокислотой и некоторым числом «неправильных», более мелких (более крупные аминокислоты отвергаются все, а большая часть «неправильных» мелких все же отвергается по причине различий в гидрофобности/гидрофильности, но отбор по гидрофобности/ гидрофильности не столь жесток, как отбор по возможности втиснуться в карман данного размера). Итак, на выходе этапа синтеза, ≈ много аминоацил-тРНК с «правильной» аминокислотой и некоторое количество аминоацил-тРНК с «неправильными» аминокислотами, ≈ но только с теми, что меньше, чем «правильная»: более крупные аминокислоты отвергаются «карманом» синтетического центра, этим первым «ситом».
На втором активном центре, на втором «сите» ≈ у него «ячейка» (субстрат-связывающий карман) поменьше ≈ идет гидролиз образовавшихся аминоацил-тРНК, ≈ но только тех, где аминокислота меньше, чем «правильная». То есть «правильная» аминокислота отвергается карманом гидролизного центра, этим «вторым ситом», а все остальные аминоацил-тРНК гидролизуются и распадаются.
В сумме, два эти сита и обеспечивают выход только «правильно заряженных» аминоацил-тРНК.

В завершение рассказа о специфичности ферментов, стоит остановиться на двух прагматических аспектах. Во-первых, сейчас масса людей занята изучением субстрат-связывающих карманов и подбором ≈ с открытыми глазами, не на ощупь ≈ связывающихся с ними ингибиторов. Особый интерес, по понятным причинам, вызывают протеазы и другие белки вируса СПИДа. Во-вторых, ≈ большое применение находят себе точечные мутации в районе активного (и прежде всего субстрат-связывающего) центра: они позволяют модифицировать «природную» субстратную специфичность (например, менять специфичность сериновых протеаз) и даже создавать новые, искусственные специфичности для нужд промышленности и медицины. Значительный интерес также вызывают попытки ≈ пока это лишь попытки ≈ создания (на «твердом фундаменте» белковой глобулы) «нового» активного центра, ≈ с новой, «привитой» функцией, ≈ путем направленных точечных замен аминокислотных остатков исходного белка.

Изучение ферментативной деятельности белка показывает (Рис.20-9), что в нее вовлечена совсем небольшая часть белковой глобулы, ≈ в то время как остальная ее часть служит лишь как бы твердым каркасом, обеспечивающим «правильное» строение закрепленного на нем активного центра.
Поэтому нас не должно удивлять, что белки с совсем разной первичной структурой, и даже с совсем разной и пространственной структурой могут иметь одинаковые или очень сходные биохимические функции.
Классическим примером снова являются сериновые протеазы. Есть два класса таких протеаз ≈ типа трипсина и типа субтилизина. Они совсем не похожи ни по аминокислотной последовательности, ни по общей форме (Рис.20-16), и даже принадлежат к разным структурным классам (трипсин ≈ двухдоменный b-белок, субтилизин ≈ однодоменный a/b-белок). Они имеют одинаковую конфигурацию лишь ключевых аминокислотных остатков в каталитическом центре (Рис.20-17) ≈ причем не всех остатков целиком, а лишь их функционально-важных «кончиков» ≈ но не имеют одинаковой конфигурации остатков даже в субстрат-связывающем кармане.

Рис.20-16. Схема строения сериновых протеаз типа трипсина (а) и субтилизина (б). На фоне общего контура глобул показаны a-спирали, b-листы и b-цилиндры. Район активного центра показан черным треугольником.

Рис.20-17. Схема строения каталитических центров сериновых протеаз типа трипсина (а) и субтилизина (б). Черным выделены фрагменты главной цепи (вплоть до Сb-атомов); направление хода цепи в этих фрагментах показано стрелками. Кружком показано место оксианионовой дыры. Видно, что только расположение концов боковых групп каталитической триады переноса заряда (Ser, His, Asp) и ≈ с натяжкой ≈ положение оксианионовой дыры инвариантно в этих двух классах сериновых протеаз, в то время как кардинальные отличия наблюдаются даже в ходе главной цепи у ключевых каталитических остатков His и Asp.

Более того: существуют протеазы, совершенно не похожие на сериновые протеазы даже в зоне каталитического центра. Я имею в виду, в частности, металлопротеазы типа карбоксипептидазы или термолизина. У них ключевую роль в катализе играет плотно встроенный в белок ион Zn++. Имея маленькие радиусы, многозарядные металлические ионы создают вокруг себя очень сильное электрическое поле. Это позволяет им ≈ в металлопротеазах ≈ активировать молекулу воды (отщепляя от нее Н+) с тем, чтобы та осуществила бы далее разрыв пептидной связи (ср. Рис.20-10), и одновременно ≈ стабилизировать зарядом Zn++ отрицательный заряд на тетраэдрическом переходном состоянии разрываемого пептида.

Итак, одна и та же химическая реакция может осуществляться совсем разными белками. При этом одну и ту же ключевую роль ≈ роль мощных электрических резаков ≈ в одних белках играют многозарядные металлические ионы, в других ≈ легко принимающие электроны или протоны органические кофакторы, в третьих ≈ активированные своим окружением (как в трипсине) боковые группы…
С другой стороны, как мы помним, разные белки с одной и той же характернейшей (Рис.20-7) формой a/b-цилиндра (а равно и белки, имеющие форму укладки Россманна) могут катализировать совершенно разные реакции.
Все это показывает довольно широкую независимость общего строения белка от его ферментативной активности.

До сих пор я почти ничего не говорил о конформационных изменениях белковых молекул в ходе их функционирования ≈ и не случайно: пока речь идет ≈ как у нас до сих пор ≈ о катализе одной, отдельно взятой энзиматической реакции ≈ конформационная гибкость белка может только ухудшить его каталитические свойства. В самом деле, для эффективного катализа нужно преимущественное связывание именно переходного состояния (Рис.20-11), ≈ в пику отличающимся от него лишь на какой-то ангстрем начальному и конечному состояниям, ≈ и это преимущественное связывание нацелено на синтез или разрыв очень жестких ковалентных связей. Так что рвать их «гибким» белком ≈ все равно, что резать проволоку подушкой…
Впрочем, здесь надо добавить следующее. Когда активный центр белка не идеально подогнан под свою функцию ≈ а идеальность подгонки требует сверхтщательной работы естественного отбора ≈ этот центр может требовать небольшой деформации для перехода в активную форму. И тогда такая деформация будет, действительно, функционально необходима ≈ она будет, время от времени, доводить несовершенный белок до кондиции. Однако здесь надо четко отличать нужду (деформацию, искупающую несовершенство геометрии активного центра) от добродетели (от совершенства белка).
Конечно, даже самый лучший белок несколько деформируется в процессе работы ≈ ведь он не алмазный ≈ но это играет примерно ту же функциональную роль, что деформация бумаги под пером: чем меньше ≈ тем лучше.
Другое дело, когда белок должен перейти от одного действия к другому: тогда его деформация, обеспечивающая переход от одной роли к другой, действительно, играет важную функциональную роль.
Так, в многих белках проникновение субстрата в активный центр требует небольшого расхождения близких к этому центру боковых групп. Однако, после того, как субстрат сел на этот центр, его каталитическая работа движения этих групп уже не требует.
Можно сказать, что подвижность нужна при подготовке к реакции, а жесткость ≈ в момент ее проведения. Это похоже на военное «правило Клаузевица» ≈ «на марше ≈ отдельно, в бою ≈ вместе».

Мы уже познакомились с одной функционально-важной деформацией на примере регуляции ДНК-связывающей активности trp-репрессора. Сейчас мы рассмотрим вопрос о функционально-важных деформациях более внимательно.

Прежде всего посмотрим, как деформация белка помогает сочетать стадии цикла СВЯЗАТЬ ╝ ТРАНСФОРМИРОВАТЬ ╝ ОТПУСТИТЬ. Рисунок 20-18 демонстрирует индуцированное соответствие (введенный Д.Кошландом термин) фосфорилирующего белка ≈ гексокиназы ≈ к его субстратам. Этот белок переносит фосфатную группу с АТФ на глюкозу. Но ≈ в принципе, по химии реакции ≈ эта же фосфатная группа может быть перенесена и на воду; однако этого не происходит. В попытке ответить на вопрос, почему этого не происходит, Кошланд постулировал следующее. 1) До связывания с субстратом фермент находится в «открытой» форме (в которой он может захватить субстрат из воды, но не способен провести его фосфорилирование). 2) После связывания с субстратом он ≈ фермент ≈ переходит в «закрытую», каталитически-активную форму, где все части активного центра собраны воедино и способны катализировать реакцию фосфорилирования, но вода вытеснена из активного центра и потому не конкурирует с субстратом за фосфорилирование. 3) После каталитического акта фермент снова открывается, и фосфорилированный субстрат уходит.

Рис.20-18. Индуцированное соответствие при функционировании гексокиназы. В открытой форме два домена разделены глубокой щелью, куда может заплыть глюкоза. Когда глюкоза попала в щель, домены поворачиваются, щель закрывается, вода из нее вытесняется, а все компоненты каталитического центра сходятся вместе. Картинка взята из [5].

Впоследствии опыт полностью подтвердил эту гипотезу (Рис.20-18), ≈ но только для тех белков, которым нужно скрыть обрабатываемый субстрат от конкурирующей с ним воды. Для действия трипсина, например, этого не нужно, ≈ и в нем индуцированного соответствия субстрату не наблюдается: трипсин (а также ≈ химотрипсин, эластаза, субтилизин и т.д.) не деформируется и опознает субстрат по простейшему принципу «ключ ≈ замок».

Хочу привлечь ваше внимание к тому, что индуцированное соответствие достигается смещением либо крупных блоков (Рис.20-3), либо целых белковых доменов (Рис.20-18), ≈ а не полной перестройкой укладки белковой цепи. А смещения эти происходят в основном путем мелких локальных деформаций. [Аналогия: мышцы сокращаются ("локальная деформация"), и пальцы ("домены") сжимаются в кулак.]
То же самое имеет место и во всех других известных случаях «конформационных перестроек белков» ≈ за немногими исключениями, когда из глобулы иногда вырывается и переходит в нерегулярную конформацию целая a-спираль или b-тяж. Одна из самых больших известных мне перестроек происходит в калмодулине. Сам по себе он имеет форму гантели, «головки» которой ≈ a-спиральные домены ≈ разнесены на большое расстояние «ручкой» ≈ одной длинной a-спиралью. Однако при связывании калмодулина с рядом других белков «головки» бывшей гантели, не ломаясь, сближаются и слипаются друг с другом и с белком-целью, а бывшая «ручка» ≈ длинная a-спираль ≈ разрушается.

Относительная автономия доменов хорошо видна в большом семействе белков, называемых дегидрогеназами. Эти белки катализируют сходные реакции типа окисления алкогольных групп при помощи кофактора НАД, легко принимающего оторванные протоны. Однако окисляют они разные вещества: алкогольдегидрогеназа ≈ спирт (этанол), лактатдегидрогеназа ≈ лактат, и т.д.
Дегидрогеназы состоят из двух доменов (Рис.20-19), соединенных перемычкой.

Рис.20-19. Цепи НАД-зависимых дегидрогеназ свернуты в два отдельных домена, соединенных относительно гибкой перемычкой. Один из них более или менее универсален (т.е. очень сходный домен встречается в разных белках) ≈ он связывает кофактор НАД. Второй ≈ не универсальный, а индивидуальный в каждой дегидрогеназе домен, ≈ связывает обрабатываемый субстрат. Картинка взята из [5].

Один, связывающий обрабатываемый субстрат домен, индивидуален в каждой из дегидрогеназ. Например, в алкогольдегидрогеназе он содержит b-цилиндр, а в глицеральдегид-3-фосфат дегидрогеназе ≈ плоский b-лист.
В то же время второй из этих доменов ≈ тот, что связывает кофактор НАД ≈ у всех НАД-зависимых дегидрогеназ устроен практически одинаково, хотя в одних дегидрогеназах он находится в N-, а в других ≈ в С-концевой половине цепи, и несмотря на отсутствие видимой гомологии в первичных структурах НАД-дегидрогеназ. В этом a/b домене цепь обладает «укладкой Россманна» (см. Рис.20-7б), причем сходство распространяется и на мелкие детали НАД-связывающих доменов разных дегидрогеназ: большую часть этих доменов можно наложить друг на друга с точностью до 2 , ≈ включая и место связывания НАД [это, по-видимому, показывает, что пространственная структура лучше помнит родство белковых доменов, чем первичная.]
Таким образом, разнообразие действия дегидрогеназ обеспечивается ≈ при универсальности НАД-связывающего домена, несущего каталитический центр, ≈ разнообразием субстрат-связывающих центров, расположенных на «субстрат-связывающих» доменах, устроенных по-разному: в структуре целого белка эти две части активного центра соприкасаются (Рис.20-19).

В заключение я хочу рассказать о неконтактном, ≈ или, как говорят, аллостерическом взаимодействии активных центров. Аллостерические взаимодействия между различными связывающими и активными центрами, особенно в олигомерных белках, играют важнейшую роль в контролировании и интегрировании биохимических реакций. Сейчас я рассмотрю (в самой упрощенной форме) только один, наиболее изученный аллостерический белок ≈ гемоглобин.
Это ≈ тетрамер, точнее ≈ комплекс из двух «a» и двух похожих на них «b» цепей (Рис.20-20а). Его дело ≈ связать кислород в легких (где его много), донести до мышц (где его мало) и отдать мышечному миоглобину, мономерному белку, похожему на любую из четырех субъединиц гемоглобина. Активный центр миоглобина и каждой a и b субъединицы гемоглобина ≈ гем: кофактор, связывающий одну молекулу О2 (Рис.20-20б). И успешность действия гемоглобина как транспортера О2 определяется именно аллостерическим, в данном случае ≈ концертным взаимодействием четырех гемов в нем.

а б

Рис.20-20. (а) Общая структура гемоглобина, состоящего из двух a и двух b цепей; каждая из четырех цепей окрашена в свой цвет, гемы показаны фиолетовыми скелетными моделями с оранжевым ионом железа внутри. (б) Схема связывания кислорода гемом в гемоглобине. До связывания О2 ион железа (Fe++) гема находится в высоко-спиновой форме, в которой два внешних электрона находятся на двух разных орбитах. При этом диаметр Fe++ чуть великоват для того, чтобы войти в центр порфиринового кольца гема (которое при этом находится в слегка изогнутой форме). Связав О2, ион Fe++ приобретает низкоспиновую, чуть более компактную форму, в которой электроны с противоположными спинами занимают одну орбиту. Теперь Fe++ может войти в центр порфиринового кольца (которое при этом обретает плоскую форму). Показан также гистидин a-спирали F, координирующий ион железа. Картинка (б) взята из [9].

Связав кислород, ион железа гема входит в центр порфиринового кольца гема. При этом он чуть смещается и тянет за собой координирующий его гистидин a-спирали F. Это смещение ≈ посредством множества мелких деформаций белка ≈ слегка изменяет обводы связавшей О2 субъединицы. В тетрамерном гемоглобине эта субъединица ≈ в такой форме ≈ начинает деформировать (придавая им ту же внешнюю форму и тем наводя в них те же внутренние смещения атомов) другие, еще не связавшие О2 субъединицы гемоглобина. Теперь ион железа в них может уже легче связать кислород. В результате, связь одной молекулы О2 с гемоглобином провоцирует связывание еще трех О2. Точно так же, утеря одного О2 ведет к утере их всех.
То есть гемоглобин ведет себя как белок, связывающий четыре молекулы О2 одновременно, ≈ и это отражается в нелинейной, S-образной зависимости насыщения этого (тетрамерного!) белка кислородом от его (О2) концентрации в крови (Рис.20-21). А у (мономерного!) миоглобина зависимость насыщения кислородом от концентрации О2 в крови S-образного прогиба не имеет.

Рис.20-21. Кривые насыщения кислородом тетрамерного белка гемоглобина (а) и мономерного миоглобина (b). Отмечено артериальное давление кислорода, при котором он поглощается гемоглобином крови в легких, и венозное давление, при котором он отдается гемоглобином мышечному миоглобину. Экспериментальная кривая связывания О2 с миоглобином соответствует реакции первого порядка, а экспериментальная S-образная кривая связывания О2 с гемоглобином ≈ реакции примерно третьего (а не четвертого, как для простоты сказано в тексте) порядка. Стрелка соответствует переходу кислорода с гемоглобина на миоглобин. Картинка, с небольшими изменениями, взята из [1].

Поэтому в легких, где кислорода много, гемоглобин им насыщается. А в тканях, где (венозное) давление О2 относительно мало, тетрамерный гемоглобин уже отдает О2, а мономерный миоглобин еще его хватает, ≈ и передает О2 дальше по окислительной цепи мышц, ≈ например, тех, что расширяют и сжимают легкие.
И так мы дышим и живем.

ПРОСТРАНСТВЕННОЕ СТРОЕНИЕ БЕЛКОВ 9

Автор:mb. Дата:Июль 8, 2011

С тех пор как стало понятно, что аминокислотная последовательность белковой цепи определяет ее пространственную структуру ≈ возникла проблема предсказания этой структуры по последовательности аминокислотных остатков в белковой цепи.
Чем вызвана потребность в предсказании белковых структур, ≈ кроме чисто интеллектуального интереса: удастся это сделать или нет? Тем, что экспериментально пространственную структуру белка определить куда труднее, чем его аминокислотную последовательность. А понимание механизма действия белка, подбор искусственных ингибиторов или активаторов к нему, ≈ и часто даже просто определение того, чем он занимается в клетке, ≈ настоятельно требует знания его пространственной структуры…
И ≈ конечно же! ≈ интерес к предсказанию пространственных структур белков подогревается воспоминанием о том, какое решающее значение имело предсказание строения двойной спирали ДНК для понимания всего генетического механизма.

Сейчас известно уже порядка сотни тысяч белковых последовательностей. Но «всего» для нескольких тысяч из них, т.е. всего для нескольких процентов определены, рентгеном или ЯМР, их пространственные структуры. При этом многие из недавно определенных последовательностей просто считаны с ДНК или РНК, т.е. никто не определил на опыте, чем занимаются сделанные из них белки.
Что же можно сказать о трехмерных структурах тех последовательностей (я их буду называть «новыми»), для которых эксперимент ≈ рентген или ЯМР ≈ еще не сказал своего слова?

Прежде всего возникает мысль о предсказании трехмерной структуры «новой» последовательности на основании родственного сходства ≈ или, как говорят, «гомологии» ее первичной структуры с какими-то из «старых» последовательностей, пространственное строение коих уже расшифровано. Опыт показывает, что даже не очень сильного сходства последовательностей достаточно для очень хорошего сходства пространственных структур: как говорят, пространственная структура более консервативна, чем аминокислотная последовательность.
Установление гомологии первичных структур ≈ действительно, очень мощный метод выяснения родства структур (причем не только белков, а и фрагментов ДНК и РНК ≈ но я буду говорить о белках).
Однако надежно он работает, надежно устанавливает сходство первичных пространственных структур только на достаточно близких последовательностях. Этот случай иллюстрируется Рис.19-1.

Рис.19-1. Гомологичные аминокислотные последовательности N-концевых фрагментов цитохромов c различных митохондрий и хлоропластов эукариотов. Жирным шрифтом выделены остатки, идентичные оным в человечьем (human) белке, подчеркнуты ≈ сходные с ними. Выравнивание аминокислотных последовательностей взято из [6].

Хуже обстоит дело, когда белки в семействе сильно варьируют (Рис.19-2).
В этом случае на помощь приходит компьютер. Разработано множество программ, ищущих гомологии; с ними можно работать по Интернет. Назову только самые популярные из этих программ: BLAST и PSI-BLAST. Все они строят выравнивание (alignment) последовательностей, добиваясь наибольшего сходства между ними. При этом за повышение сходства часто приходится платить «разрывом» последовательностей (см. знаки «-» на Рис.19-2).

Рис.19-2. Аминокислотные последовательности N-концевых фрагментов рибонуклеаз Н бактерии (E.coli), эукариота (дрожжи, yeast), и трех разных вирусов. Множественное выравнивание делалось так, чтобы не допустить разрывов последовательностей (см. «- – -») внутри a- и b-структурных участков. Жирным шрифтом выделены остатки, идентичные в трех и более из этих пяти последовательностей. Черными точками отмечены остатки активного центра, пустыми кружками и ромбами ≈ остатки, вовлеченные в два гидрофобных ядра этого белка. Внизу отмечены остатки, совпадающие ( = ) и сходные ( : ) у последовательностей из RSV и HIV (помещенных в двух нижних строках выравнивания), а также указана вторичная структура рассматриваемых белков. Картинка, с небольшими изменениями, взята из [7].

Разные программы по-разному оценивают, чего стоит совпадение остатков, чего ≈ сходство, чего ≈ несовпадение, чего ≈ начало разрыва, чего ≈ каждый дополнительный остаток в разрыве. Все эти оценки оптимизируются авторами так, чтобы удовлетворительно выделять белки, сходство которых уже известно из других данных, и потом «зашиваются» в программу. Пользуясь программой, люди («пользователи») обычно даже не знают, что «хорошо» согласно этой программе, что «плохо», а просто говорят: «установлено, что гомология последовательностей составляет 25%» ≈ имея в виду, что 25% выровненных остатков совпали друг с другом.
Встает вопрос ≈ свидетельствуют ли эти 25% о сходстве последовательностей? Для ответа на этот вопрос необходимо сравнить, пользуясь той же программой, заведомо несходные последовательности. И тут выясняется, что «гомология» несходных белков (Рис.19-3) обычно составляет 10-15%, иногда ≈ 20%, и порой ≈ даже 25%!

Рис.19-3. Выравнивание аминокислотных последовательностей непохожих, негомологичных белков [в данном случае ≈ a-спирального РНК-связывающего белка (rop) и b-структурного белка холодового шока (mjc)] часто дает 10-15% совпадающих аминокислотных остатков [в данном примере ≈ 10 остатков (см. жирный шрифт) из 69, т.е. 14.5%]. Выравнивание сделано программой BLAST.

Эти цифры меняются от программы к программе. Однако накопленный опыт показывает, что тогда, когда «хорошая» (по общему мнению) программа дает совпадение свыше 30-35% остатков, ≈ то выявленной гомологии можно смело доверять (с оговоркой: при длине сравниваемых последовательностей свыше 50, а лучше ≈ 100 остатков). Правда, надо учитывать что 30 ≈ 35% гомологии между последовательностями, верно (как правило) свидетельствуя об их родстве, позволяют правильно наложить друг на друга только 70-80% их пространственных структур, давая неверное предсказание о сходстве остальных 20-30%. А для того, чтобы верно проследить структуру 95% главной цепи «нового» белка, нужно, чтобы его гомология с белком с известной структурой достигала 40 ≈ 50%.
Если же сходство пары последовательностей не превышает 10-15% ≈ то их родство обычно нельзя обнаружить: такое сходство находится на уровне шума (что, однако, не является доказательством, что белки не похожи, не гомологичны ≈ я к этому еще вернусь). А от 15 до 25 и даже до 30% простирается «сумеречная зона»: кажется, что белки гомологичны, ≈ но кто поручится?…
К сожалению, все эти цифры не вполне одинаковы у разных программ (и у разных режимов их работы), а к программе они, эти цифры, обычно не прилагаются (они есть в исходных статьях, но кто их читает…), ≈ так что я бы рекомендовал, прежде чем доверяться любой такой программе, проверить ее (именно ее, и именно в используемом Вами режиме) на известных вам белках примерно той же длины (и сходных, и несходных) и понять, «что такое хорошо и что такое плохо» (другой вариант: прочесть исходную статью…).
Больше всего все эти оценки достоверности и недостоверности найденного сходства «плавают» от программы к программе из-за того, что разные авторы по-разному оценивают «штраф» за разрыв последовательности. Если его положить нулевым, то есть позволить делать любые разрывы «бесплатно», ≈ случайно выбранные белковые (и вообще 20-буквенные) последовательности дают сходство на уровне 30-35% (а ДНКовые, 4-буквенные ≈ на уровне 65%)!
Опыт показывает, что оптимальное отделение «похожих» от «непохожих» белковых последовательностей достигается, когда начало разрыва последовательности штрафуется в цену двух или трех дополнительных совпадений аминокислотных остатков, а за удлинение разрыва платится примерно 1/20 ≈ 1/100 этой цены за каждый дополнительный остаток в разрыве.
Я умышленно не говорю ничего о математике, лежащей в основе алгоритмов поиска гомологий. Это нас увело бы слишком далеко. Хочу, однако, произнести ключевые слова: «динамическое программирование». Это ≈ название самого мощного метода, применяемого для оптимизации одномерных систем (а последовательность ≈ система именно одномерная), ≈ в частности, для оптимизации выравнивания одной последовательности относительно другой.

Можно ли распознать гомологичность, родственность последовательностей, если их сходство лежит ниже уровня в 30%, ≈ т.е. в «сумеречной зоне» или даже ниже ее? Можно ≈ но для этого надо сравнивать интересующую нас последовательность со многими последовательностями семейства, и обращать внимание преимущественно на те позиции в цепи, что доказали свою консервативность именно в этом семействе.
Рисунок 19-2 показывает, что рибонуклеаза Н вируса иммунодефицита человека (HIV) имеет не очень высокое ≈ «на уровне шума» ≈ сходство с другими рибонуклеазами Н, если рассматривать всю цепь (так, из 60 выровненных остатков у нее есть всего 9 общих ≈ 15% совпадений ≈ с рибонуклеазой Н из RSV). Однако это сходство проявляется именно в тех ключевых районах, где все остальные рибонуклеазы похожи друг на друга. Это резко повышает достоверность такого сходства. А если еще учесть, что эти «ключевые районы» совпадений охватывают все аминокислотные остатки активного центра, и что сходство концентрируется в участках вторичной структуры, и что оно охватывает около 30% (а не 15%) остатков гидрофобных ядер белка, ≈ высокая достоверность переходит в уверенность в правильном опознании гомологии.
Для опознания гомологии «новых» последовательностей также удобно пользоваться «консенсусными последовательностями» (Рис.19-4), выведенными для уже изученных белковых семейств и подчеркивающими их наиболее консервативные черты. Иногда такие консенсусные последовательности (снабженные данными по частотам встречаемости остатков в каждом месте цепи) называют «профилями первичных структур».

Рис.19-4. Аминокислотный состав различных позиций в N-концевых фрагментах цитохромов c митохондрий эукариот. Самые важные, консервативные остатки цепи определены однозначно. Подчеркнута последовательность «сайта» Cys-X-X-Cys-His, отвечающего за связывание гема в подавляющем большинстве цитохромов (и не только c, и не только эукариот). Выравнивание аминокислотных последовательностей взято из [6].

При опознавании функционального сходства белков следует также обращать внимание на уже установленные для многих функций «сайты» ≈ более или менее короткие последовательности, обеспечивающие эти функции (см. на Рис.19-4 сайт Cys-X-X-Cys-His, связывающий гем в цитохромах). Такие сайты собраны в библиотеки, и их поиском занимаются специальные программы, из которых PROSITE является наиболее популярной.

При установлении структуры «нового» белка по его гомологии с уже изученным надо ясно отдавать себе отчет, что сходство пространственных структур может не распространяться на районы, где последовательности сильно разошлись. В основном это (см. Рис.19-2) районы петель, нерегулярных конформаций белковой цепи. Здесь, с весьма переменным пока успехом, приходится прибегать к конформационным расчетам и другим методам гомологического моделирования, на которых я останавливаться не буду.

Перейдем к методам предсказания пространственной структуры «новых» последовательностей, не имеющих видимой гомологии с уже расшифрованными белками.
К ним относится около 2/3 «новых» последовательностей. Поэтому о пространственной укладке большинства последовательностей, получаемых в ходе выполнения генетических проектов, мы не можем догадаться по их гомологии с белками уже известными ≈ она или слишком слаба для обнаружения, или отсутствует. Тут-то и возникает настоятельная потребность в решении задачи предсказания пространственной структуры ≈ а, в перспективе, и функции белка, ≈ по его аминокислотной последовательности (Рис.19-5).

Рис.19-5. Схема первичной и пространственной структуры маленького белка (панкреатического ингибитора трипсина). Ход главной цепи изображен на фоне общего контура молекулы; выделены a-спирали, b-тяжи, резкий поворот цепи (t) и цистеиновые мостики ( – - – ). Так как белок сворачивается сам собой, то ≈ в принципе ≈ все это можно предсказать по одной лишь первичной структуре белка. Боковые группы здесь не показаны, но ≈ в принципе ≈ и их расположение в пространстве тоже можно предсказывать.

Надо сразу сказать, что абсолютно надежных и точных методов предсказания белковых структур сейчас нет.
Причин тому, видимо, две: (а) ограниченная точность энергетических оценок, на которых базируется теоретический расчет белковых структур, и (б) сравнительно малая разность между «правильно» и «неверно» уложенными белковыми цепями. Я хочу особо подчеркнуть последнее обстоятельство, ≈ оно резко отличает ситуацию в белках (и РНК) от ситуации в ДНК, ≈ к большому огорчению людей, занявшихся предсказаниями структур белков по их аминокислотным последовательностям. В ДНК комплементарное спаривание нуклеотидов наблюдается по всей длине двойной спирали, а оно обеспечивается тем, что одна цепь по своей первичной структуре строго комплементарна другой. Это и дает огромный свободно-энергетический выигрыш «правильной» структуры ДНК над всеми «неправильными». А в белках (и РНК) ни какой-либо строгой комплементарности, ни следующего из нее огромного энергетического преимущества «правильной» укладки цепи не наблюдается…
Однако существующие методы дают все более полную и надежную информацию о возможном строении (или, чаще, о возможных вариантах строения) белка или, особенно, его структурных элементов.
В прагматическом аспекте, вопрос о предсказании трехмерного строения белка сейчас ставится следующим образом: похожа ли пространственная структура рассматриваемой белковой последовательности на какую-либо из уже известных пространственных белковых структур? Если да, то как рассматриваемая последовательность вписывается в эту структуру? Если нет, можем ли мы указать какие-либо характерные детали пространственной организации рассматриваемой последовательности?

Я знаю несколько случаев, когда ответы на эти вопросы существенно способствовали экспериментальному определению структуры и/или функции изучаемой аминокислотной последовательности, помогли планировать белково-инженерные эксперименты и так далее. Впрочем, должен сказать, что я бы с большим интересом прочел бы хороший обзор о практическом применении предсказаний белковых структур…

Перейдем теперь к методам предсказания белковых структур. Рассматривая эти методы, я буду уделять особое внимание тем идеям, и в основном физическим идеям, что лежат в их основе.

Есть две стратегии предсказания белковых структур. Согласно первой стратегии, белковая структура ищется как результат кинетического процесса сворачивания.
Согласно второй, ≈ она ищется как структура с минимально возможной для данной цепи свободной энергией.
В принципе, по-видимому, обе эти стратегии могут привести к правильному результату, так как самая стабильная структура белковой цепи, несмотря на опасения Левинталя, образуется достаточно быстро (этому вопросу была посвящена отдельная лекция, и сейчас я позволю себе его не касаться).
Важно, однако, что, рассматривая предсказание белковых структур, мы можем отвлечься от путей сворачивания и рассматривать только результат ≈ стабильную структуру белка. Тем более, что первая стратегия ≈ стратегия имитационного моделирования процесса сворачивания белка ≈ пока существенного прогресса не дала: уж очень сложны все расчеты, и к тому же ≈ все же весьма приблизительны все потенциалы взаимодействий. Вторая стратегия оказалась более успешной.

Начнем с определения стабильной вторичной структуры белка по его аминокислотной последовательности. a-спирали и вытянутые b-участки ≈ важнейшие элементы белковых глобул, во многом определяющие, как вы помните, их общую архитектуру (Рис.19-5).
Забудем пока о том, что белковая цепь свернута в глобулу, т.е. рассмотрим развернутую белковую цепь. Можем ли мы предсказать ее вторичную структуру по аминокислотной последовательности? Оказывается ≈ да, в основном да, пусть и не абсолютно точно.

Прежде всего, ≈ какие аминокислотные остатки будут стабилизировать вторичную структуру ≈ например, a-спираль, ≈ а какие будут разрушать ее?
Эксперименты дают прямой ответ на этот вопрос. Я имею в виду огромную работу по оценке a- и b-образующих способностей аминокислотных остатков, проведенную в группах Шераги, Фасмана, Болдвина, Фершта, Серрано, ДеГрадо, Кима и в ряде других групп (и, в частности, у нас ≈ В.Е.Бычковой и О.Б.Птицыным). Кроме того, богатый (и хорошо совпадающий с физико-химическим экспериментом) материал дает статистика аминокислотных последовательностей a- и b-структур в белках. Рисунок 19-6 суммирует важнейшие (те, которые стоит запомнить) из оценок, полученных всеми этими методами.

Рис.19-6. Шаблоны a-спирали, петли, b-структуры и b-изгиба ≈ те остатки, которые стабилизируют их или их отдельные части. «+» означает все положительно заряженные аминокислоты, «-» ≈ все отрицательно заряженные, «+ -» ≈ все аминокислоты с диполем в боковой цепи. Показан также стабилизирующий a- и b-структуру порядок чередования гидрофобных групп в цепи (см. нумерованные группы). Такого типа чередование приводит также к образованию гидрофобных и полярных поверхностей a-спиралей и b-тяжей.

Здесь надо, однако, сразу сказать, что все закономерности, наблюдающиеся в структурах белков, носят вероятностный, частотный характер. Несмотря на многочисленные попытки, не удалось выделить никакого четкого «кода» белковых структур ≈ то есть ничего похожего на то четкое A-T и G-C спаривание нуклеотидов, которое свойственно двойной спирали ДНК. Впрочем, надо признать, что уже в РНК ≈ с их разнообразным, в отличие от ДНК, репертуаром пространственных структур ≈ спаривание нуклеотидов происходит далеко не столь однозначно…

Подавляющее большинство из полученных экспериментальных и статистических оценок можно легко понять, исходя из физики и стереохимии аминокислот. Мы уже говорили об этом на одной из прошлых лекций.
Так, Pro не любит входить ни в a-спираль (кроме ее N-концевого витка), ни в b-структуру. Почему? Потому, что у него нет NH-группы, и он не может завязывать соответствующие a- и b-структуре водородные связи; а на N-конце спирали NH-группа таких связей и не должна завязывать, ≈ и Pro там встречается часто, тем более что его угол y уже фиксирован пролиновым кольцом в подходящем положении. По тем же причинам часто встречается Pro и на N-конце изгибов.
А вот Ala стабилизирует a-спираль, ≈ а Gly разрушает и ее, и b-структуру, и способствует образованию клубка. С чем связана эта разница? С тем, что область конформаций, т.е. область допустимых углов f,y для Gly в клубке гораздо больше, чем для Ala, ≈ в то время как допустимые конформации для обоих этих остатков в a-спирали примерно совпадают.
По аналогичным причинам разветвленные остатки ≈ Val, Ile и Thr ≈ больше стабилизируют b-структуру, где их боковые группы имеют 3 разрешенных поворотных изомера, чем a-спираль или клубок, где они имеют только 1 изомер (при каждом значении f и y).
Вообще же гидрофобные группы склонны несколько чаше входить в a- и b-структуру, где они могут слипаться в гидрофобных кластерах (см. Рис.19-6), чем в клубок, где они этого делать не могут. А вот боковые группы с диполями, особенно ≈ в короткой боковой цепи, больше склонны входить в нерегулярные участки цепи, где они могут завязывать дополнительные нерегулярные водородные связи, чем в a- и b-структуры, где доноры и акцепторы водородных связей уже насыщены внутрицепными связями.

Более того, влияние аминокислотных остатков на вторичную структуру можно оценить теоретически. Так, еще до получения экспериментальных оценок, в начале и середине 70-х годов, мы с О.Б.Птицыным предсказали, что отрицательно заряженные остатки должны стабилизировать N-конец спирали, притягиваясь к его положительному парциальному заряду, и дестабилизировать ее С-конец, отталкиваясь от отрицательного парциального заряда спирального диполя. Положительно же заряженные остатки должны действовать в прямо противоположном направлении. При этом потенциал каждого такого взаимодействия должен, по теоретической оценке, составлять 1/4 или 1/3 килокалории. Что и было подтверждено экспериментально.

Зная, какие аминокислотные остатки стабилизируют середину спирали, какие ≈ ее N-конец, а какие ≈ C-конец, мы получаем нечто вроде «шаблона» спирали. Шаблон a-спирали можно описать так: если начало фрагмента белковой цепи обогащено отрицательно заряженными группами, да еще там стоит Pro; если середина этого фрагмента обогащена остатками Ala, Leu и Met, а Pro и Gly там нет; и если его С-конец содержит положительно заряженные боковые группы, ≈ то перед нами a-спиральный участок. Кроме того, для стабильности a-спирали полезен, а для ее включения в глобулу ≈ просто необходим определенный (Рис.19-6) порядок чередования гидрофобных групп в цепи: этот порядок способствует слипанию этих групп и, кроме того, приводит к образованию на спирали сплошной гидрофобной поверхности, необходимой для ее прилипания к глобуле.
То есть «шаблон» качественно описывает аминокислотную последовательность, подходящую для образования a-спирали. Чем лучше аминокислотная последовательность удовлетворяет этому шаблону ≈ тем вероятнее спираль в данном месте цепи. Такое же описание ≈ «шаблон» ≈ можно составить и для участков, пригодных для образования b-структуры. А также ≈ для участков, особо пригодных для образования b-изгибов и петель.

Более того, «шаблоны» можно применять и для описания кусков цепи, образующих более сложные структуры, ≈ например, для описания b-a-b суперспиралей, состоящих из двух параллельных b-участков и a-спирали между ними (Рис.19-7). Такие структуры типичны для доменов, связывающих нуклеотиды. Особо важную роль в «шаблоне» играют так называемые «ключевые позиции», которые могут быть заняты только строго определенными аминокислотными остатками, ≈ например, Gly: только этот остаток может находиться в конформации с f>60о, недоступной всем остальным остаткам.

Рис.19-7. «Шаблон» суперспирали b-a-b, связывающей нуклеотиды. Квадратики отмечают ключевые позиции, обычно занимаемые сравнительно небольшими гидрофобными остатками (Ala, Ile, Leu, Val, Met, Cys): это ≈ гидрофобное ядро суперспирали b-a-b. Черные кружки ≈ позиции, занимаемые только Gly: здесь находятся резкие повороты цепи. Пустой треугольник отмечает первую позицию мотива b-a-b, где обычно находится положительно заряженная или дипольная боковая цепь. В последней (-) позиции мотива b-a-b находится аминокислота Asp или Glu, связывающая лиганд (нуклеотид). Рисунок, с небольшими изменениями, взят из R.K.Wierenga et al., J. Mol. Biol. (1986) 187:101-107.

Но вернемся к расчету вторичной структуры. Зная вклады отдельных взаимодействий в стабильность a-спирали, мы можем рассчитать свободную энергию спирализации любого участка цепи, а следовательно ≈ и Больцмановскую вероятность образования спирали в любом месте полипептидной цепи, еще не свернувшейся в глобулу. Суммируя и усредняя эти вероятности, мы можем рассчитать и среднюю спиральность такого «несвернутого» полипептида. Вот уже более 15 лет мы используем для этого нашу программу ALB. В одном из режимов («unfolded chain» ≈ «развернутая цепь») она позволяет рассчитывать содержания a- и b-структуры в полипептидах и в несвернутых белковых цепях, ≈ причем при разной температуре, ионной силе и рН раствора. Потом результат можно сравнить с опытными данными ≈ например, с КД спектрами. Рисунок 19-8 показывает, что теоретический расчет неплохо совпадает с опытом.

Рис.19-8. Теоретическая (вычисленная программой ALB ≈ unfolded chain) и экспериментально найденная спиральность нескольких десятков пептидов при температуре 0о-5оС и разной ионной силе и рН раствора. Рисунок взят из A.V.Finkelstein, A.Y.Badretdinov & O.B.Ptitsyn, Proteins (1990) 10:287-299.

Переходя к расчету и предсказанию вторичной структуры белков, глобулярных белков, необходимо учесть, что здесь к взаимодействиям, существующим в несвернутых цепях, добавляется взаимодействие каждого участка цепи с глобулой, строения которой мы не знаем. Точнее, мы не знаем ее детального строения, но знаем, что участки цепи как-то примыкают к гидрофобному ядру белка. В простейшем приближении взаимодействие с ядром можно аппроксимировать взаимодействием с «гидрофобным озером», на котором плавает белковая цепь (Рис.19-9).

Рис.19-9. Флуктуирующая вторичная структура белковой цепи (здесь: b ≈ b-тяж, l ≈ петля, a ≈ a-спираль) на поверхности гидрофобного озера, имитирующего белковую глобулу («модель плавающих бревен»). Модель учитывает разное чередование обращенных к поверхности озера (), от поверхности () и вдоль нее (╝, ╛) боковых групп в разных вторичных структурах, а также эффекты на N- и С-концах спирали, объединенные и приписанные ее, соответственно, N- и С-концевым остаткам (aN ,aC). Рисунок, с небольшими изменениями, взят из O.B.Ptitsyn & A.V.Finkelstein, Bipolymers (1983) 22:15-25.

Зная из опыта силу гидрофобных взаимодействий, а из стереохимии a- и b-структуры ≈ мотивы чередования в цепи боковых групп, глядящих в одну и ту же сторону и способных, следовательно, одновременно взаимодействовать с гидрофобной поверхностью, ≈ мы можем сосчитать вероятность образования a-спирали и b-структуры в каждом месте белковой цепи. Этим также ≈ но уже в режиме «глобулярная цепь» («globular chain») ≈ также занимается программа ALB (кстати, к ней можно обращаться по Интернет: http://indy.ipr.serpukhov.su/~rykunov/alb/).

Вероятности рассчитываются при комнатной температуре. Почему при комнатной? Не лучше ли выделять только самое лучшее по энергии расположение a- и b-структур в цепи, т.е. рассчитывать все вероятности при 0оК?
Прежде всего, конечно, расчет относится к комнатной температуре потому, что все экспериментальные оценки стабильности, на которых базируется расчет, относятся к этой температуре.
Но еще важнее то, что вероятности, рассчитанные именно при такой температуре (300оК), лежащей чуть ниже нормальной температуры плавления белка (350оК) наилучшим образом позволяют отделить более вероятные a- и b-участки, в которых мы можем быть более или менее уверены, от тех «менее вероятных», в которых мы уверенными быть не можем.
Ведь, в сущности, мы стараемся предсказать вторичную структуру белка только по части тех взаимодействий, что ее держат в действительности: мы знаем (и то приблизительно) внутренние взаимодействия в этой структуре, но не знаем (или можем лишь крайне грубо оценить) те, что действуют между рассматриваемым куском цепи и остальной глобулой. А они очень мощны.
То есть мы находимся в том же положении, как если бы пытались предсказать, будет ли данный остаток внутри белка или на его поверхности, зная только его собственную гидрофобность ≈ и больше ничего. И мы знаем, что такая задача имеет ответ, ≈ но ответ не точный, а вероятностный. Этот ответ содержится в наблюдаемой статистике распределения остатков между нутром и поверхностью глобулы. Мы уже знаем, что она выглядит так:
ВЕРОЯТНОСТЬ_ВНУТРИ / ВЕРОЯТНОСТЬ_НА_ПОВЕРХНОСТИ ~
~ exp(≈ГИДРОФОБНАЯ_СВОБОДНАЯ_ЭНЕРГИЯ/kTC), (19.1)

где TС ≈ характерная температура белковой статистики, лежащая ≈ как мы тоже помним ≈ несколько ниже температуры плавления белка.
И ≈ возвращаясь к предсказаниям белковых структур ≈ по той же формуле (19.1), и с той же температурой ТС мы можем вероятностно предсказывать существование рассматриваемой вторичной структуры, зная только ее собственную свободную энергию.

Рисунок 19-10 иллюстрирует расчет вторичной структуры в глобуле. Он был сделан в 1985 г. для интерферонов. Видно, что в них преобладают a-спирали, особенно в N-концевой части цепи, где (как было известно из других опытов) находится функциональный домен интерферона. В данном случае спирали эти предсказывались столь уверенно (а это бывает отнюдь не всегда) и столь одинаково в разных, не так уж и высоко гомологичных цепях, что мы попробовали ≈ в том же 1985 г. ≈ слепить домен из этих спиралей.

Рис.19-10. Расчет вторичной структуры нескольких интерферонов. Абсцисса ≈ номер остатка в белковой цепи, ордината ≈ вычисленная вероятность его a-спирального ( ____ ) и b-структурного ( _ _ _ ) состояния. Сверху приведены предсказания наиболее вероятных a-спиралей (a), b-тяжей (b) и изгибов (Т). Черные прямоугольники ≈ уверенное предсказание вторичной структуры, пустые ≈ не столь уверенное предсказание, линии ≈ данная вторичная структура в принципе не исключена, но маловероятна. Цепь, образующая N-концевой домен, подчеркнута внизу рисунка. Картинка взята из O.B.Ptitsyn, A.V.Finkelstein & A.G.Murzin, FEBS Letters (1985) 186:143-148.

Полученный комплекс, пучок из трех больших спиралей и одной крошечной, показан на следующем рисунке (19-11а). Через пять лет после того, как было сделано это предсказание, была, наконец, получена рентгеновская структура интерферона b (Рис.19-11б), ≈ и рентгеновская структура N-концевого его домена довольно точно совпала с той, что была предсказана нами.

а б в

Рис.19-11. (а) Предсказание укладки цепи в N-концевом домене интерферонов, сделанное нами в 1985 г. [Ptitsyn, Finkelstein, Murzin, FEBS Letters (1985) v.186, p.143]. Три большие a-спирали (А, C, D) изображены цилиндрами; кроме того, была предсказана возможность существования отдельного спирального витка В. (б) Рентгенографическая структура N-концевого домена (С-концевой домен ≈ не изображен) b-интерферона, расшифрованного в 1990 г. [Senda et al., Proc. Jpn. Acad. Sci., ser.B, Biopys. Biol. Sci. (1990) v.66, p.77]. Рисунок (б) дан в той ориентации, что и предсказанная модель (а), и на нем даны те имена больших спиралей (А, C, D), под которыми они значатся на рисунке (а). Район В* спиралеподобен, но не a-спирален в интерфероне b, однако в родственном ему интерфероне g там находится небольшая a-спираль [Ealick et al., Science (1991) v.252, p.698]. (в) Топологии b и g интерферонов по Ealick et al. Интерферон g состоит из двух субъединиц. Обратите внимание на «обмен» С-концевыми доменами [спиралями (E, F)] между этими двумя субъединицами.

Структура N-концевого домена интерферона ≈ одна из первых, более или менее успешно предсказанных до опыта структур белковых молекул.

Хочу подчеркнуть факторы, способствовавшие успеху предсказания: a-спирали предсказаны здесь очень уверенно; и они одинаково расположены в отдаленно-гомологичных цепях, что позволяет им доверять.
Однако столь уверенное и повторяющееся в гомологах предсказание вторичной структуры встречается на практике не часто. Более типичны некоторые разночтения, как в С-концевом домене интерферонов (Рис.19-10), для которого ≈ именно вследствие этого, очень типичного небольшого разночтения ≈ однозначного предсказания укладки цепи получить не удалось.
И еще очень важная вещь для успеха предсказания строения интерферона. Когда мы искали наилучшую упаковку предсказанных a-спиралей, мы могли рационально организовать перебор всех возможных упаковок, так как располагали априорной классификацией a-спиральных комплексов (я об этом уже говорил) ≈ она как раз была разработана к тому времени Мурзиным и мной.

Вернемся к предсказанию вторичной структуры.
Оно носит вероятностный характер: точность распознавания a-, b-структуры и нерегулярных петель белка по его аминокислотной последовательности составляет около 65%.
Можно ли улучшить предсказание вторичной структуры? Да. В методе «PHD» Роста и Сандера (очень его рекомендую, он доступен по Интернет) вторичная структура предсказывается не для одной аминокислотной последовательности, а для набора гомологов. В результате такого подхода случайные погрешности как бы сглаживаются и предсказание становится намного более точным (достигая, в среднем, 72-73% вместо 63-65%).
Итак ≈ несмотря на свою ограниченную точность, предсказание вторичной структуры стало уже, по сути, рутинной процедурой исследования первичной структуры белка.

Перейдем теперь к новой, быстро развивающейся области ≈ к работам по предсказанию пространственных укладок белковых цепей.

Проблему предсказания белковой структуры можно представить себе как проблему выбора той структуры, которая наиболее стабильна для данной аминокислотной последовательности. Проблема заключается в том, откуда взять «возможные белковые структуры». Самый простой, прагматичный ответ ≈ взять из Банка Белковых Структур. Там, конечно, нет еще всех возможных структур ≈ но есть надежда, что там есть примерно половина всех существующих в природе мотивов укладки белковых цепей в домены. Эту надежда ≈ ее обосновал Сайрус Чотиа ≈ основана на том, что вновь расшифровываемые белки (точнее ≈ их домены) все чаще и чаще оказываются похожими на уже расшифрованные.
Кстати, сейчас разворачивается большой проект «Structural Genomics», цель которого ≈ расшифровать пространственное строение хотя бы одного представителя каждого семейства белков (а их ≈ порядка 10000). Когда эта программа будет завершена ≈ для этого придется потратить примерно 10 миллиардов $ за 10 лет ≈ все предсказание структур «новых» белков можно будет ≈ мы надеемся на это ≈ делать по гомологии с уже расшифрованными белками. Однако пока что приходится использовать лишь вероятностные методы предсказания; в настоящее время они ≈ точнее, лучшие из них ≈ дают правильный ответ (для белков, не имеющих видимой гомологии с уже расшифрованными) примерно в 30% случаев.

Итак, предсказывая структуру белка, не имеющего видимой гомологии с белками уже расшифрованными, можно попробовать взять, одну за другой, все пространственные структуры из Банка, наложить (возможно, с некоторыми выпетливаниями, см. Рис.19-12) цепь этого белка на каждую из них, и посмотреть, какая из этих пространственных структур даст ≈ для нашей цепи ≈ наибольший энергетический выигрыш. При этом мы должны разрешать цепи то идти по скелету структуры, то выпетливаться или «сокращать» имеющиеся в скелете выпетливания ≈ если это увеличивает энергетический выигрыш.

Рис.19-12. Схема, иллюстрирующая идею «протягивания» исследуемой последовательности по Банку Белковых Структур. Жирная линия показывает те участки, где последовательность идет по скелету, пунктир ≈ те, где она выпетливается.

Такой подход называют «методом протягивания» (threading method). Он был предложен нами с Б.А.Ревой в 1990 г. и ≈ независимо, в более простом и более удобном варианте ≈ Д. Айзенбергом и его группой в 1991 г. Сейчас метод протягивания стал весьма популярным методом опознавания структур «новых» белков по их аналогии со «старыми».
В общем, работа по протягиванию напоминает поиск гомологии, ≈ только на этот раз «выравниваются» не две первичные структуры, «новая» и «старая», а «новая» первичная структура со «старым» белковым скелетом.

Прежде, чем перейти к результатам, ≈ хочу подчеркнуть две принципиальные проблемы метода «протягивания». В сущности, аналогичные проблемы, в том или ином виде, возникают в любом «предсказательном» методе.
Во первых, конформацию даже тех кусков цепи, что наложены на скелет, мы знаем с большой погрешностью: ведь мы не знаем конформации боковых групп, ≈ а именно они, в основном, и взаимодействуют. Далее, мы не знаем конформации всех выпетливаний. Оценка показывает, что при протягивании мы знаем примерно половину взаимодействий в белковой цепи, а вторую ≈ не знаем. Значит, опять мы вынуждены судить о структуре белка по части взаимодействий, действующих в его цепи. Значит, опять наши предсказания могут носить только вероятный характер.
Во-вторых, как перебрать все наложения и найти лучшее ≈ или лучшие ≈ среди них? Ведь их, возможных наложений, страшно много… Скажу коротко: мощные математические вычислительные методы для этого уже развиты, но рассказ об этом занял бы слишком много времени. Наверно, имеет все же смысл назвать эти методы по имени ≈ может быть, кому-то из вас пригодится (но большинству, конечно, нет). Итак: динамическое программирование и его вариант ≈ статистическая механика одномерных систем (цепных молекул) ≈ для расчета протягивания цепи через скелет; теория самосогласованного поля ≈ для расчета действующего на цепь молекулярного поля в каждой точке скелета; стохастическая минимизация энергии методом Монте-Карло; а также ≈ разные варианты метода ветвей и границ, и т.д.

Для примера я покажу предсказанную методом протягивания укладку цепи в белке, терминирующем репликацию. Протягивая цепь этого «нового» белка по всем известным трехмерным белковым структурам, Зиппль и его коллеги из Зальцбурга показали, что укладка гистона Н5 наиболее «родственна» этой цепи (Рис.19-13).

Рис.19-13. Гистон Н5 цыпленка (1hstA, слева) и белок, терминирующий репликацию (rtp, справа); в последнем не показана С-концевая спираль, не имеющая аналога в гистоне Н5. Предсказание сходства укладки цепи в этих двух белках сделано, методом «протягивания», в работе H.Flckner, M.Braxenthaler, P.Lackner, M.Jaritz, M.Ortner & M.J.Sippl, Proteins (1995) 23:376-386; это предсказание сделано в ходе «слепого» тестирования предсказательных методов (CASP-1994). Средне-квадратичное отклонение между 65-ю эквивалентными Сa атомами в изображенных структурах ≈ 2.4.

Рис.19-14. Последовательность гистона Н5 (1hstA), выровненная относительно последовательности белка, терминирующего репликацию (rtp) согласно рентгеноструктурным данным («Наблюдаемая», верхняя пара последовательностей), и она же, выровненная согласно предсказанию методом протягивания («Предсказанная», нижняя пара). Серыми зонами показаны сдвиги, расхождения этих двух выравниваний. Они хорошо видны по разным сдвигам вторичных структур гистона Н5, приведенных в самой верхней и самой нижней строке в этих двух выравниваниях. Вторичные структуры записаны в подчеркнутых строках (обозначения: Н ≈ a-спираль, Е ≈ b-тяж, Т ≈ изгиб цепи). Точками отмечены делеции, пропуски в первичных и вторичных структурах, внесенные при их выравнивании. Картинка взята из статьи C.M.-R.Lemer, V.J.Rooman & S.J.Wodak, Proteins (1995) 23:337-355, в которой обсуждаются итоги CASP-1994.

Таким образом они правильно опознали мотив укладки цепи белка ≈ терминатора репликации. Правда, предсказанное (при помощи теоретического протягивания) наложение цепи этого белка на структуру гистона Н5 довольно сильно отличается (Рис.19-14) от того, что получается при прямом наложении трехмерных структур этих молекул. Это еще раз показывает, что все погрешности, о которых я говорил по ходу лекций ≈ погрешности в параметрах стабильности, незнание точной конформации петель и т.д. ≈ не позволяют выделить одну уникальную наилучшую структуру, а позволяют в действительности только найти более или менее узкий набор лучших структур. Такой набор «лучших» пространственных структур можно выделить довольно надежно; а вот какая из них окажется, согласно расчету, «наилучшей» ≈ это дело случая. Нативная структура находится где-то в наборе «лучших» структур, она приблизительно соответствует предсказанной («наилучшей»), ≈ но это все, что можно реально сказать.
Я, конечно, привел только «хорошие» примеры ≈ примеры удавшихся предсказаний. Примеров неудавшихся много больше, и это понятно ≈ ведь, предсказывая, надо выбрать один, или пусть несколько вариантов из бездны оцениваемых. Так что попасть рядом с такой бесконечно малой целью даже в трети или в четверти случаев (так сейчас работают наиболее успешные группы), ≈ огромный успех.
Поэтому методы «протягивания» становятся сейчас рабочим инструментом для опознавания трехмерных структур белковых последовательностей. Чрезвычайно важно, что уже сформирован рецепт ≈ делай так, так и так, и в результате ты получишь одну или несколько структур, среди которых, с довольно высокой вероятностью, будет структура, сходная с трехмерной укладкой рассматриваемой последовательности.

Можно ли улучшить опознавание белковых структур? Да, если привлечь гомологи ≈ т.е. предсказывать структуру белка уже не только по его аминокислотной последовательности, а по набору гомологичных последовательностей. Этот метод улучшил предсказания вторичных структур белков. Он широко и успешно применяется при предсказании вторичных структур РНК. При опознавании пространственных укладок белковых цепей его тоже начали применять ≈ при этом отдается предпочтение той укладке, что более или менее хороша для всех гомологов. Правда, при этом мы получим не точную структуру данной цепи, а некоторую обобщенную, т.е. приближенную структуру, общую для всех гомологов.

Суммируем. Предсказание трехмерных укладок белковых цепей, с точки зрения физики, является поиском самой стабильной укладки рассматриваемой цепи (или, в современной реализации этого подхода, в «протягивании», threading’е ≈ поиском структуры, наиболее совместимой с данной цепью). Такое предсказание возможно в принципе, и порой оно приводит к вполне удовлетворительному результату. Однако оно всегда имеет сложности, связанные с недостатком точной информации о репертуаре возможных укладок белковых цепей, о многих взаимодействиях в белковой цепи, с погрешностями в энергетических параметрах, и т.д.
В результате, однозначное и надежное предсказание укладки цепи по ее последовательности вряд ли возможно, ≈ но зато можно выделить несколько наиболее вероятных мотивов укладки цепи и ≈ что очень важно ≈ отбраковать огромное множество других укладок. И такие предсказания могут быть уточнены с учетом дополнительной информации ≈ в частности, о последовательностях цепей гомологичных белков и об их возможных укладках.

Мой сегодняшний рассказ касался в основном белков глобулярных. А что можно сказать о фибриллярных и мембранных?
В последовательностях фибриллярных белков ≈ без всякого компьютера ≈ просматриваются периодичности, характерные для их вторичных структур, ≈ причем они настолько очевидны, что опознание вторичных структур этих белков обычно не составляет труда. А на этой основе удается предложить несколько возможных вариантов их упаковки в фибриллу.
Предсказание строения мембранных белков менее развито, чем предсказание строения белков глобулярных: слишком мало структур мембранных белков мы знаем. Опознать внутримембранные части таких белков довольно легко: это ≈ сплошные (точнее ≈ почти сплошные) гидрофобные блоки, длина которых диктуется толщиной мембраны. Однако принципы формирования укладки этих блоков в белке еще недостаточно выяснены (хотя известно главное; напомню: у мембранных белков ядро структуры ≈ не гидрофобное, как у глобулярных, а полярное; гидрофобные же группы их контактируют с жиром мембраны). Поэтому работы по предсказанию пространственного строения мембранных белков только начинаются.

В заключительной части этой лекции я хочу кратко рассказать о белковой инженерии, точнее ≈ о белковом дизайне, то есть о конструировании новых белков.

Олигонуклеотидный синтез и техника рекомбинантных ДНК дали возможность получения генов белков, не существовавших в природе; рентген и ЯМР позволили увидеть трехмерные структуры белков; а мощные ЭВМ и компьютерная графика позволили вступить в интерактивный диалог с этими пространственными структурами, ≈ менять в них что-то и оценить последствия этих изменений. Объединившись, эти методы стали, соответственно, «руками», «глазами» и «мозгом» новой области молекулярной биологии ≈ белковой инженерии. Ее стратегическая задача ≈ создание знаний и методов, позволяющих получать белки с наперед заданной функцией и структурой. Трудно переоценить перспективность этих исследований для конструирования новых лекарств, катализаторов, для схемотехники и т.д.
Прицельный белково-инженерный эксперимент уже дал ответ на ряд фундаментальных вопросов. Показано, что за выбор пространственной структуры отвечают далеко не все детали плотной упаковки ≈ структура белка выдерживает массу точечных мутаций; и не петли ≈ если заменить или вырезать из белковой цепи участок, кодирующий петлю, то «рана» на теле глобулы обычно затягивается. О том, что целенаправленное введение точечных мутаций дает массу информации об энергетике белковой глобулы и промежуточных структур на пути ее самоорганизации, мы уже говорили; а о том, как они применяются для исследования активности белка ≈ поговорим на следующей лекции.
Освоив введение мутаций в «природные» белки, белковая инженерия обратилась к дизайну, конструированию белковых молекул.
Задача дизайна ≈ обратная по отношению к задаче предсказания структуры. Если при предсказании мы должны найти пространственную структуру, наиболее пригодную для рассматриваемой последовательности ≈ то при дизайне мы должны найти, сконструировать последовательность, годную для создания желаемой пространственной структуры.
Вообще говоря, расчет искусственных конструкций может быть проще, чем предсказание структуры «натуральных» белков (расчет прочности «искусственной» башни проще, чем «натурального» дерева: она спроектирована так, чтоб поддаваться расчету!). А конструирование новых белков опирается на теорию белковых структур; их «строительными блоками» обычно служат последовательности, кодирующие мощные, внутренне стабильные и способные к эффективному слипанию a- и b-участки.

Белковый дизайн был поставлен на повестку дня в конце 70-х ≈ начале 80-х годов, когда возникла техника создания искусственных генов и техника точного химического синтеза белковых цепей. В конце 80-х ≈ начале 90-х годов при помощи прикидок, проб и ошибок были созданы простейшие белковые молекулы. Их архитектуры брались из природных белков, а их аминокислотные последовательности подбирались так, чтобы, не будучи гомологичными природным, стабилизировать эту архитектуру.

Первым был сделан ≈ в группе ДеГрадо ≈ четырехспиральный пучок (Рис.19-15). Дизайн проводился в тесном диалоге с экспериментом. Исследование окончательного варианта белка показало, что он спирален и глобулярен; и структура этого искусственного белка оказалась гораздо стабильнее, устойчивее к нагреву, чем структура любого «естественного» белка! Потом, правда, оказалось, что этот белок не плавился при нагревании потому, что был расплавленной глобулой с самого начала… Пришлось усилить твердую структуру этого искусственного белка, введя в него гистидины, связывающие ион. И вот этот-то белок-комплексон оказался уже твердым, как природные белки.

Рис.19-15. Основные этапы дизайна четырехспирального пучка, сделанного в группе ДеГрадо. 1. Подбор коротких спиральных пептидов, способных слипаться в тетрамер. 2. Дизайн петель, сшивающих эти пептиды попарно, и отбор тех вариантов сшитых пептидов, что димеризуются. 3. Дизайн последней петли и отбор мономерного тетраспирального искусственного белка. Рисунок взят из [6].

Долгое время все искусственные белки (кроме тех, что усиливались образованием ионных комплексов) представляли собой коллекцию отличных расплавленных глобул. Они обладали прекрасной вторичной структурой, они были очень компактны, ≈ но им не хватало твердости.
Вопрос: Почему хотят сделать нормальный, «твердый» белок ≈ а получается расплавленная глобула?
Видимо, потому, что все знают, как сделать стабильные вторичные структуры (лейцины и аланины, отороченные глутаминовыми кислотами с N-конца и лизинами с С-конца ≈ получится a-спираль; побольше валинов, изолейцинов и треонинов ≈ получится b-структура); и все знают, как заставить эти a- и b-структуры слипаться: надо сделать на них сплошные поверхности из гидрофобных групп (см. Рис.19-6); и как заставить эти белки не агрегировать: надо сделать противоположные поверхности этих a- и b-структур из гидрофильных групп. Но вот для чего рецептов пока никто не сделал ≈ это для создания плотной упаковки боковых групп в гидрофобном ядре белка. Вот эта-то упаковка и не получается. А без нее ≈ при наличии слипающихся, но не плотно слипающихся вторичных структур, ≈ получается лишь расплавленная глобула…
Однако, по-видимому, задача дизайна плотной упаковки может быть решена. Имея хороший алгоритм компьютерного перебора астрономического числа возможных упаковок боковых групп и отсечения бесперспективных вариантов, расчет плотной упаковки ≈ для маленького белка ≈ может быть проведен. По крайней мере, Дахийат и Майо его провели и создали ≈ в 97 г. ≈ твердый (без всякого дополнительного комплексообразования с ионом) маленький белок (Рис.19-16). Этот белок был создан на основе архитектуры «цинкового пальца» (широко распространенного ДНК-связывающего мотива), ≈ но без иона Zn, держащего архитектуру природного цинкового пальца. При этом искусственный белок FSD-1 Дахийата и Майо имеет очень невысокую (20%) гомологию с природным цинковым пальцем, ≈ и лишен цинк-связывающего центра. И тем не менее он тверд при низких температурах (его структура исследована при помощи ЯМР). Однако он плавится в довольно широком температурном диапазоне, т.е. заметно менее кооперативно (Рис.19-16г), чем аналогичные ему природные белки.

в г

Рис.19-16. (а) Структура исходного «цинкового пальца» (второго модуля белка Zif268); ион Zn показан шариком. (б) Структура искусственного белка FSD-1. (в) Спектр КД для FSD-1 при 1оС. (г) Изменение спектра КД искусственного FSD-1 с температурой. Картинки взяты из B.I.Dahiyat & S.L.Mayo, Science (1997) 278:82-86.

Кроме белков, основанных на природных архитектурах, конструируются искусственные белки, чьи архитектуры не имеют природных аналогов.
В основу искусственного белка альбебетина (Рис.19-17а) положена структура, не обнаруженная еще в природе. Она состоит из двух повторов типа a-b-b (поэтому белок и назван альбебетином), и она не противоречит общим принципам формирования структуры глобулярных белков. Вместе с О.Б.Птицыным, я занимался дизайном альбебетина, а получение и исследование этого белка и его вариантов велось А.Н.Федоровым здесь, в Институте белка, и Д.А.Долгих в группе М.П.Кирпичникова.

Рис.19-17. Конструируемая пространственная структура альбебетина (а) и схема экспериментально определенной пространственной структуры рибосомального белка S6 (б). Внизу показаны схемы топологий этих белков. Для S6 показана также искусственно введенная пермутация ≈ разрезание петли () и соединение исходных N- и С-концов ( N≈C ). Такая пермутация придает ему архитектуру, сконструированную для альбебетина.

Структурное исследование альбебетина показало, что он обладает заданной вторичной структурой (Рис.19-18а) и компактной, весьма стабильной к разворачиванию мочевиной и к протеолизу пространственной структурой. Однако он кооперативно не плавится и находится скорее в состоянии расплавленной глобулы, чем в твердом.

а б

Рис.19-18. (а) Спектр КД альбебетина () и альбеферона (); (б) кривая микрокалориметрического плавления пермутированного, с целью придания ему топологии альбебетина, белка S6. Картинки взяты из D.A.Dolgikh, A.E.Gabrielian, V.N.Uversky & M.P.Kirpichnikov, Appl. Biochem. & Biotech. (1996) 61:85-96, и из Z.Kh.Abdullaev, R.F.Latypov, A.Ya.Badretdinov, D.A.Dolgikh, A.V.Finkelstein, V.N.Uversky & M.P.Kirpichnikov, FEBS Letters (1997) 414:243-246, соответственно.

Еще один белок со структурой, запланированной для альбебетина, был получен другим методом, ≈ при помощи циркулярной пермутации природного белка S6 (он, как и ряд других белков с недавно расшифрованной пространственной структурой, имеет ту же укладку структурных сегментов, что была разработана для альбебетина, но эти сегменты по-иному соединены белковой цепью, см. Рис.19-17б). Полученный белок обладает твердой, кооперативно плавящейся пространственной структурой (Рис.19-18б).
Недавно альбебетин был использован в качестве носителя функциональной активности. В него ≈ точнее, в новый белок, названый альбефероном ≈ был включен фрагмент 131-138 цепи интерферона a2 человека, способный активировать бласт-трансформацию тимоцитов. Собственно говоря, активацию делает именно это фрагмент интерферона, а остальная, уложенная в глобулу цепь этого белка служит как бы ножнами, ≈ она защищает фрагмент 131-138 от раскусывания и не дает ему действовать слишком уж активно. Опыты показали, что так же работает и альбеферон.

Работы по функционально-активным искусственным белкам ведутся во многих группах. Создаются модели фибриллярных белков на основе длинных спиральных пучков. Создана первая «работающая» модель мембранного белка из амфифильных (гидрофобно-гидрофильных) спиралей, ≈ эти спирали образуют ионные каналы, причем точечные мутации способны резко менять их селективность. Дали функциональный «белок» и a-спиральные полипептиды, химически пришитые к гему.
В общем, в настоящее время белки стремительно превращаются из объекта почтительного и изумленного наблюдения в предмет активной инженерной деятельности (но изумление остается…).

ПРОСТРАНСТВЕННОЕ СТРОЕНИЕ БЕЛКОВ 8

Автор:mb. Дата:Июль 8, 2011

Сегодня мы продолжим разговор о самоорганизации белков.

Все экспериментальные данные, о которых я рассказывал, ≈ сколь бы интересны они ни были сами по себе ≈ не дают ответа на вопрос, как белок ухитряется найти свою нативную структуру ≈ среди астрономического числа возможных! ≈ за те немногие секунды или доли секунды, что отпущены на его сворачивание.
А число это ≈ как я говорил, его оценил в еще 1968 г. Сайрус Левинталь ≈ действительно огромно: ~10100 возможных конформаций для цепи из 100 остатков; их «тупой» перебор занял бы ~1080 лет ≈ кладя всего 10-13 секунды на переход из одной конформации в другую.
Как же белок выбирает свою нативную структуру среди бесчисленного множества возможных? ≈ спросил Левинталь, и ответил: ≈ По-видимому, самоорганизующийся белок следует по какому-то специальному «пути сворачивания», и та структура, где этот путь заканчивается, и является его нативной структурой. Иными словами, Левинталь предположил, что нативная структура белка определяется не стабильностью, не термодинамикой, а кинетикой, т.е. она соответствует не глобальному, а просто быстро достижимому минимуму свободной энергии цепи.
Сложность проблемы заключается в том, что поднятый вопрос нельзя решить чисто экспериментально. Действительно: предположим, у белковой цепи есть другая, «ненанивная», но еще более стабильная укладка. Как ее найти, если сам белок ее не находит? Ждать результата в течение 1080 лет?!
С другой стороны, вопрос о том, что ≈ кинетика или термодинамика ≈ определяет укладку белковой цепи, постоянно возникает на пути решения разных прикладных задач. Он возникает, когда речь идет о предсказании структуры белка по его аминокислотной последовательности (надо знать, что предсказывать: самую стабильную или самую быстро сворачивающуюся его структуру). Он возникает и тогда, когда речь идет о дизайне новых, не встречающихся в природе белков (надо знать, что делать: максимально усиливать стабильность желаемой структуры или пролагать максимально быстрый путь к ней).

Однако действительно ли существует противоречие между «структурой стабильной» и «структурой быстро сворачивающейся»? Может быть, стабильная структура автоматически обладает свойством сворачиваться быстро?

Прежде, чем приступить к исследованию этих вопросов, т.е. прежде чем рассматривать кинетические аспекты сворачивания белков, вспомним ряд фундаментальных фактов из области их термодинамики (здесь всюду речь идет об относительно небольших, однодоменных белках, т.е. о белках из 50≈200 аминокислотных остатков). Эти факты помогут нам понять, какие условия протекания процесса сворачивания мы должны рассматривать. Термодинамические факты таковы:
1) Разворачивание белка обратимо, причем оно происходит как переход «все-или-ничего». Последнее означает, что в точке денатурации белка только две формы белковой молекулы ≈ «нативная» и «денатурированная» ≈ присутствуют в заметных количествах, а все прочие («полусвернутые» и «неверно свернутые» формы) практически отсутствуют.
2) Денатурированная форма белков ≈ во всяком случае, небольших белков, развернутых денатурантом, ≈ часто является неупорядоченным клубком.
3) В нормальных физиологических условиях нативная форма белка лишь немногим стабильнее его развернутой формы (а в самй точке плавления обе эти формы имеют, естественно, одинаковую стабильность). При этом нативная структура белка стабильна благодаря своей низкой энергии, т.е. благодаря сильным взаимодействиям в нативной структуре, а развернутая, ≈ благодаря своей высокой конформационной энтропии, т.е. благодаря огромному числу разных развернутых конформаций. [Необходимое пояснение: как принято в литературе, термин "энергия" здесь означает, строго говоря, всю свободную энергию взаимодействий, в том числе взаимодействий цепи с растворителем (например, "энергия" гидрофобных взаимодействий определяется, как вы должны помнить, энтропией растворителя); термин же "энтропия" здесь охватывает лишь конформационную энтропию цепи, но не энтропию растворителя. Такая терминология принята, чтобы, оставив растворитель за скобками, сосредоточиться на главной проблеме, ≈ как белковая цепь находит "свою" пространственную структуру среди гигантского числа возможных.]

Итак, чтобы разрешить «парадокс Левинталя» и показать, что самую стабильную структуру белковой цепи можно найти за разумное время, мы можем рассматривать только скорость сворачивания этой структуры цепи вблизи точки ее термодинамического перехода, причем перехода типа «все-или-ничего», в клубок («клубок» ≈ это сумма всех развернутых конформаций белковой цепи). Иными словами, нам достаточно рассмотреть случай, когда самая стабильная укладка цепи лишь чуть-чуть более стабильна, чем клубок, а все прочие формы белковой цепи термодинамически нестабильны. В окрестности этой точки рассматривать сворачивание белка наиболее просто, т.к. здесь нет стабильных интермедиатов сворачивания. Такие интермедиаты, как о том говорилось на прошлой лекции, появляются лишь тогда, когда нативная структура становится много стабильнее клубка. При этом сворачивание белка достигает максимальной скорости, но его анализ усложняется. Поэтому мы ограничимся окрестностью точки равновесия нативной структуры с клубком, где белок сворачивается пусть не максимально быстро, но максимально просто. Причем мы должны рассматривать только такие аминокислотные последовательности, которые обеспечивают наличие большой «щели» между энергией самой стабильной структуры цепи и энергиями всех прочих ее укладок (Рис.18-1): как вы помните, статистическая физика гетерополимеров показывает, что фазовый, типа «все-или-ничего» распад нативной глобулы требует наличия такой щели.

Рис.18-1. Грубое схематическое изображение энергетического ландшафта белковой цепи: на рисунке мы можем изобразить только две координаты (q1 и q2), описывающих конформацию цепи, тогда как реальная конформация белковой цепи описывается сотнями координат. Широкая щель между глобальным энергетическим минимумом и прочими энергетическими минимумами необходима для того, чтобы стабильная укладка цепи разрушалась бы только путем термодинамического перехода типа «все-или-ничего»; это, в свою очередь, обеспечивает надежность функционирования белка, ≈ по принципу «все-или-ничего», как у электрической лампочки.

Я собираюсь показать, что при таких условиях самая стабильная структура небольшого белка или домена автоматически становится центром «быстрых» путей сворачивания, и потому должна сворачиваться за биологически разумное время ≈ секунды или минуты.

Для того чтобы доказать, что самая стабильная белковая структура должна сворачиваться быстро, достаточно показать, что к ней всегда ведет по крайней мере один «быстрый» путь сворачивания. Наличие не одного, а многих путей сворачивания может только ускорить процесс. Напомню, что, в рассматриваемых нами условиях, ≈ вблизи точки термодинамического перехода типа «все-или-ничего» между самой стабильной структурой цепи и клубком, ≈ никакие другие («полусвернутые») состояния не могут служить ловушками: они не могут «впитать» сворачивающиеся цепи просто в силу малости своей суммарной стабильности. Полезная аналогия здесь, ≈ просачивание воды через трещины в стенке, разделяющей два бассейна: если «емкость» трещин мала, т.е. они не способны впитать всю воду, то каждая новая трещина в стенке может только ускорить наполнение второго бассейна, ≈ так что, рассмотрев просачивание воды через одну трещину, мы оценим минимальную скорость его наполнения.
Чтобы путь был быстр, каждый шаг на этом пути должен проходиться быстро, таких шагов должно быть не слишком много, и ≈ главное! ≈ этот путь не должен преграждаться «барьером» в виде высокой свободной энергии на одной из стадий сворачивания.

Так как время фиксации одного звена мал (~1 нс., судя по измеренной скорости роста a-спиралей в белковых цепях), ≈ то белок, фиксируя одно свое звено за другим, сворачивался бы мгновенно (100-звенная цепь ≈ за ~100 нс.), если бы при этом он не должен был преодолевать свободно-энергетический барьер.
Итак: главный вопрос, на который надо ответить ≈ высок ли барьер на пути, ведущем к самому стабильному состоянию белковой цепи?
Сворачивание белковой цепи ведет к падению ее энтропии (из-за роста упорядоченности цепи) и энергии (из-за образования в цепи контактов между сближающимися звеньями). Падение энтропии повышает, а падение энергии понижает свободную энергию цепи. Если, по ходу сворачивания, цепь должна очень близко подойти к своей финальной структуре перед тем, как начнут возникать стабилизирующие эту структуру контакты (т.е. цепь должна потерять почти всю свою энтропию перед тем, как начнет выигрываться энергия), ≈ то повышение свободной энергии на первом этапе сворачивания будет пропорциональным числу звеньев в цепи, т.е. очень большим, а сворачивание цепи ≈ страшно медленным (как вы помните, ≈ согласно химической кинетике, время протекания процесса экспоненциально зависит от достигаемого по его ходу максимального повышения свободной энергии). Именно такая картина (проигрыш всей энтропии до начала выигрыша энергии) лежит в основе «парадокса Левинталя», утверждающего, что белковая цепь никак не может ≈ даже за время жизни Вселенной ≈ найти свою самую стабильную структуру.
Напротив, если путь сворачивания таков, что по ходу его падение энтропии практически тут же компенсируется падением энергии, ≈ то он не перекрыт высоким свободно-энергетическим барьером, и сворачивание идет быстро. Именно такая картина, как мы убедимся, и имеет место.

При наличии барьера характерное время протекания процесса оценивается, исходя из классической теории переходного состояния, как
ВРЕМЯ ~ t / exp(-F#/RT) . (18.1)

Здесь t ~ 1 нс. ≈ характерное время одного шага процесса сворачивания белка, Т ≈ абсолютная температура, R ≈ газовая постоянная, а F# ≈ высота максимума свободной энергии на пути сворачивания (иными словами, свободной энергии перехдного состояния) относительно свободной энергии исходного (клубкового) состояния цепи.

Рассмотрим изменение энергии DE, энтропии DS и результирующей свободной энергии DF = DE – TDS по ходу изображенного на Рис.18-2 последовательного сворачивания белка. На каждом шаге этого пути одно звено цепи извлекается из клубка и занимает то положение, в котором оно находится в финальной (самой стабильной) структуре глобулы. Такой процесс может показаться несколько искусственным (откуда звено знает свое место в финальной структуре?). Однако это впечатление исчезает, если заметить, что мы таким образом просто просматриваем «кино» распада стабильной структуры белка в обратном направлении. То есть такой путь сворачивания есть ≈ среди множества других путей сворачивания. И как мы уже договорились, ≈ для минимальной оценки скорости сворачивания, достаточно оценить скорость сворачивания по одному пути.

Рис.18-2. Один из возможных путей последовательного сворачивания белка. Пунктиром показана цепь, остающаяся в неупорядоченном состоянии ≈ «клубке». Выделенная точками область соответствует уже обретшей свою финальную конформацию части белковой глобулы. Жирной линией выделена главная цепь уже свернувшейся глобулы, а ее боковые группы не показаны для упрощения рисунка. Все промежуточные состояния имеют высокую свободную энергию и потому не накапливаются при сворачивании и не могут наблюдаться непосредственно.

По мере роста куска финальной глобулы при ее последовательном сворачивании, ≈ в ней одно за другим восстанавливаются взаимодействия, стабилизирующие финальную структуру. Если растущая структура все время остается более или менее компактной (а именно такого типа пути сворачивания, с изображенными на Рис.18-2 компактными интермедиатами, нас и должны интересовать), то число этих взаимодействий будет расти (а их энергия, соответственно, будет падать) почти пропорционально числу n фиксируемых в глобуле звеньев (Рис.18-3а).

Рис.18-3. Изменение энергии DE (а), энтропии DS (б) и свободной энергии DF=DE-TDS (в) цепи по мере последовательного сворачивания белка (n=0: клубок; n=N: финальная структура) вблизи точки термодинамического равновесия между финальной структурой и клубком. Тонкой линией показана линейная (по n) часть изменения DE(n), DS(n) и DF(n). Полное изменение DE(N) и DS(N) примерно пропорционально N, т.е. числу звеньев в цепи, а максимальное отклонение показанных жирной линией величин DE(n) и DS(n) от линейного (по n) хода относительно мал, ≈ оно пропорционально всего N 2/3. В результате, так DF(N) и, вместе с ней, линейная часть DF(n) = DE(n) – TDS(n) очень мала вблизи точки равновесия, ≈ то DF#, максимальная величина свободной энергии на пути сворачивания, также пропорциональна всего N 2/3.

Правда, в начале сворачивания падение энергии несколько замедлено, так как прилипание звена к поверхности маленькой глобулы дает, в среднем, меньше контактов, чем прилипание к поверхности большой. В результате, возникает нелинейный поверхностный (т.е. пропорциональный n2/3) член в энергии DE растущей глобулы. Таким образом, максимальное отклонение от линейного падения энергии составляет величину порядка N 2/3, где N ≈ число звеньев в белковой цепи. Это отклонение, очевидно, мало по сравнению с полным падением энергии при сворачивании цепи, которое составляет величину порядка N (точнее ≈ порядка Ne, где e ≈среднее изменение энергии остатка при его переходе из клубка в нативную глобулу).
Во-вторых, по ходу роста глобулы падает энтропия цепи ≈ примерно пропорционально числу фиксированных в глобуле звеньев (Рис.18-3б). Правда, в начале сворачивания энтропия может падать несколько быстрее из-за образования замкнутых петель, свободно торчащих из растущей глобулы (Рис.18-4). В результате, возникает нелинейный (поверхностный) член в энтропии DS этой растущей глобулы, составляющий (так же, как поверхностный член в DE) величину порядка N 2/3, ≈ что существенно меньше, чем само падение энтропии, составляющее (как и падение энергии) величину порядка N.

Рис.18-4. (а) Компактный интермедиат сворачивания белка с торчащими из него неупорядоченными петлями. Рост интермедиата соответствует смещению границы между фиксированной (глобулярной) и неупорядоченной (клубковой) частями белковой цепи. Успешное сворачивание интермедиата требует правильной заузленности петель в нем: полусвернутая структура с неправильным заузливанием (б) не может прорасти до правильно свернутого белка, ей сперва надо развернуться. Однако в цепи из ~100 звеньев может сформироваться лишь один-два узла, так что перебор интермедиатов с разной заузленностью петель не должен лимитировать скорость сворачивания белков.

Входящие в энтропию DS и энергию DE линейные и нелинейные члены должны войти и в свободную энергию DF=DE-TDS растущей глобулы. Однако, когда мы рассматриваем условия, в которых финальная глобула находится в термодинамическом равновесии с клубком (или почти в равновесии ≈ скажем, когда она всего на пару RT стабильнее клубка), ≈ то в разности DE-TDS большие (пропорциональные n) линейные члены взаимно аннигилируют. В самом деле, в самой точке равновесия DF=0 и в клубке (т.е. при n=0), и в финальной глобуле (т.е. при n=N). Значит, рост энтропии и падение энергии при последовательном сворачивании компенсируют друг друга в главном (линейном по длине свернутой цепи n) члене и, не будь поверхностных эффектов, DF было бы равно 0 на всем рассматриваемом пути сворачивания!

Следовательно, свободно-энергетический барьер связан только с относительно малыми нелинейными поверхностными эффектами. Значит, высота барьера на любом пути последовательного сворачивания (типа того, что изображен на Рис.18-2) пропорциональна не числу звеньев N (как то, фактически, полагал Левинталь), а всего лишь N 2/3 (Рис.18-3в).
В результате время достижения самой стабильной структуры растет с числом звеньев цепи N не «по Левинталю» (т.е. не как 10N и вообще не как экспонента от N), а всего лишь как exp(lN 2/3), ≈ причем здесь наиболее важно то, что N 2/3 существенно меньше, чем N. В то же время тщательная оценка коэффициента l показывает, что l=1╠0.5, причем конкретная величина l зависит как от формы укладки цепи в глобулу, так и от распределения сильно и слабо притягивающихся аминокислотных остатков в ней.
Причина того, что самая стабильная структура белка достигается всего за
ВРЕМЯ ~ exp(N 2/3) наносекунд , (18.2)

≈ в том, что падение энтропии по ходу последовательного сворачивания почти тут же компенсируется энергией возникающих взаимодействий.

Отметим, что на рассмотренном нами пути глобулярный зародыш белковой структуры не перестраивается по ходу сворачивания (на что потребовалось бы гигантское время), а все перестройки происходят только в рыхлом клубке (и потому ≈ быстро).

Примечание. Не следует забывать, что мы рассмотрели сейчас только один из возможных сценариев сворачивания, и что не исключено, что рассмотрение других путей сворачивания белка может существенно понизить (но никак не повысить!) оценку времени его сворачивания, даваемую формулой (18.2). Кроме того, наша оценка относится к точке термодинамического равновесия клубка и нативной структуры белка, где экспериментально наблюдаемое время сворачивания этой структуры максимально, ≈ оно может превосходить время сворачивания в нативных условиях на несколько порядков (см. ниже, Рис.18-6). Поэтому оценка (18.2) носит не столько количественный, сколько принципиальный характер, ≈ она решает парадокс Левинталя и объясняет, почему белковая цепь может найти свою самую стабильную структуру не за астрономически огромное, а за биологически-разумное время.

Как бы то ни было, полученная оценка показывает, что цепь из 100 ≈ 150 аминокислотных остатков должна находить свою самую стабильную структуру за секунды или минуты. Она объясняет также, почему большие белки состоят (согласно старому принципу «разделяй и властвуй») из отдельно сворачивающихся стабильных доменов ≈ или, как теперь говорят в данном случае, «фолдонов» (от слова «fold» ≈ «укладка»): иначе их сворачивание было бы слишком медленным.

Для очень длинных цепей, состоящих из многих тысяч звеньев, лимитирующим фактором мог бы стать «квази-Левинталевский» перебор по-разному заузленных интермедиатов ≈ ведь узел в петле (ср. Рис.18-4а и 18-4б) нельзя распустить, не разрушив глобулярную часть интермедиата. Однако столь больших белков в природе нет (может быть, «потому и нет»), а в доменах ≈ цепях из сотни-другой звеньев ≈ много узлов быть не может (компьютерные эксперименты показали, для образования одного узла нужно порядка сотни звеньев цепи), так что перебор по-разному заузленных конформаций увеличит время достижения стабильной структуры домена всего в несколько раз.

До сих пор мы рассматривали сворачивание белковой цепи вблизи точки фазового перехода, когда только одна («нативная») ее структура сравнима по стабильности с клубком, а все прочие, даже взятые вместе, нестабильны (Рис.18-5а).

Рис.18-5. Сворачивание белка при разных условиях. Тонкие линии показывают уровни свободной энергии клубка (U), самой стабильной («нативной») укладки цепи (N), и прочих («misfolded», конкурирующих с самой стабильной) глобулярных структур (М). Точечные пунктирные линии показывают изменение свободной энергии по ходу сворачивания. Относительно небольшая их шероховатость (см. график DF на Рис.18-3) на данном рисунке не показана. Высшие точки этих пунктирных линий соответствуют свободным энергиям переходных состояний на соответствующих путях сворачивания. Основные сценарии процесса сворачивания: (а) Самая стабильная структура цепи N стабильнее клубка U, а все конкурирующие с ней структуры M в сумме менее стабильны, чем клубок. Быстрое и безошибочное сворачивание самой стабильной структуры. (б) Помимо структуры N, многие свернутые структуры M более стабильны, чем клубок U. Идет быстрое сворачивание многих «неправильных» структур с их последующим, очень медленным частичным разворачиванием и переходом в нативную структуру N. Стрелки показывают главное русло процесса самоорганизации стабильной пространственной структуры белка.

Что произойдет со скоростью самоорганизации цепи при удалении от точки фазового перехода? Нас, естественно, интересует случай, когда стабильность нативной структуры растет (когда ее стабильность падает ≈ эта структура просто не образуется).
Рост стабильности нативной глобулы (например, при понижении температуры или при разбавлении раствора денатуранта водой) приводит сперва к увеличению скорости достижения нативной структуры, так как свободная энергия интермедиатов ее сворачивания падает, а конкурирующие с нативной структурой укладки цепи все еще остаются нестабильными (Рис.18-5а). Такое ускорение, действительно, наблюдается (см. подъем графика на Рис.18-6, слева) ≈ до определенного предела (см. плечо графика на левом краю Рис.18-6). По-видимому, максимальная скорость сворачивания должна достигаться, когда конкурирующие с нативной структурой «неправильные» компактные укладки цепи (а их стабильность тоже растет при понижении температуры и разбавлении денатуранта) как раз сравниваются по стабильности с клубком.

Рис.18-6. Зависимость скорости ренатурации и денатурации белка (лизоцима куриного яйца) от концентрации гуанидингидрохлорида. Экспериментальные точки изображают величину kapp = ku╝N + kN╝u, видимой характерной скорости приближения к равновесию между нативной и развернутой формами белка. Заполненные кружки получены при разбавлении раствора GdmCl, в котором изначально находился денатурированный белок, т.е. при полной или частичной ренатурации белка. При этом kapp ╩ ku╝N. Пустые кружки получены при добавлении GdmCl к изначально нативному белку, т.е. при полной или частичной его денатурации. При этом kapp ╩ kN╝u. Пунктир показывает экстраполяцию величин ku╝N и kN╝u в области излома шеврона. Загиб обеих линий экспериментальных точек в нижней части графика (при ╩4.5 М GdmCl) соответствует области термодинамического равновесия нативной и развернутой форм белка. В этих условиях время ренатурации составляет ~104 сек, ≈ при том, что в «почти чистой» воде, при 0.6 М GdmCl (верхняя левая часть кривой), оно приближается к всего 0.1 сек. Картинка, с небольшими изменениями (добавлены экстраполяционные пунктиры) взята из T.Kiefhaber Proc. Natl. Acad. Sci. USA (1995) 92:9029-9033.

Область наиболее быстрого сворачивания исследовалась Шахновичем и его сотрудниками на простых компьютерных моделях белковых цепей. Эти работы как бы моделировали сворачивание белка в «нативных условиях». Они показали, что характерное время максимально быстрого сворачивания растет с длиной цепи много медленнее, чем то следует из формулы (18.2), оценивающей время сворачивания в точке термодинамического равновесия нативного и развернутого белка. А именно, компьютерный эксперимент показал, что время максимально быстрого сворачивания растет с числом звеньев цепи N вовсе не как exp(N 2/3), как то должно быть в точке равновесия, а как N 6 для «случайных» цепей и даже как N 4 для цепей, усиленно отобранных на предмет максимально быстрого сворачивания (и обладающих поэтому очень большой щелью между энергией самой стабильной структуры и энергиями прочих компактных укладок цепи).
Все это еще раз подчеркивает обсуждавшуюся на прошлой лекции сильную зависимость времени сворачивания белка от условий опыта, и прежде всего от стабильности нативной и конкурирующих с ней структур белка.

Продолжим качественное обсуждение изменения скорости сворачивания с повышением стабильности глобулярной структуры. Предположим, что изменение внешних условий (температуры или состава растворителя) повышает стабильность глобул ≈ всех глобул, «правильно» и «неправильно» свернутых, а на только нативной ≈ по сравнению с развернутым состоянием цепи.
Если первоначальный рост стабильности глобул относительно клубка ускоряет сворачивание самой стабильной структуры, так как ее стабильность растет, а ее конкуренты все еще остаются нестабильными относительно исходного, развернутого состояния цепи, ≈ то дальнейший рост стабильности глобул делает уже не одну только самую стабильную из них, но и многие из компактных, но «неправильно свернутых» форм более стабильными, чем развернутое состояние цепи (Рис.18-5б): появляются метастабильные «ловушки», способные удержать цепь и замедлить ее попадание в нативную структуру. При этом барьеры на путях, ведущих к некоторым «ловушкам», могут быть ниже, чем на путях, ведущих к самой стабильной структуре; тогда возможно быстрое скатывание к метастабильной структуре (или структурам) глобулы ≈ и очень медленный переход к истинно стабильной структуре.
Стоит отметить, что метастабильные «ловушки» перехватывают сворачивание к стабильной структуре тем эффективнее, чем меньше энергетическая щель между нативной структурой и прочими (метастабильными) укладками цепи. Это еще раз подчеркивает, что быстро находить свою стабильную структуру может только такая цепь, у которой стабильная пространственная структура возникает путем фазового перехода первого рода, ≈ т.е. цепь, у которой энергия ее самой стабильной укладки отделена достаточно большой щелью от энергий конкурирующих с ней структур.
Хочу отметить, что сходство термодинамики самоорганизации белков с фазовыми переходами первого рода экспериментально установлено в работах П.Л.Привалова, а сходство кинетических аспектов этих явлений ≈ в компьютерных экспериментах Е.И.Шахновича и А.М.Гутина.

Здесь у вас естественно возникает вопрос: ≈ Что будет, если у цепи не одна структура отделена от прочих большой энергетической щелью, ≈ а, скажем, две?
Ответ: ≈ Если обе эти структуры стабильны по сравнению с клубком ≈ первой из них свернется та, к которой идет лучший (с немного более низким барьером) путь сворачивания. Однако, если эта структура хоть немного менее стабильна, чем другая, ≈ последует очень медленный (так как по пути придется разворачивать метастабильную структуру, см. Рис.18-5б) переход в наиболее стабильную форму. Этот переход похож на полиморфные переходы в кристаллах (вспомним «оловянную болезнь» ≈ переход белого олова в серое: эта «болезнь» порой уничтожала, при наступлении холодов, целые склады оловянных пуговиц). По-видимому, таких «полиморфных» белков должно быть мало (теоретические оценки показывают, что аминокислотные последовательности, кодирующие одну выделенную стабильную укладку цепи, ≈ редки, а кодирующие сразу две такие укладки ≈ редки в квадрате).
Однако есть основания полагать, что некоторые белки ≈ серпины (есть такие ингибиторы сериновых протеаз) и, возможно, прионы (они вызывают «бешенство коров») ≈ ведут себя именно так. В последнем случае полиморфизм осложнен агрегацией (слипанием), ≈ агрегацией, которой способствует ≈ или которой наводится ≈ «новая», b-структурная форма белка. При агрегации растет эффективная длина цепи фолдона (N), что (согласно сделанным выше оценкам) делает возникновение новой фазы очень медленным. Но зато раз возникший зародыш новой формы агрегированного белка втягивает в агрегат и переводит в эту новую форму все остальные белковые молекулы (по существу ≈ так же, как при «оловянной чуме»). Эта-то агрегация прионов в клетках мозга и приводит в конце концов к летальному исходу при «коровьем бешенстве», почесухе и родственных им болезням с огромным инкубационным периодом. Говорят, к таким болезням относится и старческий маразм…
Впрочем, есть и более простой, «мирный» и хорошо изученный лабораторный пример того же рода: водорастворимый аминокислотный полимер поли(лизин) в пробирке, при рН<10 и температуре 20-50ОС, быстро (за миллисекунды) переходит из клубка в a-спираль, а потом ≈ гораздо медленнее ≈ из a-спирали в b-структуру. Последний переход сопровождается агрегацией и может занимать часы, недели и более, ≈ его время экспоненциально растет с падением стабильности b-структуры; об этом мы уже говорили, обсуждая кинетику образования b≈листов.

В заключение обратимся еще раз к энергетическому ландшафту белковой цепи (Рис.18-1) и посмотрим, как самая стабильная структура автоматически пролагает к себе быстрые, преодолевающие парадокс Левинталя пути сворачивания.
Через очень холмистый (скорее ≈ даже скалистый) ландшафт (Рис.18-1) от каждого энергетического минимума широко расходится «воронка» (или, точнее, сеть) более или менее гладких «дорожек», соответствующих разным путям последовательного (Рис.18-2) сворачивания структуры, соответствующей рассматриваемому минимуму. На всех этих путях не происходит перестройки уже свернувшейся части глобулы, и потому на них нет больших ухабов (а маленькие ≈ не помеха, если температура не слишком низка). Двигаясь по этим дорожкам к энергетическому минимуму, молекула выигрывает энергию, но, одновременно, фиксируя свою укладку, ≈ теряет энтропию (Рис.18-3). Чем глубже энергетический минимум ≈ тем круче ведущие к нему дорожки, тем легче преодолевать, идя по ним, «энтропийное сопротивление», возникающее при фиксации укладки скатывающейся в энергетический минимум цепи. Сила этого сопротивления ≈ поскольку оно энтропийное ≈ пропорциональна температуре. При очень высокой температуре оно выталкивает цепь из всех энергетических минимумов, так что цепь не сворачивается вообще. При очень низкой температуре энтропийное сопротивление мало ≈ цепь скатывается в любой ближайший минимум, долго из него выбирается, снова куда-то скатывается, ≈ и никак не может дойти до глобального энергетического минимума (Рис.18-5б). И, наконец, при оптимальной для сворачивания температуре ≈ энтропийное сопротивление преодолевается на путях только к одному, самому глубокому минимуму ≈ куда цепь и попадает достаточно быстро (Рис.18-5а).
Все изложенные соображения о компенсации энергией энтропии по пути самоорганизации и о том, что это решает парадокс Левинталя, применимы и к образованию нативной структуры белка из расплавленной глобулы. Но там сделать какие-либо количественные оценки гораздо сложнее. К тому же хочу подчеркнуть, что эксперимент не показывает принципиального, многопорядкового ускорения самоорганизации белка при образовании расплавленных глобул. Поэтому я и ограничился только более простым случаем образования нативной структуры прямо из клубка.

ПРОСТРАНСТВЕННОЕ СТРОЕНИЕ БЕЛКОВ 7

Автор:mb. Дата:Июль 8, 2011

Сегодня мы посмотрим, как протекает процесс обретения белковой цепью своей нативной структуры во времени, и обсудим кинетику самоорганизации белков. Я буду говорить только о водорастворимых глобулярных белках. Самоорганизация мембранных белков изучена еще сравнительно мало. Самоорганизация фибриллярных белков изучена лучше, но скорее не на физическом, а на биохимическом уровне (она уже обсуждалась на примере образования коллагена).

В живой клетке белок синтезируется на рибосоме. Биохимический синтез белковой цепи занимает порядка минуты, да и все изготовление «готового», свернутого белка, занимает примерно столько же ≈ эксперимент не видит разницы (для справки: весь жизненный цикл бактерии может длиться всего пару десятков минут). Поэтому естественно предположить, что сворачивание белка может начинаться еще на рибосоме, еще до окончания ее полного синтеза всей белковой цепи.
К сожалению, достоверные экспериментальные данные об образовании белковой структуры in vivo ≈ в клетке ≈ весьма скудны: очень трудно увидеть структурные превращения растущего белка на фоне всего клеточного супа. Обычно приходится останавливать синтез, выделять «недоделанный» белок, исследовать его отдельно ≈ на все уходит время, десятки минут, в течение которых пространственная структура исследуемой белковой цепи может кардинально измениться…
Ряд такого рода опытов с большими белками показывают, что их первые, N-концевые домены успевают (или, точнее, обладают способностью) свернуться еще до окончания полного синтеза цепи.
Здесь, однако, надо подчеркнуть, что все данные эти относятся к многодоменными белкам; это существенная оговорка, так как «единицей самоорганизации», по-видимому, является не белок в целом, а его отдельный домен.
Об этом свидетельствуют два ряда данных, полученных, правда, не in vivo, а in vitro: во-первых, отдельно взятые домены часто способны к правильной самоорганизации; во-вторых, однодоменный белок, лишенный примерно десятка аминокислот на своем С-конце, к самоорганизации не способен.

Ряд интересных данных по сворачиванию белков получен в бесклеточной белок-синтезирующей системе (т.е. не совсем in vivo, но и не совсем in vitro). Такая система состоит из рибосом, транспортных и информационных РНК и других факторов, необходимых для матричного синтеза белковой цепи.
К сожалению, и здесь очень трудно увидеть строение растущего белка на фоне громадной рибосомы. Строение, действительно, увидеть трудно. Но, если повезет, можно увидеть активность вновь синтезированного белка.
Счастливой находкой здесь оказалась люцифераза: этот белок, приняв свою нативную конформацию, катализирует реакцию с испусканием света. Так что появление нативной люциферазы легко увидеть ≈ ведь больше в клетке ничего не светится. Исследуя биосинтез и сворачивание этого белка, ≈ А.Н.Федоров, В.А.Колб, Е.В.Макеев и А.С.Спирин в нашем институте показали, что первый активный белок появляется через 10 мин. после включения его биосинтеза, а выключение, блокирование биосинтеза немедленно прекращает выход активного белка (Рис.17-1). Это значит, что цепей уже синтезированных, но еще не свернувшихся, практически нет ≈ то есть показывает, что сворачивание этого большого, содержащего свыше 500 остатков в цепи белка идет либо котрансляционно, либо почти мгновенно после конца биосинтеза.

Рис.17-1. Свечение нативной люциферазы, синтезируемой в бесклеточной системе. Время «0″ ≈ включение биосинтеза люциферазы. Время выключения биосинтеза указано стрелкой. Сразу после этого свечение прекращает свой рост, т.е. выход нового активного белка больше не наблюдается. Картинка взята из V.A.Kolb, E.V.Makeev & A.S.Spirin, EMBO J. (1994) 13:3631-3637.

Однако для выяснения не только результата, но и хода процесса самоорганизации приходится исследовать самоорганизацию белка «совсем in vitro» (без всяких рибосом, шаперонов и т.д.), ≈ то есть при ренатурации белка в растворе.
Глобулярный белок способен к спонтанной самоорганизации in vitro (ренатурации), если после биосинтеза он не подвергся сильной химической модификации. В этом случае его архитектура, «мягко» (без разрыва цепи) разрушенная температурой, растворителем и т.д., ≈ спонтанно восстанавливается при «нормализации» среды. Правда, эффективная ренатурация нуждается в тщательном подборе экспериментальных условий ≈ иначе ей может воспрепятствовать агрегация белка.
Явление спонтанной самоорганизации белков было открыто в группе Анфинсена в 1961 г. на бычьей рибонуклеазе А. Это открытие, впоследствии подтвержденное на множестве других белков, а также возможность чисто химического синтеза белковой цепи, спонтанно сворачивающейся далее в активный белок (опыты Меррифилда и др.), позволяет ≈ в первом приближении ≈ отделить изучение структурообразования белка от изучения биосинтеза белковой цепи.

Самоорганизация белка in vitro может рассматриваться как самый простой (и поэтому для меня, физика, наиболее интересный) случай «чистой» самоорганизации, когда белку не помогает никто.
Вообще, самоорганизация пространственных структур белков (а также РНК) ≈ уникальное физическое явление, не имеющее аналогов в «неживой» природе. Эта самоорганизация напоминает образование кристаллов, ≈ но кристаллов, во-первых, не имеющих периодической пространственной структуры; во-вторых, чрезвычайно сложно устроенных; и, наконец, очень маленьких.
Самоорганизация белковых структур относится, с физической точки зрения, к классу явлений «возникновение порядка из порядка» (по классификации Пригожина): трехмерный «апериодический кристалл» (говоря словами Шредингера) структуры белка порождается заранее фиксированным порядком звеньев в его цепи. Видимо, следует сразу отметить, что самоорганизация трехмерной структуры белков (и РНК, и кристаллов вообще) возникает из стремления молекул к термодинамическому равновесию ≈ и тем принципиально отличается от той самоорганизации типа «порядок из беспорядка» (будь то самоорганизация в осциллирующей химической реакции Белоусова-Жаботинского или самоорганизация в экологической системе «хищник-жертва»), которую обычно имеют в виду, говоря о самоорганизации в неравновесных, работающих на протоке энергии системах.

Однако прежде, чем перейти к рассказу о самоорганизации белка in vitro, к рассказу о физике этого спонтанного процесса, я хочу кратко упомянуть ту машинерию, которая используется клеткой для повышения эффективности самоорганизации белка.
Рибосома выдает белковую цепь постепенно и не вполне равномерно ≈ есть паузы, приостановки биосинтеза цепи; предполагается, что соответствие пауз границам структурных доменов способствует их спокойному, без вмешательства извне, созреванию.
Далее. В клетке белковая цепь сворачивается под опекой специальных белков ≈ шаперонов. «Малые» шапероны типа hsp70 (heat shock protein, 70 килодальтон) связываются с белком, предохраняя его от агрегации, а потом сбрасываются (на что расходуется АТФ). «Большие» шапероны типа GroEL и GroES или TriC работают в основном с многодоменными белками, и особенно ≈ с белками, чьи домены составлены из отдаленных кусков цепи. Эти шапероны образуют как бы пробирку (диаметром в несколько нанометров ≈ и с крышечкой!), куда поступает новосинтезированный (и предварительно облепленный шаперонами типа hsp70 и/или hsp40) белок или его домен. Эта «пробирка» (иногда ее называют «ячейкой Анфинсена») защищает новорожденный белок и от агрегации, и от действия концентрированного клеточного «супа». При этом пробирка «трясется» и время от времени активно открывается (на что расходуется АТФ) и закрывается, ≈ но отпускает она белок только тогда, когда он уже свернется и перестанет липнуть к пробирке.
Кроме того, самоорганизация белков может ускоряться некоторыми ферментами типа пролил-изомеразы (катализирующей медленно само по себе идущее превращение trans пролинов в cis и обратно) или дисульфид-изомеразы (катализирующей сшивание и расшивание SS связей).
Однако опыт показывает, что работа всей этой клеточной машинерии может быть заменена подбором соответствующих внешних условий (малой концентрации белка, нужного окислительно-восстановительного потенциала). Эта замена не меняет результат сворачивания: уж если белок не выпал в осадок, а свернулся in vitro ≈ то он свернулся в ту же структуру, что и in vivo. Правда, часто это займет больше (а иногда ≈ и меньше!) времени, чем самоорганизация in vivo, ≈ но результат будет тот же.
Все это показывает, что вся необходимая для построения трехмерной структуры белка информация содержится в химической последовательности аминокислот в его цепи.
Похоже, что ≈ помимо самого синтеза белковой цепи ≈ биосинтетический аппарат клетки (рибосома + шапероны + …) служит лишь чем-то вроде инкубатора для сворачивания пространственной структуры белка: этот «инкубатор» не определяет структуру белка, но он создает условия для ее созревания, ≈ так же, как обычный инкубатор обеспечивает выведение птенца, не предопределяя, кто выведется ≈ цыпленок или утенок.

Загадочность самоорганизации белков (и РНК) суммируется «парадоксом Левинталя». Загадка состоит вот в чем. У белковой цепи есть бездна возможных конформаций (каждый аминокислотный остаток имеет около 10 возможных конформаций, то есть цепь из 100 остатков ≈ порядка 10100 возможных конформаций). Так что белок должен искать «свою» пространственную структуру среди порядка 10100 возможных. И так как переход из одной конформации в другую занимает ~10-13 секунды как минимум, перебор всех 10100 структур должен был бы занять порядка 1080 лет, на фоне которых время жизни нашей Вселенной ≈ 1010 лет ≈ величина бесконечно малая… Вопрос: как белок может «найти» свою структуру за минуты?
Парадокс же заключается в следующем. С одной стороны, нативная пространственная структура по всем тестам ведет себя как самая стабильная из всех структур цепи: белковая цепь попадает в нее при разных кинетических процессах [и при сворачивании на рибосоме в процессе биосинтеза, и после секреции сквозь мембрану, и при сворачивании в пробирке (ренатурации), ≈ чем бы и как бы она ни была в этой пробирке развернута]. С другой стороны, нет никаких гарантий, что эта структура ≈ самая стабильная из всех возможных: у белковой цепи просто нет времени на то, чтобы убедиться в этом!
Как же белок выбирает свою нативную структуру среди бесчисленного множества возможных? ≈ спросил Левинталь, и ответил: ≈ По-видимому, самоорганизующийся белок следует по какому-то специальному «пути сворачивания», и та структура, где этот путь заканчивается, и является его нативной структурой. Иными словами, Левинталь предположил, что нативная структура белка определяется не стабильностью, не термодинамикой, а кинетикой, т.е. она соответствует не глобальному, а просто быстро достижимому минимуму свободной энергии цепи.
Вопрос о том, что именно ≈ кинетика или термодинамика ≈ определяет укладку белковой цепи ≈ отнюдь не чисто умозрительный. Он постоянно возникает на пути решения конкретных задач физики белка, ≈ идет ли речь о предсказании структуры белка по его аминокислотной последовательности (надо знать, что предсказывать: самую стабильную или самую быстро сворачивающуюся его структуру), или о дизайне новых, не встречающихся в природе белков (надо знать, что делать: максимально усиливать стабильность желаемой структуры или пролагать максимально быстрый путь к ней).

Обсуждение механизма сворачивания белков началось сразу же после расшифровки первых трехмерных структур и открытия явления самоорганизации. Первой, видимо, была гипотеза Филлипса, согласно которой на N-конце растущей цепи (с которого начинается биосинтез белка) возникает зародыш структуры, и остальная цепь наматывается на него. В той или иной форме такая точка зрения присутствует в ряде работ и по сей день. Однако она не подтвердилась. В изящных работах Гольденберга и Крейтона было показано, что N-конец цепи не играет решающей роли в самоорганизации in vitro. Замкнутая в кольцо цепь небольшого белка, ингибитора трипсина, сохраняет способность к самоорганизации; и даже если разрезать это кольцо так, что новым N-концом окажется бывшая середина цепи ≈ самоорганизация ведет к прежней пространственной структуре.

В поисках пути к решению проблемы самоорганизации белков, О.Б.Птицын в 1973 году предложил концепцию стадийного сворачивания белка (Рис.17-2). В рамках этой гипотезы, получившей позже название «framework model» («каркасной модели»), и проходило, в значительной мере, дальнейшее обсуждение проблемы самоорганизации белка в мировой научной литературе.

Рис.17-2. Стадийная модель сворачивания белка по О.Б.Птицину (1973). Выделены вторичные структуры ≈ a-спирали (цилиндры) и b-участки (стрелки).

Эта модель постулировала последовательное вовлечение различных взаимодействий в формирование структуры белка и подчеркивала важность образования зародышевых a-спиралей и b-шпилек на ранних стадиях сворачивания, слипания этих зародышей в глобулу, грубо напоминающую нативную, и окончательной «доводки» строения глобулы на последнем этапе самоорганизации.
Ключевым камнем этой концепции было то, тогда чисто гипотетическое, а теперь вошедшее в учебники состояние белковой цепи, которое ныне известно как «расплавленная глобула».
Выведенная буквально «на кончике пера», расплавленная белковая глобула была затем экспериментально обнаружена и детально исследована Долгих, Семисотновым, Гильманшиным и др. в лаборатории Птицына в 80-х годах, ≈ первоначально как равновесное состояние «слабоденатурированного» белка (об этом я говорил на прошлой лекции), а потом и как кинетический интермедиат сворачивания белка in vitro.
Так, расплавленная белковая глобула накапливается в процессе ренатурации карбоангидразы В (Рис.17-3). Видно, что «нативные» значения приведенной вязкости (характеризующей объем глобулы) и эллиптичности при 222 нм (характеризующей наличие вторичной структуры) восстанавливаются в процессе ренатурации значительно быстрее, чем эллиптичность при 270 нм (характеризующая упаковку боковых групп) или активность белка. Это говорит о существовании кинетического интермедиата, ≈ причем интермедиата, являющегося расплавленной глобулой: его компактность и вторичная структура близки к таковым для нативного белка, однако он не имеет нативной упаковки боковых групп и эстеразной активности нативного («твердого») белка.

Рис.17-3. Кинетика восстановления «степени нативности» fN в процессе ренатурации карбоангидразы В. Переход белка из полностью развернутого состояния (существовавшего при 5,45 М гуанидингидрохлорида) в нативное (при 0,97 М гуанидингидрохлорида) наблюдается по различным параметрам: приведенной вязкости , эллиптичности при 222 нм и 270 нм ( _______ ) и энзиматической активности (о о о). Картинка взята из D.A.Dolgikh, A.P.Kolomiets, I.A.Bolotina & O.B.Ptitsyn, FEBS Letters (1984) 164:88-92.

Расплавленная глобула оказывается ≈ в физиологических условиях ≈ ранним промежуточным состоянием на стартующем из клубка пути самоорганизации многих глобулярных белков in vitro. Для образования такого интермедиата достаточно миллисекунд, полное же восстановление свойств нативного белка из 100-300 аминокислотных остатков требует от секунд (для одних белков) до десятков минут (для других).
Необходимо подчеркнуть, что самый медленный (rate-limiting) шаг самоорганизации приходится не на раннюю стадию, не на образование расплавленной глобулы, а на образование из нее плотно упакованной, нативной глобулы (Рис.17-3).
Все описанные выше работы велись, как теперь говорят, в рамках «химической логики», императив которой ≈ «ищи и выделяй промежуточные состояния!». В химии это обычно позволяет понять, как протекает реакция. Но при изучении самоорганизации белков эта логика не сработала: интермедиаты были определены, но ключевые вопросы остались без ответа.

Тогда обратились к маленьким (из 50-100 остатков) белкам, сворачивающимся in vitro без наблюдаемых, «накапливающихся» в эксперименте интермедиатов, и начали исследовать их более интенсивно. И первая неожиданность, с которой здесь столкнулись, ≈ оказалось, что эти белки порой сворачиваются очень быстро ≈ много быстрее тех, наличие интермедиатов в сворачивании которых должно было, казалось бы, ускорить и облегчить их правильное сворачивание!
Обычно белки «однодоменного» размера сворачивались за секунды или десятки секунд, но некоторые из этих белков (правда, это были маленькие белки ≈ до 100 остатков длиной) сворачивались ≈ полностью, до нативной структуры, без наблюдаемых накапливающихся промежуточных структур ≈ за миллисекунды (Рис.17-4). Это регистрировалось по одинаковой скорости восстановления вторичной структуры, упаковки боковых групп, флюоресценции триптофанов (зависящей от их погруженности в глобулу), обмениваемости водородов в белке и т.д.

Рис.17-4. Ренатурация ACBP (белка, связывающего ацил-коэнзим А), регистрируемая по восстановлению эллиптичности при 225 нм (а) и 286 нм (б). Тонкая, ломаная линия ≈ экспериментальный сигнал, жирная кривая ≈ результат его сглаживания, с учетом погрешности опыта. Картинки взяты из Kragelund B.B., Robinson C.V., Knudsen J., Dobson C.M. & Poulsen F.M. Biochemistry (1995) 34: 7217-7224.

Однако, ≈ что в таких экспериментах можно исследовать, чтобы пролить свет на природу процесса самоорганизации? Ведь интермедиатов, которые можно выделить и изучать, тут нет?!
Ответ: здесь можно изучать переходное состояние ≈ состояние, играющее ключевую роль в кинетике процесса.

Напомню, что кинетика перехода между двумя непосредственно наблюдаемыми состояниями (А и В на Рис.17-5) успешно описывается теорией переходных состояний ≈ которая в химии обычно называется теорией активированных комплексов. Суть ее сводится к тому, что скорость процесса лимитируется переходным состоянием #, т.е. наименее (по термодинамике) вероятным (и потому не накапливающимся и непосредственно не наблюдаемым), но необходимым промежуточным состоянием пути из А в В, ≈ или, иными словами, что кинетика переходов А╝В (и В╝А) определяется высотой максимума свободной энергии на пути, соединяющем А и В.

Рис.17-5. Преодоление свободно-энергетического барьера # при переходе из состояния «А» в состояние «В» (стрелка слева) и из «В» в «А» (стрелка справа). FA, FВ и F# ≈ свободные энергии состояний А, В и «переходного» (барьерного, имеющего максимальную свободную энергию на пути процесса) состояния #.

При этом скорости перехода из А в В и из В в А суть
kА╝В = k0 exp[-(F#-FA)/RT]

kВ╝А = k0 exp[-(F#-FВ)/RT]. (17.1)

Здесь FA, FВ и F# ≈ свободные энергии состояний А, В и «переходного» # (Рис.17-5), а k0 ≈ быстрота «элементарного шага» процесса, за которую часто принимают частоту теплового колебания RT/h (где h ≈ постоянная Планка; при «обычных» температурах T~300oK, RT/h ~ 1013 сек-1), ≈ с такой частотой, под воздействием тепловых колебаний, молекула предпринимает попытки преодолеть активационный барьер #.
Уравнения (17.1) применимы только к процессам, протекающим за время, много-много большее, чем время элементарного шага. И именно с такими процессами мы имеем дело при сворачивании белков.
Напомню, откуда следуют соотношения (17.1). Рассмотрим процесс А ╚ # ╝ В. Так как «проток» молекул через барьер # идет медленно по сравнению со скоростью элементарного шага, то состояние # находится почти в термодинамическом равновесии с состоянием А. Иными словами, если в исходном состоянии А находится n молекул, то, по распределению Больцмана, в барьерном состоянии # находится n# = n exp[-(F#-FA)/RT] молекул. За время «элементарного шага» они скатятся с барьера # ≈ половина в сторону А, половина в сторону В [а на их место придет примерно столько же (n#) молекул со стороны А ≈ так что населенность # практически не изменится, будет квазистационарной]. Иначе говоря, для перехода половины всех n молекул через барьер в сторону В потребуется время, в (n/2)/(n#/2) = exp[+(F#-FA)/RT] раз превосходящее время элементарного шага. А поскольку время элементарного шага t0╨1/k0, то характерная скорость реакции А ╚ # ╝ В есть kА╝В = k0 exp[-(F#-FA)/RT], а ее характерное время, ≈ время, за которое около половины всех молекул перейдет из А в В, ≈ есть
tА╝В = 1/kА╝В = (1/k0) exp[+(F#-FA)/RT]. (17.2)

Это же объяснение распространяется, естественно, и на kВ╝А.
Важно, что температурная зависимость скорости реакции дает возможность судить об энергии переходного состояния. Для этого, согласно Аррениусу, вычисляют производную логарифма скорости реакции по обратной температуре (1/T):
d[ln(kА╝В)] / d(1/T) = d[ln(k0) - (F#-FA)/RT]/(-T-2dT) ╝ – (E#-EA)/R . (17.3)

Здесь я воспользовался уже известной нам формулой d(F/T)/dT = – E/T 2 и пренебрег очень слабой зависимостью скорости элементарного шага от температуры. Последнее допустимо даже в простых химических реакциях, и тем более допустимо в белках, где энергии E# и EA ≈ велики, так как определяются взаимодействиями множества частиц.

Рисунок 17-6 показывает изменение скорости сворачивания и разворачивания лизоцима при его тепловой ре- и денатурации.

Рис.17-6. Аррениусовы графики для зависимости скорости тепловой денатурации и ренатурации лизоцима от обратной температуры (Т-1); графики взяты из статьи S.Segava & S.Sugihara, Biochemistry (1984) 23:2473-2488. Константы скорости (k) измеряются в сек-1. Ренатурация, скорость ku╝N (эксперимент: точки о, и тонкая интерполяционная кривая); денатурация, скорость kN╝u (эксперимент: точки ╥, и жирная интерполяционная кривая). Середине плавления отвечает та температура, при которой ku╝N = kN╝u, т.е. где кривые пересекаются (около 1000/3.08 = 325оК). При меньших температурах (т.е. при больших Т-1 ≈ справа от точки пересечения) превалирует сворачивание, при больших температурах (т.е. при меньших Т-1, слева от точки пересечения) ≈ идет разворачивание.

Он показывает, что в самой середине перехода [там, где скорость сворачивания (ku╝N) равна скорости разворачивания (kN╝u), так что кривые для ln(ku╝N) и ln(kN╝u) пересекаются] ≈ скорости обоих процессов близки к е-2.5 ╩ 0.1 сек-1 (т.е. что здесь времена протекания и де-, и ренатурации ≈ порядка 10 сек).
Кроме того, эта картинка показывает, что денатурация ускоряется по мере углубления в «область денатурации», а ренатурация ускоряется по мере углубления в «область ренатурации». И здесь содержится одна очень любопытная вещь.
Она состоит в том, что скорость тепловой денатурации kN╝u падает с Т-1 (т.е. что она растет с температурой Т, что обычно для физико-химических реакций), а скорость сворачивания ku╝N ≈ наоборот, растет с Т-1 (т.е. она падает с температурой, что необычно для физико-химических реакций). По формуле (17.3) это означает, что E#-EN > 0, а E#-Eu < 0. Иначе говоря, Eu > E# > EN, т.е. энергия барьера, E#, лежит выше энергии нативного состояния, EN, но ниже энергии развернутого состояния, Eu (последнее необычно для химических реакций, где барьер по энергии выше чем и начальное, и конечное состояние реакции). Дальнейший анализ этого графика показывает, что такое же соотношение, Su > S# > SN, справедливо и для энтропий развернутого, переходного и нативного состояний при сворачивании белка. Это значит, что барьер между нативным и развернутым состояниями белка выглядит «обычным», энергетическим барьером, ≈ если глядеть на него со стороны нативного состояния, и что он выглядит необычным, энтропийным барьером, ≈ если глядеть на него со стороны развернутого состояния.
Впрочем, этого можно было ожидать, исходя из сделанного на прошлой лекции анализа свободно-энергетического барьера и причин фазового, типа «все-или-ничего» перехода между нативным и денатурированным состоянием белка (см. Рис.17-7, который воспроизводит уже известную вам схему изменения энергии, энтропии и свободной энергии по мере расширения глобулы).

Рис.17-7. Изменение энергии E, энтропии S и свободной энергии F=E-TS с изменением плотности глобулы. D ≈ денатурированное состояние (в данном случае ≈ расплавленная глобула, так как плотность его велика), N ≈ нативная глобула, # ≈ «барьер», максимум свободной энергии на пути равномерного расширения глобулы (от N к D).

Обратимся еще раз к уравнениям (17.1). Они показывают, что отношение скоростей прямой и обратной реакций, kА╝В/kВ╝А, есть просто константа равновесия между финальным (В) и начальным (А) состояниями
КВ:А = kА╝В/kВ╝А = exp[-(FВ-FA)/RT] . (17.4)

Величина константы равновесия КВ:А есть nB╔/nА╔, она показывает то соотношение между финальным числом nB╔ молекул в состоянии В и их финальным числом nA╔ в состоянии А, к которому, в конечном итоге (при стремящемся к бесконечности времени наблюдения), приходит процесс при данных условиях (температуре и т.д.).
С какой скоростью система приходит к этому равновесному состоянию? Для ответа решим соответствующее дифференциальное уравнение:
dnA/dt = – kА╝В nA + kB╝A nB (17.5)

(второе уравнение, для dnB/dt, писать не надо, т.к. nA+ nB ╨ n0, где n0 ≈ полное число молекул, т.е. dnВ/dt ╨ -dnА/dt). Ответ ≈ позвольте мне написать его без выкладок, а вам я рекомендую сделать их самостоятельно ≈ таков:
nA(t) = [nA(0) ≈ nА╔] exp[-(kА╝В + kB╝A)t] + nА╔ . (17.6)

Здесь nA(t) ≈ число молекул в состоянии А в момент времени t от начала процесса, а nА╔ = n0.[kВ╝А / (kА╝В + kВ╝А)] ≈ конечное, равновесное число молекул в состоянии А.
Значит, видимая (apparent) скорость приближения к равновесию есть
kapp = kА╝В + kВ╝А , ≈ (17.7)

она равна сумме скоростей прямой и обратной реакций. Обратите внимание, что эта скорость зависит только от условий, в которых протекает релаксация, и не зависит от исходного распределения белковых молекул между нативным и денатурированным состояниями [т.е. от исходной доли nA(0)].
В этой суммарной скорости kapp доминирует более быстрая реакция.
Если условия (температура и т.д.) отвечают большей устойчивости нативного состояния, ≈ то в kapp = ku╝N + kN╝u доминирует ku╝N, скорость сворачивания. Если более устойчиво денатурированное состояние, ≈ то в ku╝N + kN╝u доминирует kN╝u, скорость разворачивания.
Большим преимуществом измерения скорости прихода к равновесию, kapp, является то, что она всегда может быть измерена (в отличие от ku╝N и kN╝u в отдельности), ≈ как тогда, когда более стабильно нативное состояние, так и тогда, когда более стабильно денатурированное.
При измерении kapp строятся так называемые «шевронные графики» (Рис.17-8). Они так называются из-за своей характерной V-образной формы, напоминающей шевроны на военных кителях. Один взгляд на этот график показывает, что скорости сворачивания (ku╝N) и разворачивания (kN╝u) зависят от концентрации денатуранта противоположным образом. С аналогичной ситуацией мы уже сталкивались, когда изучали температурную зависимость скоростей сворачивания и разворачивания белка. Как и тогда, наблюдаемая здесь противоположность наклонов означает «промежуточность» свойств переходного состояния, их среднее положение между свойствами нативного и развернутого белка.

Рис.17-8. «Шевронный график» зависимости kapp = ku╝N + kN╝u, видимой характерной скорости приближения к равновесию между нативной и развернутой формами белка (лизоцима куриного яйца), от концентрации гуанидингидрохлорида. Заполненные кружки получены при разбавлении раствора GdmCl, в котором изначально находился денатурированный белок, т.е. при полной или частичной ренатурации белка. При этом kapp ╩ ku╝N. Пустые кружки получены при добавлении GdmCl к изначально нативному белку, т.е. при полной или частичной его денатурации. При этом kapp ╩ kN╝u. Пунктир показывает экстраполяцию величин ku╝N и kN╝u в области излома шеврона. Отклоняющиеся от экстраполяционной прямой точки в верхней левой части графика (т.е. вдали от точки излома, от точки денатурации белка) свидетельствуют либо о какой-то перестройке переходного состояния, либо о появлении каких-то дополнительных метастабильных интермедиатов (возможно, типа расплавленных глобул), которые могут лежать как на, так и вне основного пути сворачивания. Обратите внимание, что все эти перестройки и/или интермедиаты не повышают скорость сворачивания по сравнению с той, что можно было бы ожидать при неизменности переходного состояния: отклоняющиеся точки лежат ниже интерполяционной прямой. Картинка, с небольшими изменениями (добавлены экстраполяционные пунктиры) взята из T.Kiefhaber Proc. Natl. Acad. Sci. USA (1995) 92:9029-9033.

Действительно, то, что денатурант вообще разворачивает белок, показывает, что он сильнее притягивается к развернутому белку, чем к нативному. То, что денатурант замедляет сворачивание исходно развернутого белка (см. спад скорости в левой части Рис.17-8) показывает, что он сильнее притягивается к исходному, развернутому белку, чем к переходному состоянию; а то, что денатурант ускоряет разворачивание исходно нативного белка (см. подъем скорости в правой части Рис.17-8), ≈ показывает, что он сильнее притягивается к переходному состоянию, чем к исходному, нативному. Это означает, что контакт переходного состояния с денатурантом больше, чем у нативного белка, но меньше, чем у денатурированного. Иначе говоря, приведенный на Рис.17-8 шевронный график показывает, что переходное состояние по степени контакта с растворителем, т.е. по своей компактности находится где-то на полпути между развернутым и нативным состояниями белка. Этот график дает даже больше: так как наклон для kN╝u несколько меньше, чем для ku╝N, то компактность переходного состояния несколько ближе (в данном случае) к оной у нативного белка, чем у денатурированного.
Рисунок 17-8 относится к лизоциму ≈ белку, денатурация которого гуанидингидрохлоридом приводит прямо к образованию клубка, а не расплавленной глобулы. При умеренных концентрациях денатуранта (при не очень сильном его разбавлении водой) лизоцим сворачивается довольно медленно, за многие минуты. Однако при самоорганизации в почти чистой воде (происходящей при сильном разведении водой крепкого раствора гуанидингидрохлорида, где находились клубкообразные белковые цепи), скорость сворачивания лизоцима максимальна, ≈ и уже слабо зависит от остаточной концентрации денатуранта. При этом в сворачивании лизоцима появляется компактный метастабильный интермедиат типа расплавленной глобулы, ≈ интермедиат, который не наблюдается при повышенных концентрациях денатуранта. Появление компактных метастабильных интермедиатов сворачивания, вообще говоря, всегда «выполаживает» зависимость скорости сворачивания от содержания денатуранта ≈ см. левый край Рис.17-8. Известно, что ренатурация белка, стартующая не от клубка, а от расплавленной глобулы (например, ренатурация карбоксиангидразы), также демонстрирует довольно слабую зависимость скорости ренатурации от концентрации денатуранта. Последнее означает, что переходное состояние в таком сворачивании мало отличается от исходной расплавленной глобулы по компактности.

Иначе говоря, переходное состояние ≈ по «промежуточности» некоторых своих свойств между свойствами нативного и развернутого белка ≈ напоминает расплавленную глобулу. Но это не означает, что переходное ≈ подчеркнем, нестабильное ≈ состояние действительно похоже на расплавленную глобулу. Эксперимент показывает скорее, что переходное состояние можно представить себе (если речь идет о переходе «клубок ╝ нативный белок») как частично свернутый нативный белок, остальная часть которого все еще находится в денатурированном, клубкообразном состоянии. Вид переходного состояния для переходов типа «расплавленная глобула ╝ нативный белок» (или «клубок ╝ расплавленная глобула ╝ нативный белок») еще не установлен экспериментально, но весьма правдоподобно, что оно включает часть нативной глобулы, в то время как прочая цепь находится в состоянии расплавленной глобулы.

Природу переходного состояния удалось выяснить с помощью белковой инженерии. Применяя множество мутаций, и анализируя соответствующие им изменения в шевронных графиках (см. Рис.17-8, 17-9), удается ≈ ценой колоссального труда ≈ узнать, какие именно остатки вовлечены в «нативоподобную» часть переходного состояния, а какие ≈ нет. Этот метод был разработан А. Ферштом а Англии. Строго говоря, пока что он применяется только к белкам, денатурация которых приводит прямо к образованию клубка, а не расплавленной глобулы.

Рис.17-9. Схема, иллюстрирующая сдвиг «шевронного графика» при мутации. Жирная линия: исходный белок; тонкая ≈ мутант. Пунктир показывает экстраполяцию величин ku╝N и kN╝u в области излома шеврона. С0 ≈ концентрация денатуранта, соответствующая середине денатурационного перехода в исходном белке. На графике показаны измеряемые в этом опыте величины. Одна из них определяет влияние мутации на высоту свободно-энергетического барьера, стоящего на пути из развернутого состояния в нативное: D(F#-Fu) = -RTDln[ku╝N]. Вторая ≈ ее влияние на стабильность белка, т.е. на разность свободных энергий нативного и денатурированного состояний: D(FN-Fu) = -RTDln[ku╝N/kN╝u]. Показанные на графике величины относятся к концентрации денатуранта C0, где требующаяся экстраполяция минимальна (а потому минимальны и погрешности в ней), ≈ но, ценой несколько большей экстраполяции (до C0=0), так обычно определяются изменения в стабильности нативного белка, D(FN-Fu), и в высоте барьера, D(F#-Fu), относящиеся к чистой воде.

Для оценки вовлеченности остатка в переходное состояние (или, как говорят, в «зародыш» сворачивания белка), оценивают, по сдвигу шеврона, влияние мутации данного остатка на (а) скорость сворачивания белка и (б) на его стабильность. Измеряемые величины показаны на Рис.17-9.
Скорость сворачивания белка (перехода U╝N) определяется (см. формулу 17.1) разностью свободной энергии «зародыша» (#) и исходного развернутого (U) состояния белка (т.е. величиной F#-Fu).
Если мутация остатка так же влияет на величину F#-Fu, как она влияет на стабильность всего нативного состояния (т.е. на величину FN-Fu), ≈ то это свидетельствует о том, что рассматриваемый остаток так же вовлечен в «зародыш» (образует там те же контакты, имеет ту же конформацию и т.д.), как он вовлечен в нативную глобулу.
Если, наоборот, мутация остатка оказывает влияние только на стабильность белка (т.е. на величину FN-Fu), но не на скорость сворачивания (т.е. она не влияет на величину F#-Fu), ≈ значит, этот остаток не вовлекается в глобулярный «зародыш» сворачивания, т.е. что он входит в нативную белковую глобулу только уже после образования зародыша.
И, наконец, если мутация остатка сильно влияет на стабильность белка и слабее (но с тем же знаком) ≈ на стабильность зародыша, ≈ значит, этот остаток образует в зародыше только часть тех контактов, которые имеет в нативном белке.
Так очерчивается зародыш сворачивания белка (Рис.17-10): для каждого из мутированных остатков цепи вычисляется величина
Ff = D(F#-Fu)/D(FN-Fu) , ≈ (17.8)

и, если для данного остатка Ff близка к 1, ≈ то говорят, что он входит в зародыш структуры; а если Ff близка к 0 ≈ то нет.

Рис.17-10. Структура переходного состояния белка CheY, согласно T.Lpez-Hernndes & L.Serrano, Folding & Design (1996) 1:43-55. На фоне нативной укладки цепи CheY синими шариками выделены остатки, вовлеченные в переходное состояние (образующие там более 30% своих контактов), желтыми шариками ≈ не вовлеченные в переходное состояние остатки. Без шариков оставлены те области цепи, где мутации еще не делались. Красным закрашены остатки цепи, сложные для интерпретации, ≈ у них столь малы величины D(F#-Fu) и D(FN-Fu) (последнее важнее, так как эта величина стоит в знаменателе в формуле 17.8), что погрешности в их определении превышают сами эти величины.

Замечательно, что лишь очень малое число остатков в белке не удается проинтерпретировать с такой точки зрения (а с нее не удалось бы проинтерпретировать такие остатки, чьи Ff величины лежали бы вне интервала 0 ≈ 1, т.е. те остатки, мутации которых влияли бы только на скорость сворачивания, но не на стабильность нативной структуры; или те, что стабилизировали бы только зародыш, но дестабилизировали бы нативный белок, и т.д.).
Это вселяет уверенность в том, что базовая картина, согласно которой остатки ≈ уж если они вовлечены в зародыш ≈ стоят там так же, как в нативном белке, ≈ эта картина в основном справедлива.
Рисунок 17-10 показывает, что остатки, наиболее существенные для сворачивания белка, группируются в компактный «доменчик», компактное ядрышко сворачивания, причем оно лежит не в геометрическом центре белка, а сдвинуто к его поверхности. Аналогичная картина наблюдается и в других (впрочем, пока немногочисленных) белках, исследованных на предмет местоположения их ядер сворачивания.

В заключение я хочу вернуться к Рис.17-8 и подчеркнуть, что даже для совершенно конкретного белка не существует четко определенного «характерного времени сворачивания». Действительно, этот рисунок показывает, что сворачивание лизоцима занимает порядка 0.1 сек в нативных условиях, и порядка 10000 сек ≈ в условиях созданного гуанидингидрохлоридом (при той же температуре раствора) равновесия нативной и денатурированной форм. А в других условиях, при повышенной температуре, но без гуанидингидрохлорида, области равновесия этих форм отвечает (см. Рис.17-6) время сворачивания порядка 10 сек. Так что, обсуждая скорость сворачивания белка, мы должны иметь в виду либо весь наблюдаемый диапазон времен сворачивания данного белка, либо совершенно конкретные экспериментальные условия ≈ например, те условия, при которых белок сворачивается в клетке.

ПРОСТРАНСТВЕННОЕ СТРОЕНИЕ БЕЛКОВ 6

Автор:mb. Дата:Июль 8, 2011

Ранее мы рассматривали стабильность фиксированных, «твердых» белковых структур. Но ≈ при определенных внешних условиях ≈ самой стабильной может оказаться не твердая, а расплавленная или даже развернутая форма белковой молекулы. Тогда белок «денатурирует», теряет свою нативную, «рабочую» структуру.
Обычно денатурация белка наблюдается in vitro, при воздействии на него аномальной температуры или денатуранта [мочевины, H+ или OH≈ ионов (т.е. аномального рН) и т.д.]. Однако распад «твердой» структуры белка и затем ее повторная самоорганизация происходит и в живой клетке ≈ что играет важную роль, например, в процессе транспорта белков через мембраны.
Денатурация и ренатурация глобулярных белков in vitro ≈ объект интенсивных исследований, интерес к которым поддерживается их связью с проблемой самоорганизации белка, т.е. с вопросом о том, как белковая цепь находит свою уникальную структуру среди гигантского числа возможных альтернатив. Сегодня я практически не буду касаться кинетических аспектов денатурации и самоорганизации белков и сосредоточусь на термодинамических и структурных аспектах этих явлений.
Больше всего изучены водорастворимые глобулярные белки, и именно о них я буду рассказывать.

Что показывает эксперимент?
Твердо установлено, что денатурация малых белков является кооперативным переходом с одновременным и резким, «S-образным» изменением многих (хотя порой и не всех) характеристик молекулы (Рис.16-1). S-образность экспериментальных кривых показывает, что соответствующие характеристики молекулы меняются от тех, что характерны для нативного белка, до тех, что характерны для белка денатурированного; а узость этих S-образных кривых свидетельствует о кооперативности перехода, т.е. о том, что он охватывает сразу много аминокислотных остатков.

а б

Рис.16-1. Денатурация белка сопровождается резким, «S-образным» изменением многих характеристик молекулы. (а) Синхронное изменение КД () [длина волны ≈ 220 нм] и флуоресценции () при денатурации фосфоглицераткиназы в растворе гуанидингидрохлорида. (б) Электрофорез цитохрома с при разных концентрациях мочевины: замедление миграции вызвано разбуханием молекулы при денатурации. Картинки взяты из [6].

Более того: денатурация белка происходит как переход типа «все-или-ничего» (Рис.16-2).

Рис.16-2. Калориметрическое исследование тепловой денатурации лизоцима при разных рН. Положение пика удельной теплоемкости (Ср) определяет температуру T0, его ширина ≈ ширину перехода DT, площадь под пиком ≈ поглощенное при плавлении тепло DН в расчете на грамм белка. То, что они удовлетворяют условиям (16.4), (16.5), свидетельствует, что денатурация происходит как переход типа «все или ничего». Увеличенная теплоемкость денатурированного белка ≈ следствие увеличения поверхности контакта его гидрофобных боковых групп с водой при (частичном или полном) разворачивании белка. Картинка взята из P.L.Privalov & N.N.Khechinashvili, J. Mol. Biol. (1974) 86:665-684.

Последнее (вы должны это помнить) означает, что при таком переходе только начальное (нативное) и конечное (денатурированное) состояние наблюдаются в заметных количествах (Рис.16-3), а «полуденатурированных» молекул практически нет. [Хотя, конечно, они тоже должны быть, пусть в мизерном количестве, ≈ ведь не переходит же одно состояние в другое при помощи нуль-транспортировки; но наличие "полусвернутых" структур отражается только на кинетике перехода, разговор о которой еще впереди.] Иначе говоря, переход «все-или-ничего» является микроскопическим аналогом фазового перехода первого рода в макроскопических системах (например ≈ плавления кристалла). Однако ≈ в отличие от истинного фазового перехода ≈ S-образность перехода «все-или-ничего» имеет не нулевую, а конечную ширину, так как этот переход охватывает не макроскопическую, а микроскопическую, очень небольшую систему.

Рис.16-3. При одном и том же виде зависимости энергии Е (или другого наблюдаемого параметра) от температуры, кооперативный («S-образный») переход может быть и переходом типа «все-или-ничего» (пример: денатурация белка), и постепенным, «безродным» (пример: переход спираль-клубок в полипептидах). Различия проявляются не в виде кривой Е(Т), а в функции распределения W(E) молекул по энергии (или по другому наблюдаемому параметру). Пунктирные линии на левом рисунке поясняют графическое определение DT, температурной ширины перехода.

Как было экспериментально показано, что денатурация небольших белков подчиняется принципу «все-или-ничего» ≈ об этом чуть позже, а пока уместно уточнить, что денатурация типа «все-или-ничего» относится к небольшим глобулярным белкам и отдельным доменам крупных белков, а денатурация больших глобулярных белков, как показывают многочисленные опыты, слагается из плавления входящих в них доменов.

Может ли денатурированный белок ренатурировать и обрести свою нативную структуру? То есть ≈ обратима ли его денатурация?
Да (это известно со времен опытов Анфинсена в 60-х гг.; кстати, за них он получил Нобелевскую премию), ≈ если белок не слишком велик и не подвергался сильной химической модификации после сворачивания in vivo: тогда «мягко» (без разрыва цепи) разрушенная температурой, денатурантом и т.д. ≈ архитектура белка спонтанно восстанавливается при «нормализации» среды. Правда, эффективная ренатурация in vitro нуждается в тщательном подборе экспериментальных условий ≈ иначе ей может воспрепятствовать выпадение из раствора и/или агрегация (межмолекулярная, а для больших белков ≈ видимо, и внутримолекулярная агрегация отдаленных кусков цепи: известно, что способность к ренатурации и ее «выход» обычно падают, а экспериментальные сложности ≈ растут с увеличением размера белка).
Обратимость денатурации белка чрезвычайно важна: она показывает, что нативная структура белка (строго говоря: не модифицированного небольшого белка) ≈ равновесна и стабильна; и эта обратимость позволяет применять термодинамику для описания и изучения такого перехода.

Тот фундаментальный факт, что денатурация белка происходит как переход типа «все или ничего» был показан П.Л.Приваловым, работавшим в нашем Институте белка. Он изучал тепловую денатурацию белка, которая обычно сопровождается большим тепловым эффектом, ~1 ккал на моль аминокислотных остатков.

Как доказывается, что плавление белковой молекулы ≈ переход типа «все или ничего»? Для этого недостаточно показать существование пика теплоемкости (или, что есть то же самое, ≈ что энергия белка S-образно зависит от температуры). Все это свидетельствует только о резкости перехода, но ничего не говорит о том, плавится ли белок целиком или по частям. Чтобы доказать, что плавление белка ≈ переход типа «все или ничего», нужно сравнить (1) «эффективную теплоту» перехода, вычисляемую из его ширины, с (2) «калориметрической теплотой» этого перехода, т.е. с количеством тепла, поглощаемым одной молекулой белка в процессе плавления. Совпадение этих двух независимых величин показывает, что молекула плавится как единое целое.
Это и есть «критерий Вант-Гоффа» для наличия перехода типа «все или ничего». Ввиду его важности ≈ рассмотрим этот критерий внимательно.

«Эффективная теплота» перехода, следующая из его ширины, есть количество тепла, поглощенного одной независимой «единицей плавления». Если эффективная теплота перехода меньше калориметрической ≈ «единица плавления» меньше, чем сама молекула, т.е. молекула плавится по частям. Если эффективная теплота перехода больше калориметрической ≈ «единица плавления» больше молекулы, т.е. плавится не одна молекула белка, а какой-то их агрегат.
Как связана эффективная теплота перехода с его шириной? Рассмотрим «единицу плавления», которая может находиться в двух состояниях: «твердом», с энергией Е и энтропией S, и «расплавленном», с энергией Е’ и энтропией S’. Пусть, для простоты, E, Е’, S и S’ не зависят от температуры Т (рассмотрение более общего случая я предоставляю читателю…).
Так как состояний ≈ всего два, то из формулы Больцмана легко видеть, что вероятность пребывания «единицы плавления» в расплавленном состоянии есть
PРАСПЛ = exp[-(E'-TS')/kT] / { exp[-(E-TS)/kT] + exp[-(E'-TS')/kT] } =

1 / { exp[(DE-TDS)/kT] + 1 }, (16.1)

где DE=E’-E, DS=S’-S. Вероятность пребывания «единицы плавления» в твердом состоянии есть (для перехода «все-или-ничего») PТВ = 1-PРАСПЛ. Производная dPРАСПЛ/dT показывает, как быстро меняется PРАСПЛ с температурой. Простое вычисление (с использованием уже известной нам формулы d(F/T)/dT = d[(E-TS)/T]/dT = -E/T2) показывает, что
dPРАСПЛ/dT = PРАСПЛ (1-PРАСПЛ) (DE/kT2). (16.2)

Пожалуй, надо расписать здесь все преобразования подробнее, чтобы не принимать на веру, а понимать. Обозначим (DE-TDS)/kT через X. Тогда dX/dT = -DE/kT2, PРАСПЛ = 1/(eX+1), PТВ = 1-PРАСПЛ = eX/(eX+1), и

dPРАСПЛ/dT = d[1/(eX+1)]/dT = – [1/(eX+1)2] x [deX/dT] = – [1/(eX+1)2] x eX x [dX/dT] =

= – [1/(eX+1)] x [eX/(eX+1)] x [dX/dT] = PРАСПЛ (1-PРАСПЛ) x (-dX/dT) = PРАСПЛ (1-PРАСПЛ) (DE/kT2)

Точка середины перехода ≈ точка самого быстрого изменения PРАСПЛ, т.е. максимум производной dPРАСПЛ/dT ≈ падает на температуру Т0, где PРАСПЛ=PТВ = 1/2. В этой точке величина PРАСПЛ x (1-PРАСПЛ) проходит через максимум, равный 1/4. Здесь наклон кривой PРАСПЛ(Т) максимален и равен
(dPРАСПЛ/dT)|T=To = (1/4) DE/kT02. (16.3)

Графическое определение ширины перехода показано на Рис.16-3, слева. Оно делается путем линейной экстраполяции максимального наклона кривой PРАСПЛ(Т) до пересечения с базовыми прямыми, соответствующими нативному (PРАСПЛ=0) и денатурированному (PРАСПЛ=1) состояниям. В зоне перехода экстраполированная (пунктиром) величина PРАСПЛ |экстрап. меняется от 0 до 1 (то есть DPРАСПЛ |экстрап. = 1), а температура меняется на DT. Значит (dPРАСПЛ/dT)|T=To = DPРАСПЛ |экстрап./DT = 1/DТ, ≈ то есть DТ определяется (см. Рис.16-3) зоной самого крутого подъема величины PРАСПЛ ≈ или, в общем виде, шириной зоны резкого изменения любого экспериментального параметра, определяющегося вероятностью расплавленного состояния (например, шириной зоны резкого изменения спиральности белковой цепи).
В окончательной форме, связь эффективной теплоты плавления «плавящейся единицы» (DE) с шириной (DT) и температурой (T0) перехода имеет вид 1/DT = (1/4) DE/kT02, или
DE = 4kT02/DT. (16.4)

Рассчитанная таким образом ≈ только из наблюдаемой формы перехода ≈ теплота DE денатурации «единицы плавления» сравнивается с калориметрической теплотой плавления целого белка (рассчитываемой как DH/N, где DH количество тепла, поглощенного всеми имеющимися в калориметре N молекулами белка). Если
DE = DH/N (16.5)

≈ значит, плавление целого белка является переходом типа «все или ничего». Это и есть «критерий Вант-Гоффа».
Если DE < DH/N (т.е. если ширина перехода DT больше, чем того требует критерий Вант-Гоффа), ≈ то «единица плавления» меньше, чем весь белок, т.е. он плавится по частям. Если DE > DH/N, ≈ то «единица плавления» больше белка, т.е. плавится как целое не одна молекула белка, а какой-то белковый агрегат.

Разрушение структуры белка при повышении температуры ≈ плавление ≈ выглядит естественно; однако существует и «холодовая» денатурация белка при аномальном понижении температуры (Рис.16-4). Правда, для многих белков такая денатурация не наблюдается, так как вода в приборе успевает замерзнуть раньше…

Рис.16-4. Обратимая «холодовая» денатурация белка (апомиоглобина) при аномальном понижении температуры (нижняя кривая; стрелка показывает, что температура в ходе опыта понижается). Верхняя кривая показывает ренатурацию белка (левый пик) при обратном повышении температуры и его дальнейшую денатурацию (правый пик). Кривые относятся к избыточной теплоемкости раствора белка по сравнению с теплоемкостью растворителя; они не отнормированы на количество белка в растворе. Картинка взята из Yu.V.Griko, P.L.Privalov, S.Yu.Venyaminov & V.P.Kutyshenko, J. Mol. Biol. (1988) 202:127-138.

Трудами лаборатории Привалова, где «холодовая» денатурация была впервые обнаружена, было показано также, что она ≈ как и обычная тепловая денатурация ≈ происходит как переход типа «все или ничего».
Причина «холодовой» денатурации кроется в том, что гидрофобные взаимодействия, которые держат белок компактным, сильно растут с температурой ≈ то есть сильно падают с ее понижением. Рост гидрофобных эффектов ≈ и, в частности, их энергии ≈ с температурой проявляется в относительно высокой теплоемкости денатурированного, менее компактного состояния белка (см. DCpd на Рис.16-2). В результате теплота плавления белка сильно растет с температурой ≈ и падает с понижением температуры (Рис.16-2, 16-5а). Падает до того, что может изменить знак при низких температурах (Рис.16-5а)! То есть если обычно более упорядоченная структура (нативный белок) имеет более низкую энергию, чем менее упорядоченная (денатурированный белок) ≈ то при аномально низких температурах (~10оС и ниже) энергия нативного белка может быть выше, чем денатурированного. То же самое, однако, происходит и с энтропией денатурации: она, как и положено энтропии гидрофобного эффекта, тоже падает с падением температуры. В результате стабильность белка (разность свободных энергий его нативной и денатурированных форм) проходит через максимум при «комнатных» или нулевых температурах, ≈ и начинает падать при более значительном охлаждении (Рис.16-5б). При этом иногда стабильность белка падает до того, что при аномально низкой (с точки зрения физиологии: ~0оС и ниже) температуре белок разваливается. Правда, обычно дело до этого не доходит, т.к. вода с белком замерзает, и все процессы крайне замедляются (что позволяет хранить белок на холоду).
Парадоксально, но при холодовой денатурации дело обстоит в точности так, как при кипении воды. Как известно, кипения можно добиться двумя путями ≈ либо подняв температуру, либо понизив внешнее давление. Гидрофобное давление, сжимающее белковую цепь, сильно падает при уменьшении температуры ≈ и белок может «закипеть».
Кстати, действительно «закипеть», ≈ если при повышении температуры белок как бы «плавится», то есть его объем растет не слишком сильно, то при холодовой денатурации белковая цепь совершенно разворачивается и занимаемый ею объем растет многократно.

а б

Рис.16-5. Изменение удельной (на грамм белка) разности энергий нативного и денатурированного состояний белка с температурой (а), и изменение свободных энергий в расчете на моль белковых молекул (б). Картинки взяты из P.L.Privalov & N.N.Khechinashvili, J. Mol. Biol. (1974) 86:665-684.

Это естественно подводит нас к вопросу о том, как выглядит денатурированный белок.

Многочисленные термодинамические опыты показывали, что в области денатурированного состояния белковой молекулы в ней нет никаких кооперативных структурных превращений. Поэтому первоначально полагали, что денатурированный белок всегда является очень рыхлым клубком (каковым он, действительно, является в хороших растворителях типа концентрированных растворов мочевины).
Однако столь же многочисленные структурные исследования денатурированных белков упорно свидетельствовали о каких-то крупных перестройках в рамках денатурированного состояния, о каких-то «промежуточных» структурных состояниях между полностью развернутой (клубковой) и нативной формами молекулы (Рис.16-6).
Вообще, экспериментальные данные о состоянии белковой молекулы после денатурации были очень противоречивы. В одних случаях белки казались полностью «развернутыми» и бесстуктурными, в других ≈ довольно структурированными и/или компактными, а для их полного разворачивания нужны были сильные растворители.

Рис.16-6. Фазовая диаграмма (Танфорд, 1968) конформационных состояний лизоцима при рН 1.7 в растворе гуанидингидрохлорида при различных температурах. N ≈ нативное состояние, RC ≈ клубок («random coil»), HD ≈ температурно-денатурированное состояние. Жирная линия показывает середину перехода, пунктир ≈ зону перехода (по Танфорду: предположительно, от соотношения 9:1 в пользу одного состояния до 1:9 в пользу другого). Картинка взята из C.Tanford, Adv. Prot. Chem. (1968) 23:121-218.

Разобраться в этой противоречивой картине удалось только, исследуя структуры денатурированных белков целым букетом методов. В этот букет входили и измерения вязкости (дающие объем молекул белка), и спектры КД в дальнем ультрафиолете (отражающие вторичную структуру белка), и спектры КД в ближнем ультрафиолете (отражающие асимметрию, т.е. упорядоченность окружения ароматических боковых групп), ≈ а также и инфракрасная спектроскопия, и ЯМР, и исследование активности белков, и многое другое. Весь этот арсенал и был применен к исследованию денатурации белков группой О.Б.Птицина, куда и я имел честь принадлежать в качестве теоретика.
Оказалось, что, кроме активности белка, есть только две вещи, которые всегда резко меняются при денатурации. Это ≈ (1) упорядоченность окружения боковых групп белка, наблюдаемая как по КД в ближнем ультрафиолете (Рис.16-7а), так и при помощи ЯМР, и (2) фиксированность глобулярной структуры, наблюдаемая ≈ посредством ЯМР ≈ по скорости обмена водородов (Н) полярных групп белка на дейтерий (D) окружающей воды, а также по ускорению протеолиза белковой цепи.

a б

Рис.16-7. Спектры КД в ближнем (а) и дальнем (б) ультрафиолете для нативного a-лактальбумина () и для него же, денатурированного теплом (), кислотой () и сильным денатурантом (). Спектры КД в ближнем УФ всегда сильно меняются при денатурации. Спектры КД в дальнем УФ сильно меняются только при сильном разворачивании белка (см. кривую ). Картинки взяты из D.A.Dolgikh, L.V.Abaturov, I.A.Bolotina, E.V.Brazhnikov, V.E.Bychkova, V.N.Bushuev, R.I.Gilmansin, Yu.O.Lebedev, G.V.Semisontov, E.I.Tiktopulo & O.B.Ptitsyn, Eur. Biophys. J. (1985) 13:109-121.

Степень же упорядоченности главной цепи белка (ее вторичная структура), размеры глобулы и даже плотность ее гидрофобного ядра могут как практически сохраняться, так и меняться очень сильно (Рис.16-7б).

В ходе этих исследований был обнаружен весьма универсальный интермедиат разворачивания (и сворачивания) белков, позже названный «расплавленной глобулой» (Рис.16-8, 16-9). Важнейшие свойства этого интермедиата суммируются Таблицей 16/1.

Рис.16-8. Относительное изменение спектров КД a-лактальбумина в ближнем ( 270 нм) и в дальнем ( 224 нм) ультрафиолете с изменением концентрации денатуранта (гуанидингидрохлорида). fd=1 отвечает сигналу от нативной структуры, fd=1 ≈ от полностью денатурированной молекулы. «Промежуточное состояние» существует между первым и вторым переходом. В области, отвечающей примерно 2 молям гуанидин-гидрохлорида, все молекулы белка существуют (как показало их дальнейшее исследование) в виде «расплавленных глобул». Картинка взята из W.Pfeil, V.E.Bychkova & O.B.Ptitsyn, FEBS Letters (1986) 198:287-291.


Рис.16-9. Схематическая модель нативной и расплавленной глобулы в молекуле белка. Для простоты, на рисунке показаны только две a-спирали, соединенные петлей. Каждая вторичная структура покрыта множеством боковых групп; прошитая водородными связями, вторичная структура стабильна (так что свободная энергия внутримолекулярных водородных связей не меняется), пока проникающий внутрь растворитель не «растворит» всю глобулу. Вода обычно не способна это сделать без добавления денатуранта. Входящие в гидрофобное ядро белка боковые группы заштрихованы. В расплавленной глобуле они обретают свободу движений, выигрывают энтропию, но теряют энергию плотного контакта. Так в глобуле возникают пoры, куда вода () проникает, не разваливая расплавленную глобулу.

Для очень многих (хотя и не для всех) белков «расплавленная глобула» появляется (путем перехода «все-или-ничего») при умеренном денатурирующем воздействии на нативный белок и исчезает (превращается в неупорядоченный клубок) лишь с добавлением концентрированного денатуранта. «Расплавленная глобула» обычно не плавится при дальнейшем нагреве, но ее разворачивание в клубок сильным растворителем выглядит как кооперативный S-образный переход.
Некоторые нативные белки, однако, разворачиваются прямо в клубок, минуя стадию расплавленной глобулы.
Противоречивость результатов структурных и термодинамических исследований денатурации белков, а также физическая природа нового фазового состояния белков ≈ состояния «расплавленной глобулы» ≈ требовали теоретического осмысления.

Для понимания природы состояния расплавленной глобулы важно, что получается из нативного состояния путем кооперативного температурного плавления ≈ фазового перехода первого рода. Это означает, что оно обладает значительно большей энтальпией и энтропией, чем нативное состояние, то есть что внутримолекулярные взаимодействия в нем резко ослаблены, а подвижность белковой цепи ≈ резко увеличена. Так как большинство внутренних степеней свободы в белке связано с мелкомасштабными флуктуациями структуры, и прежде всего с движениями боковых групп, именно раскрепощение таких флуктуаций может сделать состояние расплавленной глобулы термодинамически выгодным. Однако раскрепощение мелкомасштабных флуктуаций не требует полного разворачивания белковой цепи ≈ достаточно лишь ее небольшого набухания. При этом, однако, в белке резко ослабляется Вандерваальсово притяжение: оно сильно зависит от расстояния и даже небольшого увеличения размеров молекулы достаточно для его значительного ослабления (Рис.16-9).
В общем, здесь все похоже на плавление кристалла: небольшой рост его объема рвет часть Вандерваальсовых взаимодействий в нем и раскрепощает движения молекул.

«Расплавленная глобула» послужила и ключом к пониманию кооперативности денатурации белка. Оказалось, что этот процесс качественно отличается от переходов глобула-клубок в «нормальных» полимерах.

Дело в том, что как эксперименты с гомополимерами (крайне трудные: из-за угрозы агрегации их приходится проводить при предельно низких концентрациях полимера), так и физические теории гомополимеров и статистических гетерополимеров (не «отобранных», как белки, а «нормальных», т.е. «случайных») расходились с тем, что наблюдается в белках.
Они все говорили, что разрушение плотной глобулы в полимерах должно начиниться постепенно, и до самого (или почти до самого) конца идти без резкого скачка плотности молекулы, связанного с переходом одной фазы («глобула») в другую («клубок»), что к моменту превращения глобулы в клубок она уже становится очень рыхлой, и что эти две фазы различаются в основном масштабом флуктуаций плотности молекулы (малым ≈ в глобуле, и большим ≈ в клубке), ≈ то есть что этот переход совсем не похож на фазовый переход первого рода ≈ скажем, на испарение. А денатурация белка похожа как раз на плавление или испарение твердого тела.

Несмотря на то, что классическая теория переходов глобула-клубок в гомополимерах не применима к денатурации белков, ≈ я считаю не лишним рассказать о ней ≈ естественно, в самой упрощенной форме. Такой рассказ, с одной стороны, позволит мне позже оттенить то, что существенно именно для белковых, «отобранных» цепей, а не просто для полимеров. С другой стороны ≈ эта теория вполне применима к поведению уже денатурированных белковых молекул. И, наконец, я считаю, что знание базовых физических моделей необходимо для общей культуры.
Я рекомендую вам «поверять слова формулами» при чтении дальнейшего текста. Конечно, проще читать только слова, но они часто допускают неоднозначное толкование; так что, поверяя слова формулами, ≈ вы сами проверите свое понимание.

Итак, я рассмотрю простейшую «полимерную» модель, ≈ много (N>>1) одинаковых и связанных в цепь мономеров («бусинок»). И я сравню ее с простейшей моделью, используемой со времен Ван дер Ваальса (XIX век!) для описания переходов газ-жидкость ≈ с «облаком мономеров», т.е. с совокупностью из N таких же, но не связанных в цепь мономеров (Рис.16-10).


Рис.16-10. Качественное сравнение поведения зависимости энергии DЕ, энтропии DS и свободной энергии DF=DЕ-TDS добавления одного мономера от плотности r для двух систем: «облако мономеров» и «полимерная цепь». Графики для энергий приведены для притягивающихся (e<0) мономеров. Зависимости DF от r показаны для разных температур Т. На дополнительных графиках (внизу) показана качественная зависимость плотности r обеих систем от энергии взаимодействия мономеров, выраженной в единицах kT; графики относятся к невысокому внешнему давлению [при очень высоком, "надкритическом" давлении разреженных (с r<0.5) состояний не существует].

Предварительное замечание. Ниже я буду считать, что мономеры притягиваются (иначе слишком скучно: плотная фаза не образуется, и все), и что интенсивность этого притяжения не зависит от температуры, т.е. что оно имеет чисто энергетическую природу. Последнее часто неверно, так как мономеры плавают в растворителе (вспомните о гидрофобном эффекте: он растет с температурой!), но так легче найти и рассмотреть все основные сценарии возможных фазовых превращений. А потом уже можно усложнить задачу ≈ учесть зависимость «энергии» притяжения от температуры ≈ и указать, когда, при каких температурах, какой из этих сценариев реализуется.

Сначала я хочу дать качественную картину и объяснить, почему «облако» может претерпевать скачок из плотной в разреженную фазу, а полимер ≈ не может, т.е. почему он должен сгущаться постепенно.

Чем жизнь мономера в полимере отличается от его жизни в облаке? Тем, что в полимере он не может далеко отойти от своего соседа по цепи; а в облаке он может отлететь от любого другого мономера куда угодно ≈ пока не наткнется на стенку сосуда.
Почему из мономеров образуется плотная фаза ≈ будь то жидкость (если мономеры не связаны цепью) или глобула (если связаны)? Потому, что мономеры притягиваются друг к другу, и ≈ при низкой температуре, когда роль энтропии падает (вспомните: в свободной энергии F=E-TS энергия E сравнивается с энтропией умноженной на температуру) ≈ энергия притяжения побьет любое желание мономеров рассредоточится по пространству и выиграть энтропию. Побьет всегда ≈ кроме одного случая: когда такое рассредоточение приведет к практически бесконечно большому энтропийному выигрышу. А последнее возможно тогда, когда облако мономеров помещено в очень большой объем. И вот здесь-то мономерам этого облака приходиться выбирать между двумя фазами: либо быть каплей (низкая энергия, но и малая энтропия), либо быть разреженным газом (ничтожная энергия, ≈ но зато очень большая энтропия: летай, где угодно!). А вот промежуточные состояния ≈ с не очень низкой энергией и с невысокой энтропией ≈ будут иметь более высокую свободную энергию, и потому не будут стабильны. Так что стабильной ≈ при низкой температуре ≈ будет либо очень плотная фаза облака, либо очень разреженная, ≈ но не нечто рыхлое. Иначе говоря, ≈ при изменении внешних условий (скажем, при повышении температуры) в «облаке мономеров» может наблюдаться резкое испарение плотной фазы.
Так обстоит дело в «облаке». А в полимере? Не так, ≈ потому что в самой разреженной глобуле мономер никак не может далеко отойти от своего соседа по цепи, ≈ то есть его энтропия в самом разреженном клубке никогда не превзойдет какого-то предела и не сможет (при низкой температуре) конкурировать с энергией, выигрываемой при сжатии глобулы. Так что полимеру не из чего выбирать: при низкой температуре быть ему только сжатым в глобулу, и, значит, ≈ в отличие от «облака» ≈ он не может претерпеть скачок из плотной в разреженную фазу. То есть при изменении внешних условий (скажем, температуры) возможно только постепенное разрыхление (или уплотнение) полимерной глобулы, но никак не ее резкое «испарение».

Теперь повторим то же самое на языке формул.
Сравним «облако» из N мономеров, помещенных в объем V, с глобулой того же объема, образованной цепью из также N мономеров. Считая, что мономеры и «облака», и полимера более или менее равномерно распределены по объему ≈ добавим к каждой из этих систем еще один мономер и посмотрим, как зависит свободная энергия этого мономера (или, как говорят, его химический потенциал) от плотности системы.
Рассмотрим сначала энергию мономера в каждой системе ≈ точнее, ту ее часть, что зависит от плотности, т.е. от взаимодействия ковалентно не связанных звеньев.
В обоих случаях энергия системы (и полимера, и «облака») меняется ≈ при добавлении мономера ≈ на одну и ту же величину. Она меняется на величину энергии взаимодействий добавленного мономера, DE=er, где r=N w/V ≈ удельная плотность системы, т.е. доля ее объема V, занятая N мономерами (с объемом w у каждого), а e ≈ энергия всех взаимодействий мономера в предельно сжатой системе (при r=1). Мы будем считать, что e<0, т.е. что мономеры притягиваются. Итак, энергии меняются одинаково ≈ а вот энтропии полимера и облака мономеров меняются по-разному. В «облаке» одному мономеру предоставлен объем V/N. Точнее, ≈ так как прочие мономеры занимают объем Nw , ≈ свободный объем для мономера в «облаке» составляет V1обл = (V – N w)/N = (V/N)(1 – r) = (w/r)(1 – r). (16.6)

Обратите внимание, что этот объем неограниченно велик при стремлении плотности r к 0. Не то в полимере. Здесь «новому» мономеру доступен лишь ограниченный объем V1поли = W(1-r) , (16.7)

причем объем W ограничен связью мономера с предшествующим звеном цепи, а фактор (1-r), как и раньше, учитывает, что прочие звенья занимают часть r всего объема. Результат: изменение энтропии при добавлении одного мономера к «облаку» составляет DSобл = k ln[V1обл]= k ln[(w/r)(1-r)], (16.8)

а к цепи – DSполи = k ln[V1поли]= k ln[W(1-r)]. (16.9)

Графики зависимости этих функций от плотности r ведут себя сходно в районе r ╝ 1 (где в DS доминирует член ln(1-r), так что обе DS падают при r╝1), но совсем по-разному при r╝0. Если DSполи остается конечной, то DSобл неограниченно растет (из-за члена w/r). Поэтому для «облака» существует два минимума величины DF=DE-ТDS, т.е. две области потенциально стабильных состояния при низких температурах Т (газ ≈ при малых r, за счет члена -ТDS, и жидкость ≈ при больших r, за счет члена DE). А при высоких температурах для «облака» существует только одно стабильное состояние (газ ≈ за счет члена -ТDS). В то же время для полимера, где энтропия не становится бесконечно высокой при r╝0, существует ≈ при всех температурах ≈ только один минимум величины DF. При совсем низких температурах (или, точнее, при больших значениях величины -e/kT) этот минимум приходится на r╝1, что соответствует плотному глобулярному состоянию. Потом он постепенно смещается в сторону низких плотностей (что соответствует все более рыхлым глобулярным состояниям), ≈ и, наконец, при какой-то температуре приходит к плотности r=0, и все (Рис.16-10). При этой нулевой плотности r и происходит окончательный переход глобулы в клубок. Как вы видите, весь этот процесс нигде не сопровождается ни скачком плотности, ни расслоением на две фазы. А раз нет расслоения на фазы ≈ нет и перехода типа «все-или-ничего», т.е. нет фазового перехода I рода. Можно показать, что при r=0 происходит фазовый переход II рода (что и было сделано И.М.Лифшицем), но мы эти заниматься не будем. Итак, классическая теория переходов «глобула ≈ клубок» не может объяснить плавление белка. Она говорит, что глобула расширяется постепенно, и что клубок возникает вовсе не путем фазового перехода первого рода, ≈ а денатурация белков, этих «апериодических кристаллов» Шредингера, происходит при больших плотностях глобулы и напоминает именно разрушение кристалла, ≈ фазовый переход I рода. Удивительно также, что денатурация белка, ≈ гетерогенной системы, где каждый атом, тем не менее, сидит на своем месте, ≈ идет просто как резкий фазовый переход первого рода: в обычных молекулярных системах гетерогенность смазывает переход. Чтобы понять денатурацию белка, надо учесть его основные (по сравнению с «просто полимером») особенности, ≈ то, что нативный белок упакован плотно, как кристалл; и то, что в белковой цепи подвижные боковые группы сидят на жесткой главной цепи.

Итак. Боковые группы способны к поворотной изомеризации ≈ т.е. к резким прыжкам из одной разрешенной конформации в другую. Но для такого прыжка необходим определенный свободный объем вблизи «прыгающей» боковой группы. Боковые же группы, слагающие гидрофобное ядро белка, сидят на жесткой (в особенности из-за наличия a-спиралей и b-листов, необходимых, как мы видели, для создания ядра) главной цепи (Рис.16-9, 16-11). А жесткие эти сегменты перемещаются как целое, со всем своим лесом боковых групп. Поэтому расширение глобулы, т.е. расхождение этих сегментов, создает примерно одинаковый свободный объем вблизи каждой боковой группы, ≈ и он либо недостаточен для изомеризации каждой из них (пока глобула расширилась мало), либо достаточен для поворотной изомеризации многих. Так что освобождение боковых групп наступает лишь тогда, когда расширение глобулы превосходит некий порог, «барьер» (Рис.16-12).

Рис.16-11. Схема упаковки боковых групп. Показан лишь маленький фрагмент ядра. Заштрихованная область W соответствует альтернативному ротамеру боковой группы (c ≈ угол ее вращения); этот ротамер запрещен плотной упаковкой. Для его появления нужен дополнительный объем W ╩ 303 (т.е. ╩1/5 объема среднего аминокислотного остатка).

Рис.16-12. Причина существования свободно-энергетического барьера между нативным и любым денатурированным состоянием белка. «Барьерное» состояние возникает при небольшом расширении нативного. В этом состоянии поры в белке уже приводят к значительному повышению Вандерваальсовой энергии, но еще не позволяют ни поворотной изомеризации, ни проникновения воды () внутрь белка.

Поэтому малое («до-барьерное») расширение нативной глобулы всегда невыгодно ≈ оно повышает ее энергию (т.к. части глобулы уже расходятся), но не повышает ее энтропию, так как еще не открывает поворотной изомеризации ее боковых групп. То есть свободная энергия глобулы растет при малом расширении. Наоборот, большое («за-барьерное») расширение глобулы открывает поворотную изомеризацию и ведет (при достаточно высокой температуре) к падению ее свободной энергии. В результате денатурация белка при изменении внешних условий происходит не постепенно, а скачком, ≈ по принципу «все или ничего». То есть белок, не меняясь, терпит изменение внешних условий до некоторого предела, ≈ а потом плавится, как микроскопическое твердое тело, весь сразу. Такая устойчивость и твердость белка, в свою очередь, обеспечивает надежность его работы в организме. Иными словами, фазовый переход между нативным и денатурированным состояниями объясняется скачкообразным ростом энтропии (и прежде всего ≈ энтропии боковых групп) при расширении глобулы (Рис.16-13), а его фазовый, кооперативный характер связан с тем, что боковые группы прикреплены к главной цепи и не могут раскрепощаться поодиночке.

Рис.16-13. Причина наличия перехода «все-или-ничего» при денатурации белка. Энергия Е минимальна при плотной упаковке глобулы (здесь ее плотность r = 1) и монотонно растет при сжатии или расширении. Энтропия S растет с падением плотности r сперва медленно (при r = 1.0 ≈ 0.8, пока боковые группы лишь колеблются, а их поворотная изомеризация еще невозможна), затем быстро (когда поворотная изомеризация начинает раскрепощаться), и затем (когда поворотная изомеризация уже свободна) ≈ опять медленно. Неравномерный рост энтропии связан со следующим эффектом. Для поворотной изомеризации вблизи боковой группы должен быть свободный объем размером по крайней мере с СН3-группу. А так как боковая группа привязана к жесткой главной цепи, такой объем не может появиться у одной лишь группы, ≈ он одновременно появится у многих. Поэтому и существует характерная («барьерная») плотность глобулы, где энтропия начинает резко расти с расширением глобулы. Эта плотность довольно высока: ╩80% от нативной плотности, т.к. объем СН3-группы (характерной поворачивающейся единицы, см. Рис.16-11) составляет ╩20% объема аминокислотного остатка. В результате зависимость суммарной свободной энергии F=E-TS от плотности глобулы проходит через максимум («барьер»), отделяющий нативную (плотноупакованную) глобулу (N) от любого более рыхлого денатурированного состояния (D). Из-за этого барьера денатурация белка и происходит по типу «все или ничего», независимо от дальнейшего состояния денатурированной молекулы.

До открытия расплавленной глобулы денатурация белков обычно трактовалась как полное разрушение структуры и переход глобулы в клубок. После этого открытия стало ясно, что денатурированный белок может быть как довольно плотным, так и рыхлым ≈ в зависимости от силы растворителя и гидрофобности цепи. Оценки показывают, что поры расплавленной глобулы (поры, необходимые для свободы движений боковых групп) заполнены растворителем, так как перенос молекулы воды в пру внутри белка термодинамически выгоден по сравнению с существовавшим там до того вакуумом. На опыте об этом свидетельствует ничтожность изменения парциального объема при денатурации белка. Но проникающему внутрь растворителю, если только он не слишком сильно притягивается прами (ведь они окружены в основном неполярными группами, слабо притягивающими воду), ≈ ему удастся только заполнить поры уже существующие, но не удастся создать новые, не удастся разорвать оставшиеся в белке взаимодействия. Тогда он не сможет расширить глобулу ≈ как вода не может растворить губку, хоть и заполняет ее поры, ≈ и белок так и останется компактной расплавленной глобулой (причем «мокрой», насыщенной водой расплавленной глобулой). Компактность такой глобулы обеспечивается остаточными гидрофобными взаимодействиями. Если же растворитель сильно притягивается к порам (т.е. если или растворитель сильнее, или поры менее гидрофобны), то он начинает расширять поры, глобула начнет разбухать, ≈ и тем сильнее, чем сильнее притяжение растворителя к белковой цепи, т.е. чем меньше выгоды находят звенья цепи в контакте друг с другом. По мере роста притяжения растворителя к белковой цепи она разбухнет до неупорядоченного клубка, и этот процесс как раз и описывается теорией переходов глобула-клубок, иллюстрируемой Рис.16-10. Иными словами: если белковая цепь достаточно гидрофобна, денатурированный теплом белок останется в состоянии расплавленной глобулы; если недостаточно ≈ он развернется. Разворачивание расплавленной глобулы выглядит как кооперативный переход (Рис.16-8). Однако ≈ является ли это разворачивание переходом типа «все-или-ничего»? Здесь пока нет полной ясности. Термодинамические исследования многих белков показывают, что, по всей видимости, ≈ нет, не является. Однако недавно Уверским и Птицыным было показано, что состояние расплавленной глобулы может быть, по крайней мере в некоторых белках, отделено от «более развернутого» состояния переходом типа «все-или-ничего», и что только дальнейшее разворачивание этого «более развернутого» состояния до клубка является плавным, как того требует показанная на Рис.16-10 теория. Сосуществование двух фаз ≈ «расплавленных» и «менее плотных» глобул ≈ наблюдается при хроматографировании белка в области таких концентраций денатуранта, где расплавленная глобула разваливается. Наличие раздвоенного пика на таких хроматограммах (Рис.16-14) доказывает, что данный белок существует либо в одной форме (расплавленной ≈ это установлено другими измерениями), либо в другой (какой-то «менее плотной») ≈ но не в форме глобулы какой-то промежуточной между ними плотности.

Рис.16-14. Сосуществование двух фаз, «компактных расплавленных глобул» (С) и «менее плотных глобул» (LC) при хроматографировании белка в области таких концентраций денатуранта (гуанидингидрохлорида), где расплавленная глобула начинает разваливаться. Обратите внимание на раздвоенность пика на хроматограммах, сделанных при 0.55 ≈ 0.63 М GdmCl. Картинка взята из V.N.Uversky, G.V.Semisotnov, R.H.Pain & O.B.Ptitsyn, FEBS Letters (1992) 314:89-92.

Итак, возвращаясь к фазовой диаграмме Танфорда (Рис.16-6), мы видим, что нативное состояние отделено от всех других (и от клубка RC, от температурно-денатурированного состояния НD) переходом типа «все-или-ничего» (что и обуславливает сравнительную узость этих переходов); что денатурированное состояние обязательно отличается от нативного подвижными боковыми группами, но может быть весьма компактным; и, наконец, что переход из температурно-денатурированного состояния в клубок может быть как фазовым переходом типа «все-или-ничего» для одних белков, так и (возможно) не-фазовым переходом ≈ для других. Маленькое отступление. Вообще, нас не должно удивлять, что разные белки ведут себя по-разному. И здесь дело не столько в качественных различиях между белками, сколько в том, что мы наблюдаем каждый белок через «экспериментальное окошко», где температурный диапазон ограничен существованием жидкой воды, а диапазон воздействия денатуранта ≈ его нулевой концентрацией. Поэтому, например, менее гидрофобные по своему аминокислотному составу белки ≈ белки, легко разрушаемые денатурантом ≈ будут демонстрировать в этом «окошке» только переход в клубок (ведь расплавленная глобула держится только остаточными гидрофобными взаимодействиями). И эти же малостабильные белки (или белки «ослабленные» ≈ как, например, апомиоглобин, т.е. миоглобин, ослабленный лишением гема), ≈ эти белки демонстрируют холодовую денатурацию ≈ денатурацию, при которой всегда образуется клубок. У более стабильных белков она не наблюдается ≈ точнее, она, видимо, просто приходится на температуры, когда вода замерзает и тем прекращает наши опыты…

И последнее на сегодня. Имея графики зависимости и энтропии S, и энергии Е от плотности глобулы r, мы можем построить график зависимости S от E и, далее, нарисовать характерный вид энергетического спектра белка (Рис.16-15). Основной чертой этого спектра является отрыв энергии самой стабильной, т.е. нативной структуры белка от энергий, где начинается спектр подавляющего большинства остальных структур белковой цепи. Именно этот отрыв (или, как говорят, «энергетическая щель между самой стабильной структурой и ее конкурентами») и заставляет белок плавиться путем перехода «все-или-ничего» ≈ а до того «терпеть», не меняясь, изменение внешних условий.

а б Рис.16-15. Зависимости энтропии S от энергии Е для белковой цепи (а) и для цепи случайного гетерополимера (б). Показаны касательные к нижней части кривых S(E), определяющие температуру TC стеклования случайного полимера (она же фигурирует в статистике белковых структур) и температуру TМ плавления белка (наклон второй касательной несколько меньше, т.е. TМнесколько выше TС). Внизу показаны характерные формы энергетических спектров этих молекул. Каждая линия спектра (здесь показаны лишь немногие из этих линий) соответствует одной конформации цепи. В правой части обоих спектров этих линий очень много ≈ и они сливаются. Основной чертой спектра белка ≈ «отобранного» гетерополимера ≈ является энергетическая щель (ширины DЕ >> kTC) между основной, самой стабильной укладкой цепи и другими, не похожими на нее укладками. Немногие структуры, чьи энергии приходятся на эту щель, представляют собой более или менее «разболтанные» или «недосвернутые» варианты основной укладки цепи.

Теорфизические исследования разнообразных моделей гетерополимерных цепей показали, что в случайных гетерополимерах такая щель не наблюдается. Точнее ≈ у случайных цепей она обычно очень мала, так что такие цепи замерзают (при температуре TC, о которой ≈ чуть ниже) не скачком, как кристалл или белок, а постепенно, как стекло.
Значит, необходимая для фазового плавления белка достаточно большая (с шириной DЕ >> kTC), энергетическая щель между самой стабильной структурой цепи и ее конкурентами возникает не в любой ≈ «случайной» ≈ аминокислотной последовательности, а создается отбором «белковоподобных», годных для создания белков последовательностей (в частности ≈ последовательностей, допускающих плотную упаковку цепи в глобулу).

Удалось даже ориентировочно оценить долю «белковоподобных» среди всех случайных цепей:
ДОЛЯ(DЕ) ~ ехр(-DЕ/kTC) . (16.10)

Температура TC определяется наклоном кривой S(E) перед самой щелью (Рис.16-15); TC не зависит от величины DЕ, т.е. она одинакова и для случайных, и для «белковоподобных» цепей одинакового аминокислотного состава. И это ≈ та самая температура TC, что фигурирует в белковой статистике, о которой мы говорили на прошлой лекции. Рис.16-15 показывает, что, при не слишком больших DЕ, температура TC лежит чуть ниже температуры плавления белка. А очень большие щели, большие DЕ, по-видимому, не нужны для «белковоподобного» поведения молекулы, так что отбор на них настаивать не должен; и в то же время они маловероятны, согласно формуле 16-10.

Энергетическая щель ≈ фундаментальная вещь в физике белка. Она необходима не только для того, чтобы белок разрушался бы только фазовым переходом, ≈ т.е. чтобы он, не изменяясь, терпел бы (до известного предела) изменение внешних условий, т.е

ПРОСТРАНСТВЕННОЕ СТРОЕНИЕ БЕЛКОВ 5

Автор:mb. Дата:Июль 8, 2011

Теперь поговорим об общих закономерностях, наблюдаемых в структуре белков. Из прошлых лекций вы должны были вынести впечатление, что большинство белковых цепей вписывается в узкий набор стандартных структур.
На самом деле здесь действует правило «80%:20%». В его исходном виде оно гласит: «80% всего пива выпивается 20% населения». В применении к белкам ≈ «80% всех белков вписывается в 20% наблюдаемых архитектур белковых глобул». И я позволил себе сосредоточиться именно на типичных структурах.
Вопрос ≈ почему же большинство белков вписывается в узкий набор стандартных структур? И почему не все (как цепи ДНК)? На каком структурном уровне проявляется это сходство? И что стоит за этими общими структурами: память об общем происхождении? функциональная целесообразность? или необходимость удовлетворять общим принципам сворачивания стабильных белковых структур?

По мере роста информации о пространственном строении белковых молекул становилось все яснее, что существуют какие-то «типовые проекты» строения белковых глобул. Архитектуры вновь расшифрованных белков (или, по крайней мере, их доменов) все чаще и чаще оказывались сходными с архитектурами белков уже известных ≈ но при этом совсем других и по функции, и по аминокислотной последовательности. Поэтому причина сходства структур, видимо, заключается не только в эволюционной дивергенции и не (или не только) в функциональной конвергенции белков, а в ограничении набора укладок какими-то физическими закономерностями.
В 70-х годах стало ясно, что между двумя «традиционными» структурными уровнями (вторичная структура белка и его детальная атомная трехмерная структура) находится промежуточный уровень ≈ «мотив укладки» белковой цепи, определяемый взаимным расположением a- и/или b-участков в глобуле ≈ и что именно на этом уровне проявляется сходство белков, не связанных ни эволюционно, ни функционально. В отличие от детальной, атомной трехмерной структуры, «мотивы укладки» удивительно просты и даже красивы (Рис.15-1).


Рис.15-1. Характерные мотивы укладки белковой цепи в a, b, a/b и a+b белках. Внизу ≈ их упрощенные схемы, вид с торца укладки. Обратите внимание на слоевую упаковку a- и b-структур и на то, что каждый слой сложен либо только из a-спиралей, либо только из b-тяжей, но не из a-спиралей и b-тяжей одновременно.

В поисках ответа на вопросы: (1) В чем физическая причина простоты и регулярности типичных мотивов укладки белковой цепи? и (2) Почему одни и те же мотивы встречаются в самых разных белках, и чем замечательны именно эти мотивы? ≈ мы исследуем прежде всего стабильность различных структур. Такой подход оправдывается тем, что одни и те же пространственные структуры белков могут быть получены в результате кинетически совсем разных процессов. Они получаются и in vivo (как в процессе биосинтеза белка на рибосоме, так в процессе транслокации ≈ в более или менее развернутом виде ≈ через мембрану), и in vitro, при сворачивании (ренатурации) целой белковой цепи из развернутого состояния. Это значит, что детальная последовательность действий не играет решающей роли при сворачивании белка.

Начнем с простого вопроса ≈ почему существует слоевое строение глобулярных белков, о котором мы говорили на прошлой лекции. Иными словами, ≈ посмотрим, почему стабильность плотной глобулы требует, чтобы каркас белковой молекулы выглядел бы как компактная упаковка a- и b-слоев, чтобы a- и b-участки шли от одного края глобулы до другого, и чтобы нерегулярные участки не лежали внутри глобулы.
В общем, мы об этом уже говорили. Тут все дело в водородных связях, которые стоят дорого, а потому все должны быть насыщены в стабильной структуре. Доноры и акцепторы таких связей есть в пептидной группе каждого аминокислотного остатка. Насытиться они могут или водой, или при образовании вторичной структуры. Поэтому только вторичные структуры могут не контактировать с водой ≈ лежать внутри глобулы ≈ а содержащие свободные полярные пептидные группы элементы ≈ петли, края b-листов и концы a-спиралей ≈ должны быть на поверхности.
Вытянутые a- и b-структуры должны, ради стабильности глобулы, со всех сторон плотно окружать гидрофобное ядро, создаваемое боковыми группами этих участков, и тем самым отделять его от воды. В то же время a-спирали и b-листы не могут смешиваться в одном слое, ≈ пропадут водородные связи края b-листа. Значит, стабильность глобулы требует образования a-слоев и ≈ отдельно ≈ b-слоев (Рис.15-1). Такие слои (обычно не плоские ≈ скрученные, иногда цилиндрические, а в a-спиральных глобулах ≈ даже квазисферические) действительно, как мы видели, типичны для белковых глобул.
Подавляющее большинство доменов может быть представлено в виде двух-, трех- или (редко) четырехслойных структур, хотя отдельные белки (особенно те, которые содержат металлоорганические комплексы или много S-S связей боковых групп) могут и не вполне удовлетворять этой схеме. Более чем четырехслойных доменов нет ≈ и в принципе ясно, почему. У них внутри, в отдалении от воды находилось бы слишком много остатков, и при типичном для белковых цепей ≈ точнее, для цепей водорастворимых глобулярных белков ≈ соотношении 1:1 между неполярными и полярными остатками многие полярные остатки увлекались бы внутрь белка, что энергетически крайне невыгодно: такой белок не был бы стабильным. Поэтому очень большие единые глобулы «обычного» аминокислотного состава должны быть нестабильны, и большие белки должны разбиваться на субглобулы, домены.

В принципе, можно, видимо, придумать такие аминокислотные последовательности, боковые группы которых как бы «залечат» все разрывы водородных связей между главной цепью и водой, ≈ разрывы, которые последуют за погружением в глобулу края b-листа или петли, так и насытят водородными связями увлеченные внутрь белка полярные боковые группы. Или ≈ придумать последовательности, которые с лихвой заплатят за эти разрывы мощными связями ≈ например, ковалентными (S-S) или координационными (как в металлоорганике). Придумать можно. Но это будут очень специальные, ≈ а значит, очень редкие последовательности…
Может быть, тут-то собака и зарыта, ≈ может быть, «нормальные» глобулярные белки создаются «нормальными» (т.е. сравнительно слабо отобранными), а не «очень редкими» (т.е. сильно отобранными), последовательностями!?
Попробуем взглянуть на первичные структуры белков (Рис.15-2). Статистический анализ показывает, что аминокислотные последовательности водорастворимых глобулярных белков ≈ а о них-то сейчас и идет у нас речь ≈ выглядят как «случайные». То есть в них разные аминокислотные остатки перемешаны примерно так, как можно было бы ожидать при случайной сополимеризации. Конечно, каждая последовательность не есть результат случайного биосинтеза; каждая белковая цепь кодируется геном. Однако аминокислотные последовательности водорастворимых глобулярных белков выглядят как «случайные», ≈ в том смысле, что в них нет ни блочности, характерной для мембранных белков (где явно гидрофобные куски перемежаются с явно гидрофильными), ни периодичности, характерной для белков фибриллярных.

Рис.15-2. Характерные мотивы чередования гидрофобных (╥) и полярных (о) аминокислот в первичных структурах водорастворимых глобулярных белков, мембранных белков и фибриллярных белков.

А что такое «выглядеть как случайная последовательность»? Это значит ≈ выглядеть как большинство из всех возможных последовательностей… Значит, рассматривая водорастворимые глобулярные белки, вполне осмысленно ставить вопрос о том, какие стабильные пространственные структуры обычно кодируются самыми массовыми, случайными или похожими на них («квазислучайными») последовательностями.

Следуя логике такого анализа, один результат мы уже только что получили. Мы выяснили, что типичные упаковки, «штабеля» вторичных структур в глобулярных белках выглядят (Рис.15-1) именно так, как должны выглядеть стабильные упаковки случайных или почти случайных аминокислотных последовательностей.

Пойдем дальше и рассмотрим мотивы укладок белковых цепей.

Как мы уже видели, мотивы укладок белковых цепей часто удивительно красивы. Ход белковых цепей часто напоминает линии, орнаментирующие керамику (Рис.15-3). И, по глубокой мысли Джейн Ричардсон, открывшей это сходство, оно не случайно ≈ так как и линия орнамента, и белковая цепь «решает» одну и ту же задачу ≈ окружить объем (в белке это центр глобулы, ее гидрофобное ядро), избежав самопересечений этой линии.

Рис.15-3. Мотивы укладки белковой цепи и орнаменты на индейских и греческих вазах: два решения задачи окружения объема несамопресекающейся линией. Вверху: мотив меандра; в середине: мотив греческого ключа; внизу: мотив зигзага-»молнии». Рисунок взят с обложки Nature, v.268, No.5620, 1977, где была напечатана статья J. Richardson о мотивах укладки белковых цепей.

В белках такой эффект достигается тем, что структурные участки уложены вокруг ядра (или двух ядер; последнее типично для a/b белков), а петли скользят по поверхности ядер ≈ и не перекрывают друг друга (Рис.15-4).

Рис.15-4. Перекрывание петель редко наблюдается в белках, ≈ будь то проход одной петли над другой или обход одной петли вокруг другой.

Чем же плохи перекрывания петель ≈ ведь при этом цепи не врезаются друг в друга, а просто одна из них проходит на другой? Тем, что «нижняя», прижатая к ядру петля лишается водородных связей с водой. А чтобы залечить эту потерю ≈ опять нужны «редкие» последовательности…
Здесь, правда, нас должно смутить то, что при перекрывании петель пропадет лишь одна, максимум две водородные связи ≈ т.е. энергии потеряется немного, килокалорий три или пять. Это не только много меньше, чем полная энергия взаимодействий в белке, измеряемая обычно сотнями килокалорий (судя по опытам по плавлению белков), но и заметно меньше чем обычный «запас стабильности» белка (т.е. разность свободных энергий его нативного и денатурированного состояния). В нативных условиях этот запас составляет ≈ по тем же опытам ≈ порядка 10 ккал/моль. Почему же «дефект» ценой всего в 5 ккал/моль запрещает ≈ или почти запрещает ≈ перекрывание петель в нативных белковых глобулах?
И еще вопрос: что мешает сделать в петле дополнительный изгиб (пунктир на Рис.15-4) ≈ и тем избежать физического перекрывания одной петли другой (т.е. заменить перекрывание петель обходом)? Может быть, здесь дело в упругости полимерной цепи ≈ ведь за дополнительный изгиб петле пришлось бы заплатить (как показывает расчет) несколько (все те же несколько!) ккал/моль?

Здесь любой человек, знающий физику полимеров, должен прервать меня и сказать: «Упругость полимера ≈ энтропийный, а вовсе не энергетический эффект! То есть сильно изогнутая цепь не может флуктуировать так свободно, как прямая или слабо изогнутая. Иными словами, с сильно изогнутой формой цепи совместимо гораздо меньше конформаций, чем с ее более или менее вытянутой формой. Однако эффект, о котором Вы говорите, относится к флуктуирующей цепи, ≈ т.е. к цепи, не фиксированной в глобуле. Но в нативном белке цепь фиксирована, и ≈ так ли она идет, иначе ли ≈ она все равно будет иметь лишь одну какую-то конформацию. Какое отношение имеют описываемые Вами энтропийные потери к нативной структуре белка, где цепь все равно фиксирована, т.е. все равно имеет нулевую энтропию?»

Запомним эти вопросы, а пока рассмотрим еще одну характерную черту белковых архитектур ≈ то, что перемычка между параллельными b-участками почти всегда образует с ними правозакрученную, а не левозакрученную спираль (Рис.15-5).

Рис.15-5. Левовинтовой ход перемычек между параллельными b-участками очень редко наблюдается в белках, правовинтовой ≈ часто.

Критерий стабильности позволяет и в этом случае выделить «лучшую» из двух зеркально-симметричных белковых архитектур. В основе различия лежит зеркальная асимметрия природных аминокислот. Она приводит, как вы помните, к преимущественно правому, если смотреть по ходу b-тяжей, скручиванию b-слоев, состоящих из L-аминокислот (это скручивание показано на Рис.15-5). При этим угол между осями соседних b-участков близок к 300, так что полный угол поворота близок к 3300 для правовинтовой перемычки и к 3900 ≈ для левовинтовой. В результате, из-за жесткости полипептидной цепи, правовинтовая ≈ менее закрученная ≈ перемычка выгоднее, чем левовинтовая, т.е. ее свободная энергия ниже, ≈ хотя и опять немного, на пару ккал/моль, и опять в результате не энергетического, а энтропийного эффекта.

И здесь мы опять наталкиваемся на два поставленных выше (и пока оставленных без ответа) вопроса:
(1) Почему «дефект» ценой всего в несколько ккал/моль ≈ на фоне гораздо большей полной энергии белка ≈ может практически запрещать многие мотивы белковых архитектур?
(2) Какое отношение имеют описываемые здесь упругие, т.е. энтропийные эффекты к нативной структуре белка, где цепь все равно фиксирована?

Начнем с первого вопроса ≈ вопроса о проявлении энергии «дефекта» в статистике белковых архитектур. Но сначала усугубим его. Посмотрим, как связаны с энергией другие статистические закономерности, отмеченные в белковых структурах? Оказывается ≈ точно так же! Но здесь мы располагаем большей статистикой и можем получить не только качественные, но и количественные оценки.
Для примера рассмотрим статистику распределения аминокислотных остатков между внутренностью и поверхностью белковой глобулы и посмотрим, как она связана с гидрофобностью аминокислотных остатков. Гидрофобность аминокислотных остатков обычно измеряется в свободной энергии их переноса из октанола, моделирующего гидрофобное ядро белка, в воду. На Рис.15-6 эта гидрофобность отложена по вертикальной шкале. По горизонтальной шкале отложен логарифм отношения числа поверхностных и внутренних остатков в белках ≈ точнее, этот логарифм, умноженный на RT, где Т=3000К соответствует примерно комнатной температуре. Мы видим, что точки более или менее ложатся на прямую линию ≈ и наклон такой прямой более или менее близок к 1 ≈ 1.5.

Рис.15-6. Экспериментально определенная свободная энергия переноса боковых групп аминокислотных остатков из неполярного растворителя в воду (DG2), и «кажущаяся свободная энергия переноса остатка из ядра на поверхность белка» (DG1), вычисленная из наблюдаемых частот встречаемости аминокислотных остатков внутри (fin) и на поверхности (fsurf) белка по формуле DG1 = -RT ln[fsurf/fin]. Картинка взята из S.Miller, J.Janin, A.M.Lesk, C.Chothia, J. Mol. Biol. (1987) 196:641-656.

Таким образом, наблюдаемая статистика распределения остатков между нутром и поверхностью глобулы неплохо аппроксимируется формулой
ВСТРЕЧАЕМОСТЬ ~ exp(-СВОБОДНАЯ_ЭНЕРГИЯ/kTC) , (15.1)

где ТС ≈ какая-то температура, близкая не то к комнатной температуре, не то к характерной температуре плавления белка: ведь 3000К и 3500К совпадают «по порядку величины».
То есть статистка встречаемости аминокислотных остатков внутри и на поверхности белка удивительно похожа на статистику Больцмана по форме! Это впервые было замечено Полем в 1971 г. для распределения углов внутреннего вращения в боковых цепях аминокислотных остатков в белках. Потом это показано и для статистики многих других элементов белковых структур: для встречаемости ионных пар, для встречаемости остатков во вторичных структурах, для встречаемости полостей в белках и т.д., и т.п. К настоящему времени эта аналогия стала столь привычной, что статистика белковых структур часто используется для оценки свободной энергии различных взаимодействий аминокислотных остатков.
Здесь, однако, следует подчеркнуть, что белковая статистка похожа на статистику Больцмана именно по своей экспоненциальной форме, а не по физическому смыслу. Напомню, что статистика Больцмана поддерживается тем, что частицы бродят с места на место, и каждая из них больше времени проводит там, где ее энергия ниже. В то же время в нативных белках аминокислотные остатки не бродят с места на место! Например, Leu72 цепи миоглобина кашалота всегда находится внутри глобулы в нативной структуре этого белка, ≈ мы никогда не видим его на поверхности. И если мы видим, по статистике, что 80-85% всех лейцинов находится внутри белка и 15-20% на поверхности, ≈ то здесь дело не в том, что каждый лейцин проводит 80-85% времени внутри и 15-20% времени на поверхности глобулы. Здесь дело в том, что естественный отбор закрепил большинство лейцинов в тех точках цепи, что лежат внутри глобулы.
То есть обычная Больцмановская статистика здесь, в распределении остатков между ядром и поверхностью белка ≈ вовсе ни при чем.
Посмотрим с другой стороны.
Чем хорошо, скажем, преимущественное расположение лейцинов внутри глобулы? ≈ Тем, что оно повышает ее стабильность. Но почему тогда естественный отбор не настоял на том, чтобы все лейцины были бы внутри белка? Может быть, потому, что уже 80-85% внутренних лейцинов достаточно для стабильности белка, а возня с остальными потребовала бы от него слишком больших усилий?

Оставим вопрос о психологии естественного отбора как бесперспективный и ненаучный, и рассмотрим другой вопрос ≈ вопрос о том, как изменяет внутренняя свободная энергия какого-то элемента белковой структуры число аминокислотных последовательностей, способных придать стабильность белку с этим структурным элементом. Например ≈ сравним число стабилизирующих данную пространственную структуру последовательностей при условии, что в такой-то лежащей внутри белка точке цепи находится лейцин, с числом стабилизирующих ту же структуру последовательностей при условии, что в этой точке цепи находится серин.
Иными словами ≈ посмотрим, как изменится число стабилизирующих структуру белка последовательностей при мутации Leu ╝ Ser во внутренней точке белка.
Нативная структура стабильна, если ее свободная энергия меньше, чем свободная энергия денатурированного белка. Будем, для простоты, считать, что (1) вклад остатка в стабилизацию белка определяется свободной энергией его дегидратации [что качественно справедливо, хоть может быть и не совсем верно количественно], (2) что внутренние остатки белка целиком укрыты от воды, а поверхностные – целиком ей доступны [что является довольно грубым, но качественно верным допущением], и что денатурированный белок совсем развернут [это бывает часто, но не всегда; поэтому излагаемая ниже теория приблизительна, ≈ но зато она проста.]
Свободная энергия переноса серина из гидрофобного окружения в воду ≈ около 0, а лейцина ≈ около +2 ккал/моль. В развернутом денатурированном белке все остатки окружены водой. Значит, структура белка с серином во внутренней точке «в среднем» (по разным последовательностям) на 2 ккал/моль менее стабильна, чем структура белка с лейцином в той же внутренней точке. Следовательно, грубо говоря, все последовательности, стабилизирующие белок с серином в ядре, будут стабилизировать и белок с лейцином в ядре, ≈ но, кроме того, белок с лейцином внутри будут стабилизировать и какие-то последовательности, не способные стабилизировать белок с серином в той же точке.
Как упадет число стабилизующих нативную структуру белка последовательностей при замене более стабильного элемента этой структуры («Leu внутри») на менее стабильный («Ser внутри»)?

Рассмотрим такую задачу формально и попробуем понять, откуда берется наблюдаемая, примерно экспоненциальная зависимость встречаемости разнообразных элементов от их свободной энергии, и что за температура ТС стоит в уравнении (15.1).
Я заранее прошу меня извинить, что все выкладки я дам в самом упрощенном, а значит ≈ не вполне точном виде. Моя цель ≈ дать вам почувствовать, в чем суть дела, не заводя в математические дебри, по которым мы (с А.М.Гутиным и А.Я.Бадретдиновым) в свое время нагулялись вволю…
Итак, пусть De ≈ свободная энергия рассматриваемого элемента в нативном белке, включая его взаимодействия с остальной цепью (например, ≈ свободная энергия лейцина или серина в центре нативной глобулы), отсчитанная от его же свободной энергии в денатурированном белке. Пусть DF ≈ свободная энергия всей остальной цепи в рассматриваемой пространственной структуре, за вычетом свободной энергии в денатурированном белке. Значит, De+DF ≈ разность свободных энергий нативной и денатурированной форм белка. Для того, чтобы нативный белок был стабилен, DF+De должно быть меньше 0, т.е. для стабильного белка
DF < -De. (15.2)

Величины DF и De зависят от аминокислотной последовательности полипептидной цепи. Рассмотрим множество последовательностей, оставляющих неизменной величину De [в данном случае ≈ все последовательности с инвариантным Leu (или Ser) в данном месте цепи; при этом, если это место лежит в ядре нативного белка, De = 2 ккал/моль для Leu и около 0 для Ser, в то время как для поверхностных остатков De близко к 0, если денатурированный белок развернут]. Величина же DF будет меняться от последовательности к последовательности.
При этом вероятность того, что DF < -De, есть
(15.3)

где P(DF) ≈ вероятность появления заданной величины DF в наудачу выбранной случайной последовательности.
Величина DF складывается из свободных энергий множества разных взаимодействий и из энтропий фиксации множества разных аминокислотных остатков. Так как складываемых «случайных» величин много, ≈ то, по «центральной предельной теореме» математической статистики, вероятность (P) того, что DF равна той или иной величине, имеет простую, так называемую Гауссову (см. Рис.15-7) форму:
P(DF) = (2ps2)-1/2 x exp[-( ≈ DF)2/2s2] . (15.4)

Здесь ≈ средняя (усредненная по всем последовательностям) величина DF, а s ≈ средняя (точнее ≈ среднеквадратичная, усредненная по тем же последовательностям) величина отклонения DF от среднего .

Рис.15-7. Типичный (Гауссов) вид распределения величины свободной энергии DF по различным случайным аминокислотным последовательностям. В DF входит вся свободная энергия укладки белковой цепи (отсчитанная от свободной энергии денатурированного белка), за исключением фиксированной свободной энергии De интересующего нас элемента структуры. Значения DF < -De (т.е. удовлетворяющие условию DF+De < 0) отвечают стабильной укладке. Зачерненная область соответствует значениям DF < -De при De > 0, «красная+зачерненная» облась ≈ при De < 0. Вторая область больше, т.е. больше случайных последовательностей стабилизует укладку цепи, если свободная энергия интересующего нас элемента De < 0, чем если De > 0.

Напомню, что «центральная предельная теорема» описывает ожидаемое распределение суммы большого числа случайных величин, и отвечает на вопрос «какова вероятность того, что эта сумма будет иметь то или иное значение?». У нас «сумма большого числа случайных величин» ≈ это DF (она включает множество взаимодействий в наудачу выбранной, а значит ≈ «случайной» последовательности). Так вот, математика говорит, что для большинства последовательностей величина такой суммы DF должна лежать между – s и + s, и что вероятность величины DF круто, экспоненциально падает при удалении DF от (см. Рис.15-7).
Так как рассматриваемая укладка обычно стабильна при DF < 0 (точнее: она стабильна при DF+De<0, но одно-единственное взаимодействие, создающее De, в данном случае не в счет на фоне множества взаимодействий, создающих DF), и так как подавляющее большинство случайных последовательностей явно неспособно стабилизировать именно рассматриваемую укладку цепи (с чего вдруг, ≈ именно ее из огромного числа возможных укладок?), ≈ то величина должна быть не только положительной, но и большой ≈ существенно больше, чем s (иначе ≈ был бы велик, порядка 1/2, шанс, что случайная последовательность будет стабилизировать именно рассматриваемую укладку).
Величина ( ≈ DF)2 = 2 ≈ 2DF ≈ DF2, ≈ то есть при малых (относительно большого ) значениях DF, мы имеем ( ≈ DF)2 ╩ 2 ≈ 2DF ≈ и, значит,
P(DF) ╩ {(2ps2)-1/2 x exp[ - 2/2s2]} x exp[DF x (/s2)]. (15.5)

При этом [прошу проверить ≈ или (хуже!) поверить] ≈ вероятность того, что DF < -De, есть
(15.6)

так как не зависящий от переменной DF множитель {(2ps2)-1/2 x exp[-2/2s2]} выносится за знак интеграла, а интеграл величины exp[DF x (/s2)] от «минус бесконечности» до «-De» есть (s2/) ╢ exp[-De ╢ (/s2)].
Константа const = {(2ps2)-1/2 xexp[-2/2s2]} x (s2/) нас не интересует, а интересующий нас член exp[-De/(s2/)] демонстрирует, что свободная энергия (De) какого-то элемента белковой структуры экспоненциально изменяет вероятность того, что наугад выбранная аминокислотная последовательность будет стабилизировать данную укладку цепи. Таким образом, увеличение De экспоненциально уменьшает число аминокислотных последовательностей, способных придать стабильность нативной структуре, содержащей элемент с энергией De.

Полученная зависимость имеет экспоненциальную форму (и тем она похожа на формулу Больцмана) ≈ но, в отличие от формулы Больцмана, De здесь делится не на температуру среды (точнее, не на kT), а на непонятную пока величину s2/.

Что же это за величина? Прежде всего, ≈ отметим, что s2/ не зависит от размера белка. В самом деле, по законам математической статистики, средняя величина () пропорциональна числу суммируемых в DF членов (которое, в нашем случае, примерно пропорционально размеру белка), а среднеквадратичное отклонение от среднего (s) пропорционально квадратному корню из числа этих членов, ≈ т.е. De2 тоже примерно пропорционально размеру белка.
То, что s2/, т.е. с чем-то вроде средней энергии цепи в расчете на один ее аминокислотный остаток (которая тоже не зависит от размера белка!).

Это, вместе с экспоненциальным видом формулы 15.6, сразу отвечает на вопрос о том, почему De ценой всего в несколько ккал/моль может существенно влиять на встречаемость белковых структур (например ≈ почему лейцина внутри белка на порядок больше, чем серина). Это происходит потому, что число последовательностей, стабилизующих нативную структуру белка, падает в «е» раз (примерно втрое), когда De растет на s2/.

Итак, величина s2/ ≈ это что-то вроде энергии цепи в расчете на одно ее звено или на одну ее степень свободы. Или (напомню, что kT ≈ это характерная тепловая энергия в расчете на степень свободы) ≈ можно полагать, что s2/ = kTC, где TC ≈ какая-то температура. Какая? В белке есть только одна характерная температура ≈ температура его плавления, денатурации. И мы все время говорили об устойчивости белка к денатурации… Поэтому можно полагать, что величина TC определяется температурой денатурации белка. Иными словами, можно предполагать, что s2/ составляет примерно 0.5 ≈ 1 ккал/моль.
Это можно не только предполагать, но и показать. За словами «можно показать» стоит довольно сложное теорфизическое доказательство ≈ теорема Шахновича-Гутина ≈ от которого я вас избавлю.
Итак, мы разобрались с вопросом о том, почему дефект ценой всего в несколько ккал/моль ≈ на фоне гораздо большей полной энергии белка ≈ может практически запрещать многие мотивы белковых архитектур. Потому, что «дефект» ценой в 1 ккал/моль снижает число «годных» для белка последовательностей впятеро, «дефект» ценой в 2 ккал/моль ≈ раз в двадцать, и т.д.

Теперь ≈ разберемся со вторым вопросом: почему энтропийные эффекты имеют отношение к стабильности нативной структуры белка, где цепь все равно фиксирована.
Здесь все тоже довольно просто.
Сравним два мотива укладки цепи, ≈ например, правовинтовой ход перемычки между параллельными b-участками с левовинтовым (см. Рис.15-5). Так как b-лист из L аминокислот имеет тенденцию к правопропеллерному скручиванию с углом около 30о между соседними b-тяжами (мы уже об этом много говорили и выяснили, что это связано с повышенной стабильностью скрученных b-листов), то правовинтовая перемычка как бы идет по кратчайшему пути. Поскольку b-лист скручен в ту же (правую) сторону, что и перемычка, то такой ее путь требует поворота цепи на 360o ≈ 30o = 330о. Другая (левовинтовая) перемычка идет как бы по обходному пути (она скручена в другую, чем b-лист, сторону), так что теперь ей приходится делать больший поворот, на 360o + 30o = 390о. Полимерная физика говорит, что чем сильнее согнута цепь, тем меньше у нее конформаций. Значит, правовинтовой (менее закрученный) ход цепи совместим с большим числом конформаций цепи, а левый (более закрученный) ≈ с небольшим. Иначе говоря, «левый» ход перемычки создает «энтропийный дефект» у «левой» перемычки. Это понятно. Однако – как он проявляется на числе последовательностей, способных сделать стабильным тот или иной ход перемычки?
Наугад выбранная аминокислотная последовательность может сделать самой стабильной структурой цепи либо какую-то одну из многих возможных конформаций, соответствующих «правой» перемычке, либо какую-то из немногих, отвечающих «левой» перемычке, ≈ либо, наконец, она не способна сделать самой стабильной ни одну из этих конформаций. Последнее, конечно, наиболее вероятно, так как на опыте случайно сваренные сополимеры аминокислот не имеют стабильной трехмерной структуры. Однако, если выбирать из двух: какая перемычка все же имеет больший шанс стать самой стабильной ≈ правая или левая?
Каждая отдельная конформация с «правой» перемычкой ничуть не лучше и не хуже, чем каждая отдельная конформация с «левой» перемычкой, ≈ если они имеют равную компактность, одинаковое содержание вторичной структуры и т.д. Однако «правых» конформаций больше… Итак, мы видим, что перед нами ≈ нечто вроде лотереи с малым шансом на выигрыш главного приза («приз» ≈ возможность создать стабильную трехмерную структуру), ≈ лотереи, где «правая» перемычка имеет много «билетов» (возможных конформаций), а левая ≈ мало. Кому же, скорее, достанется приз ≈ если он вообще кому-то достанется? Конечно, «правой» перемычке, ≈ той, у кого «билетов» больше: вероятность победы той или иной перемычки прямо пропорциональна числу имеющихся на руках «билетов» ≈ конформаций…
Иными словами, ≈ шанс на то, что случайная аминокислотная последовательность сделает стабильной какую-то из многих конформаций «правой» перемычки, относится к шансу на то, что она сделает стабильной какую-то из немногих «левых» конформаций, как число «правых» конформаций относится к числу «левых». Или: чем шире набор возможных конформаций (а их больше у «правой» перемычки), ≈ тем больше последовательностей найдет в этом наборе свою самую стабильную структуру. При этом каждая из таких последовательностей выберет из этого набора одну, наиболее подходящую именно для нее конформацию.
Именно это и наблюдается в глобулярных белках: здесь «правый» ход перемычки ≈ правило, а «левый» ≈ исключение.

Рассмотрим еще одну задачу, связанную с энтропийными дефектами. Что должно чаще наблюдаться: белки, через центр которых проходит слой a-спиралей, или белки, через центр которых проходит b-лист?
Ожидаемый ответ дан на Рис.15-8, и он гласит, что глобулы, через центр которых проходит b-лист, стабилизируются гораздо большим числом первичных структур, чем глобулы с a-спиралью по центру.

Рис.15-8. Многослойная упаковка, в центре которой лежит a-спираль, должна быть менее вероятна (и на самом деле встречается гораздо реже), чем многослойная упаковка, в центре которой лежат два b-участка. Дело в том, что лежащий в центре глобулы участок должен состоять из одних гидрофобных остатков, причем длина такого структурного участка диктуется диаметром глобулы, ≈ а, при равной длине, a-спираль состоит из вдвое большего числа остатков, чем вытянутый b-тяж; поэтому для создания внутренней a-спирали (одного большого блока из гидрофобных групп) нужна более «редкая» последовательность, чем для создания двух внутренних b-участков (двух вдвое меньших гидрофобных блоков, как-то расположенных в цепи). Вероятность существования одного большого (из m остатков) гидрофобного блока в данном месте случайной цепи, ≈ порядка pm (где p ≈ доля гидрофобных остатков в цепи); и такова же вероятность существования двух вдвое меньших блоков в двух данных местах случайной цепи, ≈ (pm/2)x(pm/2) = pm. Однако один блок может размещаться в цепи из N остатков примерно N способами, а способов разместить два блока много больше ≈ примерно NxN/2, т.е. цепей с двумя короткими блоками много больше, чем цепей с одним длинным блоком.

И действительно, внутренняя a-спираль в белках очень редка (в качестве известного носителя такого редчайшего признака назову «зеленый флуоресцентный белок»), а внутренние b-тяжи ≈ типичны (например, в «укладках Россманна»).

С той же точки зрения ≈ «насколько часто данная структурная деталь стабилизируется случайными аминокислотными последовательностями?» ≈ можно объяснить и многие другие закономерности, наблюдаемые в глобулярных белках. Например ≈ средний размер домена для цепи с заданным соотношением гидрофобных и гидрофильных групп (этот вопрос исследовался еще ленинградскими учеными Бреслером и Талмудом 1944 г., а затем Фишером в США), а также, ≈ средние длины a-спиралей, b-участков и нерегулярных петель.

Итак, наш анализ показывает, что вероятность структурного элемента в стабильной (т.е. наблюдаемой) белковой глобуле должна быть тем больше, чем ниже его энергия и чем большим числом конформаций его можно создать.
А так как энергия и число конформаций объединяются в единое целое в свободной энергии, ≈ то статистика наблюдения самых разных элементов белковых структур в белках должна иметь вид

ВСТРЕЧАЕМОСТЬ ~ exp(≈СВОБОДНАЯ_ЭНЕРГИЯ/kTC) ,

где TC близка (не в точности равна, как показывает более тщательный анализ, но близка) к температуре денатурации белка.
И действительно, белковая статистика, в общем, имеет такой вид!

Еще раз напомню физическую причину такого соотношения. Она заключается в том, что свободная энергия элемента белковой структуры экспоненциально изменяет число аминокислотных последовательностей, способных придать стабильность белку, нативная структура которого содержит этот элемент. Если этот элемент сам по себе стабилен ≈ белок с ним «терпит» много даже неблагоприятных мутаций, т.е. довольно много аминокислотных цепей стабилизируют белок с этим элементом. Если же этот элемент нестабилен ≈ белок с ним требует очень тщательного подбора своей первичной структуры (стабильность его структуры легко разрушается даже немногими мутациями), а таких «тщательно отобранных» последовательностей ≈ мало.
Здесь нужно подчеркнуть, что так называемые «запрещенные», т.е. не наблюдаемые (или редко наблюдаемые) в белках структуры не невозможны в принципе ≈ они просто маловероятны, т.е. создаются малым числом аминокислотных последовательностей.

Заключительные замечания:

1. Мотивы укладки белковой цепи выглядят так «стандартно»,т.е. так просто и регулярно потому, что каркас белковой структуры представляет собой компактную упаковку слоев вытянутых регулярных твердых тел (a-спиралей и b-участков), а нерегулярные перемычки идут по поверхности глобулы, не пересекая ни друг друга, ни торцов структурных сегментов. Физическая причина такого устройства ≈ в том, что оно наиболее благоприятствует стабильности нативной глобулы, позволяя неполярным боковым группам укрываться от воды, а всем пептидным группам главной цепи ≈ насытить свои водородные связи даже при погружении в компактную глобулу.
2. Число таких «стандартных» стабильных мотивов укладки цепи относительно невелико (порядка сотен, а белков ≈ многие тысячи); неудивительно поэтому, что некоторые из этих «стандартных» структур встречаются в разных, со всех остальных точек зрения, белках.
3. По-видимому, для структур доменов глобулярных белков можно сформулировать «принцип множественности»: чем больше аминокислотных последовательностей можно вписать в данную архитектуру без разрушения ее стабильности, тем чаще эта архитектура встречается в природе.

Похоже, что глобулярные белки могли относительно легко возникнуть из случайных гетерополимеров аминокислот ≈ нужно было только немного, при помощи немногих мутаций стабилизировать самую стабильную пространственную структуру исходного случайного полипептида (и тем самым сделать ее единственной наблюдаемой структурой цепи), ≈ да еще «навесить» активный центр.
Я специально подчеркиваю, ≈ «принцип множественности» можно сформулировать именно для глобулярных белков, так как именно их последовательности внешне напоминают «случайные» (т.е. самые массовые) сополимеры (Рис.15-2). В то же время для первичных структур фибриллярных и мембранных белков ясно просматривается их «неслучайное» строение (но ≈ кстати: строение, также простое с точки зрения его создания, ≈ периодическое для фибриллярных, и блочное ≈ для мембранных белков).

Проведенный анализ подчеркивает тот факт, что получающиеся в результате эволюции структуры белков выглядят очень «разумно» с физической точки зрения, ≈ так же, как и двойная спираль ДНК, как и мембранный бислой. Видимо, и на уровне архитектур белковых доменов эволюция не «изобретает» нечто физически маловероятное, а «выбирает» среди физически разумных (т.е. стабильных и способных к быстрой самоорганизации ≈ мы это скоро увидим) структур. В этом и заключается смысл «физического отбора» белковых структур.

ПРОСТРАНСТВЕННОЕ СТРОЕНИЕ БЕЛКОВ 4

Автор:mb. Дата:Июль 8, 2011

Перейдем теперь к a-белкам ≈ белкам, сложенным из a-спиралей. Их труднее классифицировать, чем b-белки. Дело в том, что взаимное расположение b-участков в листах поддерживается водородными связями в главной цепи (а она ≈ повсюду одинакова), в то время как расположение a-спиралей в глобуле поддерживается плотной упаковкой их боковых групп, которые весьма разнообразны по размеру. Поэтому a-спирали не уложены в такие ровные, стандартные листы, как b-тяжи.

Проще других устроены те a-белки, где a-спирали длинны. Такие спирали образуют пучки: они лежат (почти) параллельно или антипараллельно (в общем, «колинеарно») друг к другу. С пучками спиралей мы уже встречались в фибриллярных и мембранных белках.

Рис.14-1. Три сходных по архитектуре («четырехспиральный пучок»), но разных по функции a-спиральных белка: цитохром c’, миогемэритрин и белок оболочки вируса табачной мозаики. Показана как белковая цепь, так и кофакторы: скелетные модели ≈ гем (в цитохроме) и фрагмент РНК (в белке оболочки вируса), оранжевые шарики ≈ ионы железа (в геме цитохрома и в миогемэритрине), красный шарик ≈ связанный железом кислород (в миогемэритрине). Общая архитектура таких «пучков» напоминают коллинеарную упаковку b-листов. На топологической схеме (внизу) дан вид на белок «снизу» (с торцов структурных сегментов). Спирали занумерованы цифрами. Кружки – торцы a-спиралей. Крестик соответствует N-концу сегмента (т.е. он «идет от нас»), точка ≈ его С-концу (т.е. он «идет к нам»). Ход петель, соединяющих структурные сегменты, показан черной линией, если петля обращена к нам, и светлой, если она находится на противоположной стороне укладки. Цифры на схеме указывают порядок структурных сегментов в цепи.

На Рис.14-1 показаны три четырехспиральных a-белка. Эти, столь похожие между собой белки исполняют разные функции: один из них, цитохром, связывает электрон; другой (миогемэритрин) связывает кислород, а третий (белок облочки вируса табачной мозаики) связывает гораздо более крупные молекулы ≈ другие оболочечные белки и РНК. В первых двух случаях какую-то общность действия проследить можно, так как оба белка что-то переносят в дыхательной цепи. Правда, сходство здесь весьма отдаленное: в цитохроме полипептид ≈ а именно о его укладке идет речь ≈ связывает гем, тот ≈ ион железа, а уж оно-то и хватает электрон; а в миогемэритрине полипептид связывает железо непосредственно, без гема, ≈ и уже два иона железа, а не один, ≈ которые и хватают кислород. Итак, у миогемэритрина и цитохрома некую общность функции, пусть с большой натяжкой, но можно найти, ≈ но, конечно, у их действия нет ничего общего с действием РНК-связывающего белка оболочки вируса, ≈ несмотря на очень сходную архитектуру структурного каркаса, четырехспирального пучка. Причем сходство распостраняется не только на архитектуру ≈ четырехспиральный пучок ≈ но и на ход цепи сквозь эту архитектуру, т.е. на мотив укладки цепи. Последнее подчеркивается общей для всех трех белков топологической схемой, приведенной внизу рисунка (схема изображает вид пучка с торца).
Итак, при одинаковом мотиве укладки цепи белки могут работать совсем по-разному. А вот миогемэритрин и классический кислород-связывающий белок миоглобин (Рис.14-2) делают одно и то же дело (только первый ≈ в червях, а второй ≈ в хордовых), ≈ но их архитектуры совсем непохожи, ≈ за исключением того, что оба они ≈ a-белки. Но в миогемэритрине все a-спирали лежат параллельно, а в миоглобине спирали организованы в два перпендикулярных слоя.

Рис.14-2. Структура глобина: скрещенные слои по три a-спирали в каждом. Спирали A, E и F (они занумерованы буквами по порядку нахождения в цепи) находятся в верхнем слое, спирали H, G и B ≈ в нижнем. Короткие (из 1 ≈ 2 витков каждая) спирали С и D не изображены, так как они не консервативны в глобинах. В щели верхнего слоя находится гем. Такие «скрещенные слои» напоминают ортогональную упаковку b-листов.

Это ≈ еще один пример того, что сходная функция может осуществляться белками с разной архитектурой, а белки одинакового устройства могут заниматься совсем разным делом.
Я, как и раньше, хочу привлечь ваше внимание к нетривиальным случаям малой связанности структуры и функции белка, понимая, что вы и так знаете, что родственные белки ≈ например, миоглобин и другие глобины ≈ похожи по строению и занимаются одним и тем же делом.
Сравнивая миоглобин с миогемэритрином, я хочу обратить ваше внимание еще на то, что активный центр обоих этих белков (в первом случае этот центр ≈ гем с ионом железом внутри, во втором ≈ два иона железа), ≈ этот центр локализован в «архитектурном дефекте» структуры ≈ в данном случае, в щели между раздвинутыми спиралями.

Рассмотренные выше «пучки» типичны для упаковки весьма длинных a-спиралей. Они встречаются как в водорастворимых глобулярных белках, так и в фибриллярных и в мембранных белках. При этом ядро белка, заключенное между a-спиралями (гидрофобное ≈ в водорастворимых глобулярных и фибриллярных белках, гидрофильное ≈ в мембранных) имеет вытянутую, квазицилиндрическую форму.
Однако для относительно коротких спиралей, типичных для глобулярных белков ≈ их длина обычно составляет около 20 при диаметре 10 ≈ более характерна квазисферическая укладка спиралей вокруг «квазишарового» гидрофобного ядра, сложенного из сидящих на этих спиралях боковых групп..
Типичная упаковка спиралей в глобулярном белке показана на Рис.14-3. Ее нельзя описать в терминах параллельной и перпендикулярной упаковки спиралей ≈ большинство межспиральных контактов имеет угол около 40 ≈ 600.

Рис.14-3. Типичная упаковка спиралей в глобулярном белке: N-концевой домен актинидина (ход петель прослежен очень грубо). Обратите внимание, что архитектуру этого домена невозможно описать в терминах колинеарных и ортогональных упаковок a-спиралей.

Однако и такие сложные укладки можно неплохо описывать и классифицировать при помощи модели «квазисферических многогранников», которую мы с Алексеем Мурзиным предложили 10 лет назад. Для примера, ≈ покажу (Рис.14-4), как эта модель описывает только что показанную (на Рис.14-3) a-спиральную глобулу. Эти два последних рисунка, кстати, взяты из опубликованной в «Nature» рецензии на нашу работу.

Рис.14-4. Размещение a-спиралей на ребрах квазисферического многогранника, моделирующее N-концевой домен актинидина. Стрелки указывают ход соединяющих a-спирали петель.

Рис.14-5. Другие примеры того, как упаковка спиралей в глобулярном белке описывается моделью квазисферических многогранников. (а) С-концевой домен термолизина и его модель, основанная на размещении спиралей на ребрах квазисферического многогранника; (б) модель четырехспиральной глобулы, показанной на Рис.14-1.

Не откажу себе в удовольствии показать и еще пару рисунков из той же рецензии (Рис.14-5а).
Кстати, модель квазисферических многогранников довольно прилично описывает и довольно длинные спиральные пучки ≈ те, что мы видели на Рис.14-1. Это демонстрируется рисунком 14-5б.

Суть модели квазисферических многогранников заключается в том, что она концентрирует наше внимание на расположении спиралей вокруг шарового ядра глобулы. Модель учитывает только, что a спирали ≈ твердые вытянутые частицы ≈ плотно окружают ядро; и что полярные концы спиралей должны находиться на поверхности глобулы. Каждая упаковка спиралей может моделироваться многогранником (Рис.14-6), каждая вершина которого соответствует как бы половине спирали. Самые компактные, «квазисферические» многогранники (Рис.14-7) описывают компактные глобулы. Упаковки, близкие к идеальным, и наблюдаются в глобулярных a-белках. При этом каждому данному числу спиралей отвечает один многогранник, а в его рамках существует несколько (от двух до десяти) типов укладок, соответствующих различным размещениям осей спиралей на ребрах этого многогранника. Среди этих укладок есть и рассмотренные выше «пучки спиралей», и «скрещенные слои».

Рис.14-6. Построение многогранника для описания упаковки спиралей. (а) Компактная упаковка трех a-спиралей (цилиндров ≈ 10 в диаметре ≈ с осями). (б) Построение многогранника: центр упаковки окружается сферой радиусом в 10 ; ее пересечение с осями спирали дает вершины многогранника. На трех из его ребер лежат оси спиралей. Те части ребер, что лежат внутри сферы, оставлены темными. Точки пересечения осей со сферой образуют вершины многогранника. Каждой вершине соответствует одна половинка одной спирали. Оси спиралей образуют часть ребер многогранника, а прочие ребра описывают контакты спиралей.

Рис.14-7. Квазисферические многогранники (а), описывающие компактные укладки трех, четырех, пяти и шести спиралей. Большее число спиралей не может уложиться вокруг округлого ядра. Каждый многогранник описывает несколько типов укладок, т.е. типов «штабелей» спиралей, соответствующих различным размещениям осей спиралей на его ребрах. Таких укладок ≈ две для трехспирального комплекса [(б): лево-, и (в): правозакрученный (как на Рис.14-3, 14-4) пучок], десять ≈ для четырехспирального, десять ≈ для пятиспирального, и восемь ≈ для шестиспирального комплекса («штабеля» для четырех- ≈ шестиспиральных глобул не показаны, но их, при желании, легко построить самостоятельно, разместив спирали ≈ всеми возможными способами ≈ на ребрах многогранника так, чтобы каждая вершина многогранника соответствовала бы одному концу одной спирали). Те упаковки, где межспиральные углы способствуют плотному контакту спиралей ≈ см. Рис.14-9 ≈ встречаются в белках чаще, чем прочие.

Интересно, что в наблюдаемых архитектурах a-спиральных белков вдоль ребер квазисферических многогранников идут не только спирали, но и ≈ как правило ≈ соединяющие их нерегулярные петли (ср. Рис.14-6 и 14-7). Иными словами, в типичном случае белковая цепь как бы обволакивает свое гидрофобное ядро, следуя по непрерывной цепочке ребер квазисферического многогранника.

Обратимся теперь к вопросу о том, как создается плотная упаковка в белковой глобуле. То, что такая упаковка существует, следует из экспериментов, показавших, что белок так же плотен и так же тверд, как органический кристалл. Однако еще предстоит объяснить, как достигается такая упаковка, ≈ слишком уж сложны по форме и разнообразны боковые группы белковой цепи.
Точнее, принцип создания плотной упаковки ≈ и то в самых общих чертах ≈ более или менее ясен только для a-спиралей, почему и уместно рассмотреть этот вопрос именно сейчас.
Первая модель плотной упаковки a-спиралей, упаковка по принципу «выступы (боковые группы) во впадины (между боковыми группами)», была предложена Криком в 1953 г., еще до расшифровки трехмерной структуры первого белка. Затем она была независимо развита Ефимовым и группой Чотиа-Левитт-Ричардсон, и к настоящему времени приобрела вид модели «хребты (боковых групп) в лощины (между таковыми)».
Согласно этой модели, боковые группы на поверхности спирали образуют выступы, создающие разделенные лощинами хребты. «Хребты и лощины» несколько лучше описывают реальность, чем «выступы и впадины», так как разворот одного выступа (одной боковой цепи) в сторону другого (другой боковой цепи) может сделать тот или другой «хребет из выступов» более отчетливым. Хребты (и идущие вдоль них лощины) бывают двух типов. Хребты типа «+4″ создаются боковыми группами остатков, расположенных в цепи под номерами «i», «i+4″, «i+8″, и т.д. (иными словами ≈ с периодом 4), хребты типа «+3″ создаются боковыми группами номер «i», «i+3″, «i+6″, и т.д. (т.е. с периодом 3). Рисунок 14-8 показывает, что эти хребты образуют разного знака углы с осью спирали.

Рис.14-8. a-Спираль; отмечены Сa-атомы (а) и Сb-атомы (б – г). Нумерованные остатки обращены к читателю. Показаны два сорта хребтов (тонкие линии на лицевой поверхности спирали) из сближенных боковых групп (в,г). Хребты из боковых групп «i»-»i+4″-»i+8″… идут под углом -25о к оси спирали (в), хребты из групп «i»-»i+3″-»i+6″… ≈ под углом +45о (г); на рисунке углы представляются меньшими, так как типичные хребты проходят через массивные боковые группы, а на рисунках в, г – через центры Cb-атомов.

При плотной упаковке хребты одной спирали входят в лощины другой. При этом есть две основные возможности:
А) Хребты «+4″ одной спирали входят в лощины между такими же хребтами «+4″ другой (Рис.14-9а) (здесь для получения плотной упаковки спираль II накладывается на спираль I и поворачивается, пока хребты «+4″ обеих спиралей не станут параллельно друг другу). При такой упаковке угол между осями спиралей близок к -500. Этот угол наиболее характерен для контактов спиралей в a-спиральных глобулах. Он также типичен для контакта спиралей в a/b и a+b белках, о которых речь пойдет ниже. Дело в том, что при этом контакте спиралей скрученность слоя a-спиралей (угол скручивания в нем близок к -500/10, где -500 ≈ угол между осями соседних спиралей, а 10 ≈ ширина a-спирали) неплохо стыкуется с типичной скрученностью b-листа (имеющем тот же угол скручивания, -250/5, где -250 ≈ угол между осями соседних b-тяжей, а 5 ≈ ширина b-тяжа).

Рис.14-9. Два основных способа плотной упаковки боковых групп при контакте спиралей: под углом -50о (а) и +20о (б). Мы смотрим на зону контакта сквозь одну спираль (сквозь перевернутую вдоль своей оси a2). Остатки «нижней» спирали a1 изображены более светлыми, а верхней (a2) ≈ более темными.

Б) Хребты «+3″ одной спирали входят в лощины между хребтами «+4″ другой (Рис.14-9б). При такой упаковке угол между осями спиралей близок к +200. Этот угол наиболее характерен для контактов спиралей в пучках ≈ и в a-спиральных глобулах, и в фибриллярных, и в мембранных белках.
Кроме того, хребты «+3″ одной спирали могут входить в лощины между такими же хребтами «+3″ другой, образуя очень короткий контакт почти перпендикулярных спиралей. В силу малости размера этого контакта, он на рисунке 14-9 не показан, ≈ хотя такой «перпендикулярный» контакт спиралей довольно типичен для a-спиральных глобул.
Заключая описание плотной упаковки, надо заметить, что реальные отклонения от приведенных выше «идеальных» углов весьма велики, так как боковые группы сильно варьируют по размеру. По той же причине в b-структуре (где боковые группы выступают меньше ≈ поверхность b-листа довольно плоская, а спирали ≈ выпуклая) картина типа проникновения хребтов в лощины там совсем смазана и наблюдается лишь в отдельных случаях.

Как согласуется плотная упаковка спиралей с моделью размещения спиралей на ребрах квазисферических многогранников, о которой речь шла выше? Оказывается, довольно любопытным образом. Те «многогранные» упаковки, где углы между спиралями близки к -500 и/или +200, требующимся для плотного контакта спиралей, ≈ эти упаковки встречаются часто; а прочие ≈ редко (но тоже встречаются). Так, из двух изображенных на Рис.14-7 трехспиральных упаковок одна, левозакрученный пучок, приводит к межспиральным углам в -600 (что близко к углу -500, требующемуся для плотной упаковки, см. Рис.14-9а), и такой трехспиральный пучок встречается часто; а другая, правозакрученный пучок, приводит к межспиральным углам в +600 (что далеко от всех углов ≈ -500, +200, 900 ≈ опримальных для плотного контакта), ≈ и такой трехспиральный пучок встречается на порядок реже.

Обратимся теперь к «смешанным» белкам, сложенным из b-листов и a-спиралей. Для них характерна слоистая структура, причем a-спирали и b-участки не могут лежать в одном листе ≈ это привело бы к энергетически невыгодной дегидратации водородных связей на краю b-листа (Рис.14-10).

Рис.14-10. Слоистая структура смешанных (a/b, a&b и a+b) белков. Вид с торца b-листа. a-спирали (квадратики – для подчеркивания плотности упаковки глобулы) и b-тяжи (прямоугольники) не могут лежать в одном слое ≈ это привело бы к дегидратации водородных связей (черные точки) на краю b-листа.

Различают a/b («a дробь b») и a+b («a плюс b») белки (точнее ≈ домены). Иногда их объединяют в общий разряд a&b («a и b») белков.

В a/b доменах b-структура параллельна, и a-спирали также параллельны друг другу (и антипараллельны b участкам), а характерное чередование a и b участков в цепи имеет вид -a-b-a-b-a-… .
Есть два характерных мотива строения a/b белков: a/b цилиндр, где b-цилиндр лежит внутри цилиндра, сложенного из a-спиралей (Рис.14-11а), и «укладка Россманна», где более или менее плоский (не считая обычного ≈ правого, если смотреть вдоль b-тяжей ≈ пропеллерного скручивания) b-слой лежит между комплементарно ему скрученными слоями a-спиралей (Рис.14-11б). В отличие от ранее рассмотренных доменов, a/b домены обычно имеют два гидрофобных ядра: в укладке Россманна ≈ между b-листом и каждым из слоев спиралей; в a/b цилиндре ≈ внутри b цилиндра (меньшее ядро) и между b и a цилиндрами (большее).

Рис.14-11. Типичные мотивы строения a/b белков и их упрощенные модели (вид на модели ≈ с торца b-слоя): «a/b цилиндр» в триозофосфатизомеразе (а); «укладка Россманна» в NAD-связывающем домене малатдегидрогеназы (б). На детальной картинке в первом белке видна обращенная к нам впадина, образованная расходящимися в форме розетки петлями; она идет к центру b-цилиндра. Во втором ≈ слева вверху видна щель между расходящимися вниз и вверх петлями.

В a/b цилиндре обычно насчитывается восемь a- и восемь b-участков, причем почти все a/b цилиндры имеют одинаковую топологию: все соседние и расположенные через один по цепи b- и a-участки контактируют друг с другом. По-видимому, такое строение обеспечивает особую стабильность белковой глобулы, так как многочисленные белковые глобулы с такой архитектурой (наблюдаемой в 10% белков) все очень похожи друг на друга по форме, ≈ часто и без каких-либо следов общего происхождения в аминокислотной последовательности, и без какой-либо общности функций.

Без общности функций – да; без общности в строении активного центра – да; но не без общности места активного центра в архитектуре глобулы, ≈ каждая архитектура содержит места (обычно ≈ впадины), как бы специально созданные этой архитектурой для активного центра ≈ что бы он ни делал.
Я хочу обратить ваше внимание на «воронку» на оси a/b цилиндра (Рис.14-12а), ≈ вы видите, что эта вмятина, заложенная в общей архитектуре белка, не прикрыта петлями. Здесь находится активный центр. Точнее: из двух таких «воронок», расположенных на противоположных торцах a/b цилиндра, под активный центр используется только одна, ≈ та, куда смотрят С-концы b-участков и N-концы a-спиралей. Считается, что именно эти концы (возможно, из-за множества открытых NH-групп N-концов спиралей), вместе с соединяющими их короткими петлями, особенно пригодны для связывания разнообразных субстратов. Впрочем, этот вопрос еще недостаточно ясен.

Рис.14-12. Типичное положение активного центра (active site) в a/b белках: в «воронке» на оси a/b цилиндра (а), и в щели (crevice), образованной расходящимися петлями в «укладке Россманна» (б). Картинки, с небольшими изменениями, взяты из [5].

Аналогичное размещение активного центра ≈ в щели, во вмятине, причем во вмятине, куда тоже смотрят С-концы b-участков и N-концы a-спиралей ≈ наблюдается и в «укладках Россманна». Только здесь вмятина образуется не при расхождении петель от центра цилиндра, а при расхождении петель, одна часть которых идет от b-листа к спиралям лежащим под листом, а другая ≈ над этим листом (Рис.14-12б).

Теперь перейдем к a+b белкам. В их основе лежит антипараллельная (а не параллельная, как в a/b белках) b-структура.
В a+b белках выделяются два класса. Белки одного класса (их порой называют ab-складками) напоминают a/b белки тем, что в них слой a-спиралей лежит на b-листе. Они напоминают a/b белки также регулярным (но с иным, чем в a/b белках) чередованием a и b участков в цепи и в пространстве. Белки другого класса («собственно» a+b белки) не имеют такого чередования, в их цепях a-структура «отмешана» от b-структуры.

Характерное чередование a- и b-участков в цепи ab-складки имеет вид …a-b-b-a-b… или ……a-b-b-b-b-a-b-b… (Рис.14-13). Здесь отдельные a-спирали лежат между b-шпильками или b-листами из четного числа b-тяжей. Соседние по цепи b-участки в ab-складках образуют антипараллельные b-шпильки; а из-за четного (а не нечетного, как в a/b белках) числа b-тяжей между a-спиралями, и из-за общей колинеарности этих тяжей a-спиралям, ≈ a-спирали также образуют антипараллельные шпильки. Интересно, что такая (или, точнее, сходная ≈ abbabb) «складчатая» конструкция белка была сначала теоретически предсказана (точнее ≈ предложена в качестве проекта белково-инженерного дизайна), а затем уже такие архитектуры были массово обнаружены в природе, ≈ причем их оказалось особенно много среди РНК-связывающих белков.

Рис.14-13. Один из типичных мотивов строения a+b белка: «ab складка» (ab-plait) в рибосомальном белке S6. ab складка отличается более регулярным, чем в «собственно» a+b белках, чередованием вторичных структур в цепи (в данном случае: babbab). Радужная кодировка (синий – голубой – зеленый – желтый – оранжевый – красный) позволяет проследить ход цепи, от N- к С-концу. Справа помещена схема строения этого белка (вид с торца структурных участков, приблизительно колинеарных). Спирали занумерованы буквами. «+» на торце a- или b-участка означает, что он идет от нас (т.е. что к нам обращен его N-конец), точка ≈ что к нам.

В «собственно» a+b доменах (Рис.14-14) a- и b-участки расположены в цепи нерегулярно, и скорее ≈ как бы блоками. Такие белки обычно выглядят как b-лист (часто ≈ загнутый сам на себя), прикрытый отдельными a-спиралями или a-спиральным субдоменом; b-структура в них в основном антипараллельна, как в «чистых» b белках.

Рис.14-14. Характерный мотив строения a+b белков: нуклеаза стафиллококка. «Собственно» a+b белки отличаются менее регулярным, чем в a/b белках или ab-складках, чередованием вторичных структур в цепи (в данном случае: bbbabbaa). Мотив укладки цепи, наблюдаемый в b-домене нуклеазы, называется «ОБ-укладка» («OB-fold», то есть «Oligonucleotide-Binding fold», или «укладка [имени] Олега Борисовича [Птицына]«). Справа помещена схема строения этого, часто встречающегося в разных белках, ОБ-домена (вид сверху на ортогональную упаковку b-участков). b-тяжи занумерованы цифрами.

Очень характерной чертой a/b и a+b белков (а равно и b-белков) является правовинтовой (т.е. «к нам ≈ против часовой стрелки») ход перемычек (Рис.14-15) между параллельными b-участками одного и того же b-листа, следующими друг за другом в цепи (но не обязательно при том соседними в этом листе) (см. Рис.14-11 и далее). При этом перемычка между такими параллельными b-участками в a/b- и a+b-белках, как правило, включает в себя a-спираль. В b (и порой в a+b) белках в такой правовинтовой перемычке между параллельными b-участками одного листа лежит ≈ вы должны помнить из прошлой лекции («abcd» структуры и т.д.) b-участок другого листа, а иногда и отдельный b-лист. Иногда (довольно редко) в перемычке между параллельными b-участками нет ни a-, ни b-структуры, ≈ но и тогда эта перемычка обычно право-, а не левовинтовая.
На следующей лекции мы увидим, что такой ход перемычки позволяет большее разнообразие кодирующих, т.е. стабилизирующих такую структуру последовательностей.

Рис.14-15. Типичный, правовинтовой ход перемычек между параллельными b-тяжами одного листа. В перемычке обычно находится еще один участок вторичной структуры.

Завершая обзор структур глобулярных белков, я хочу еще раз подчеркнуть, что одни и те же ≈ или очень похожие ≈ архитектуры часто встречаются в белках, совсем не сходных функционально или филогенетически. Это открытие заложило основы физической, или рациональной (как это чаще называется в литературе) классификации белков.
Наиболее полная и популярная на сей день классификация представлена в компьютерном классификаторе SCOP (Structural Classification of Protein), сделанном А.Г.Мурзиным после его переезда из Пущино в Кембридж. Она начинается с класса белка (a, b и т.д.), классы подразделяются по мотивам укладки цепи, и уже мотивы подразделяются на суперсемейства, где просматривается хоть какая-то гомология последовательностей, те ≈ на семейства с явно проявляющейся гомологией, и т.д. Но, пожалуй, еще более последовательно физическая классификация белковых структур проводится классификатором САТН (Class – Architecture – Topology – Homology), сделанном в группе Дж. Торнтон в Лондоне.

ПРОСТРАНСТВЕННОЕ СТРОЕНИЕ БЕЛКОВ 3

Автор:mb. Дата:Июль 8, 2011

Теперь в фокусе нашего внимания будут находиться глобулярные, а точнее ≈ водорастворимые глобулярные белки. Именно они наиболее исследованы: для сотен ≈ изучена спонтанная самоорганизация, для тысяч ≈ расшифрована атомная трехмерная структура. Поэтому именно их обычно имеют в виду, говоря о «типичных белковых структурах», о «закономерностях, наблюдаемых в строении и самоорганизации белков» и т.д. После этой необходимой оговорки ≈ обратимся к структурам глобулярных белков.

Рентгенструктурные исследования (а позже, ≈ двух- и многомерный ЯМР) позволили установить ≈ за 40 лет интенсивной работы многих десятков лабораторий ≈ атомную структуру порядка 2000 белков (а если считать и мутантные формы, и различные функциональные состояния ≈ то раз в пять больше).

Что можно увидеть в структурах белков ≈ водорастворимых глобулярных белков ≈ с птичьего полета?
Мы видим, что небольшие (из 50 ≈ 150, реже из 200 ≈ 250 остатков) цепи укладываются в компактную глобулу диаметром 25-40 (Рис.13-1); и что более крупные белки состоят из нескольких таких субглобул ≈ «доменов» (Рис.13-2). Белковая цепь упаковывается в глобулу так же плотно, как органические молекулы ≈ в кристалл. Это видно и при взгляде на поверхность белка (Рис.13-1а), и на «срезе» белковой глобулы, показанном на Рис.13-1б. Однако, рассматривая белок, нам предстоит рассматривать не плотноупакованные электронные облака (или Вандерваальсовы поверхности) атомов ≈ иначе ничего не будет видно внутри белка ≈ а только очищенные от «мяса» атомов (Рис.13-1в) и даже от боковых групп вообще (Рис.13-1г) скелеты белковых молекул. Поэтому не поддавайтесь часто создаваемому рисунками ощущению «рыхлости» белковых глобул!

Рис.13-1. Картинки, изображающие строение небольшого белка ≈ a-субъединицы интерлейкина 8 ≈ при разной степени схематизации. (а) Атомная модель (изображены только «тяжелые», не-водородные атомы: синие ≈ азоты, красные ≈ кислороды, серые ≈ углероды); в силу того, что цепь в глобуле упакована плотно, мы видим лишь поверхность белка. (б) Срез атомной модели подчеркивает плотность упаковки. (в) Скелетная модель главной цепи (темная линия) и боковых групп (более светлые отростки). (г) Ход главной цепи. (д) Схема строения белка, на которой выделены вторичные структуры (две a-спирали и один b-лист из трех b-тяжей) в главной цепи белка. (е) Структурный каркас белка, сложенный из вторичных структур. Все рисунки даны в одной и той же проекции и в одинаковом масштабе.

Рис.13-2. Глобулярные домены в g-кристаллине. Цветная кодировка трассирует ход цепи (от синего на N-конце цепи к зеленому в середине и к желтому и красному на С-конце).

Каркас пространственной структуры подавляющего большинства глобул (доменов) сложен из уже изученных нами регулярных вторичных структур ≈ a-спиралей и b-листов (Рис.13-1д), которые стабилизованы регулярными водородными связями в регулярной главной цепи. Кстати, эти вторичные структуры были теоретически предсказаны Полингом, Кори и Брэнсоном еще до расшифровки атомного строения белковых молекул. «Штабель», сложенный из этих структур (Рис.13-1е), определяет основные особенности строения белка.
Каркас из a- и b-структур как бы окружает гидрофобное ядро (или ядра) белка, а нерегулярные петли лежат дальше, на периферии глобулы. Петли практически никогда не входят внутрь белковой глобулы ≈ и неудивительно: их не вовлеченные во вторичную структуру пептидные группы не должны порывать своих водородных связей с водой, это вело бы к нестабильности глобулы.

В зависимости от строения каркаса, глобулярные белки подразделяются на: «чистые» b белки; «чистые» a белки; и «смешанные» a/b, a&b и a+b белки. Строго говоря, эта классификация типов белковых структур относится к малым белкам, а также к отдельным доменам (т.е. к компактным субглобулам, из которых сложены большие белки), так как большие белки могут содержать, например, и b-, и a-домены одновременно.

Нас будет прежде всего интересовать: 1) архитектура упаковки a- и b- структурных сегментов в компактную глобулу (Рис.13-1е); и 2) ход цепи через глобулу (Рис.13-1д), ≈ или, как часто говорят, «топология белковой глобулы».

При этом мы часто будем использовать упрощенные схемы строения белков (Рис.13-3). Такое упрощение достигается не только обращением основного внимания на вторичные структуры (при пренебрежении к детальному строению петель), но и пренебрежением различий в размерах этих структур и к деталям их взаимной ориентации [при этом мы переходим от "укладок" ("folds", Рис.13-3а) к "мотивам укладок" ("folding patterns", Рис.13-3б) белковых цепей].

Рис.13-3. Упрощенные представления белковых структур. (а) Детальная укладка («fold»), описывающая размещение вторичных структур в цепи белка и в пространстве (см. также Рис.13-1д). (б) Мотив укладки белковой цепи («folding pattern»): опущены детали хода петель, размера и точной ориентации a-спиралей (изображенных в виде параллельных цилиндров) и b-тяжей (изображенных в виде стрелок). (в) Упаковка: штабель («stack») структурных сегментов: петли удалены, опущены размер, ориентация и направление a-спиралей и b-тяжей (изображенных поэтому в виде лент).

Упрощение это оправдывается тем, что детали строения петель и точные размеры и ориентации структурных сегментов (и даже некоторые маленькие структурные сегменты) не сохраняются, когда мы переходим от рассматриваемого белка к его довольно близкому (имеющему сходную аминокислотную последовательность, т.е. явно общее происхождение) родственнику ≈ например, от гемоглобина a к гемоглобину b (Рис.13-4).

Рис.13-4. Два близко родственных белка: гемоглобин a и гемоглобин b лошади (оба ≈ с гемом). Найдите сходства и различия! (Подсказка: при общем высоком сходстве ≈ различия в деталях конформации петель, в деталях ориентации некоторых спиралей, и в одном дополнительном спиральном витке в b глобине, справа).

На следующем, более высоком уровне упрощения, необходимом для классификации структур белковых глобул, мы иногда вообще будем рассматривать лишь упаковку структурных сегментов в глобулу ≈ т.е. сложенные из вторичных структур упаковки, или «штабели» («stacks»), ≈ временно забыв о петлях, соединяющих эти вторичные структуры в единую молекулу (Рис.13-3в).
Я буду специально пользоваться такими упрощенными схемами мотивов укладки и упаковки белковой цепи, ≈ вырисовывая в то же время, для сравнения, и «истинные» структуры белков так, как их дает компьютер. Казалось бы, зачем нужны упрощенные схемы, если компьютер может нарисовать «все как есть». Дело в том, однако, что «все как есть» содержит очень много деталей, а схемы берут из них главные, повторяющиеся в разных сходных белках. Поэтому они удобны и для классификации белковых структур, и для выделения их главных, типических черт. Рассматривая подробные картинки белков, вы все равно в уме выделяете такие типические черты, ≈ а схемы просто позволяют вам систематизировать ваше интуитивное выделение. Кроме того, они дают возможность составить «словесный портрет» белка. На практике такие схемы и такие словесные портреты вам понадобятся сразу же, как только вы захотите выяснить, на кого похож интересующий вас белок: они подчеркивают главное, убирая детали. Конечно, эти «детали» могут быть самыми важными для функционирования белка, и мы с этим встретимся, ≈ но это обстоятельство только подчеркивает относительную независимость функции белка от мотива укладки цепи в нем.

И «упаковки», и «мотивы укладки» цепи в белковую глобулу сосредотачивают наше внимание не просто на всевозможных (рыхлых, ажурных и т.п.) комплексах из структурных сегментов, а лишь на тех, где они, эти структурные сегменты, уложены плотно. Так мы очерчиваем те области конфигурационного пространства, что соответствуют плотной (но без стерического перекрывания) упаковке белковой цепи в глобулу ≈ т.е. окрестности достаточно глубоких минимумов энергии невалентных взаимодействий. Они дают возможность не только классифицировать уже известные белковые структуры, но и предвидеть новые, еще не найденные в природе.

Здесь уместно сделать пояснение. Когда я буду говорить о классификации белковых структур, об их сходстве и т.д. ≈ я буду иметь в виду не тривиальные вещи типа того, что все глобины похожи друг на друга, независимо от того, работают ли они в человеке или в морском червяке. Это, конечно, так, и белки можно классифицировать по филогенетическим семействам, внутри которых функции и, главное, аминокислотные последовательности белков варьируют не слишком сильно. Однако часто сходными пространственными структурами обладают белки, эволюционно никак, по всем тестам, не связанные между собой. И вот это, чисто структурное сходство я буду подчеркивать.

Начнем с изучения строения b-белков. b-структурные домены устроены, пожалуй, проще других: вытянутые участки цепи собраны обычно в два, реже ≈ в несколько b-листов, уложенных друг на друга. Иными словами, «штабеля» вторичной структуры в b-белках выглядят довольно просто.
В b-белках преобладает антипараллельная b-структура.
Так как белки собраны из асимметричных (L) аминокислот, то вытянутые участки слегка скручены сами по себе. Причем, так как минимум энергии вытянутой конформации лежит, как вы помните, на карте Рамачандрана выше диагонали, ≈ вытянутые участки имеют левовинтовую скрученность. В итоге объединения, при помощи водородных связей, скрученных b-участков в листы, ≈ определенным образом скручены и эти b-листы (Рис.13-5). Их поверхность напоминает пропеллер. Угол между смежными вытянутыми участками b-листа составляет около -250. Значит, этот пропеллер выглядит как левовинтовой, если смотреть на него поперек хода b-участков (см. Рис.13-5а). И то же скручивание является правовинтовым, если смотреть вдоль хода b-участков (см. Рис.13-5б). Так обычно и делают, ≈ смотрят вдоль хода b-тяжей и говорят, что у b-листа – правопропеллерная скрученность.

Рис.13-5. Лист b-структуры, вид поперек (а) и вдоль (б) b-тяжей. Лист имеет складчатую поверхность (она подчеркивается выступающими Сb-атомами, окрашенными в зеленый цвет), и ≈ обычно ≈ правопропеллерную (если смотреть вдоль тяжей) скрученность. Водородные связи между b-тяжами изображены пунктиром.

Существует два основных типа упаковки b-листов: продольная и ортогональная (Рис.13-6а и 13-6б). В обоих случаях b-листы упакованы «лицом к лицу», и гидрофобное ядро домена заключено между ними, но в первом случае листы повернуты друг относительно друга слабо ≈ на угол около -300 (плюс-минус 10-150), а во втором ≈ сильно, на 900 (плюс-минус 10-150); углы, лежащие вне этих двух диапазонов (в частности, углы около +300), наблюдаются редко.

Рис.13-6. Ортогональная (а) и продольная (б) упаковка b-листов. Вид сверху и с торца. На виде сверху ≈ приближение b-тяжа к читателю показано его (тяжа) расширением. Штрихпунктир ≈ ось ортогонального b-бочонка. На оси находятся оба «открытых» угла этой упаковки. Здесь b-листы наиболее раздвинуты. В двух других, «закрытых» углах листы наиболее сближены; здесь цепь изгибается и переходит из слоя в слой. При ортогональной упаковке гидрофобное ядро имеет приблизительно цилиндрическую форму. В продольной упаковке, наоборот, ядро плоское, расстояние между скрученными листами меняется мало, а поворот одного листа относительно другого позволяет гидрофобным поверхностям лежащих друг над другом скрученных b-тяжей соприкасаться на большой длине. Картинка, с небольшими изменениями, взята из C.Chothia & A.V.Finkelstein, Annu. Rev. Biochem. (1990) 59:1007-1039.

При ортогональной упаковке (Рис.13-6а) b-участки скручены и обычно несколько изогнуты, так что общая форма «штабеля» начинает напоминать цилиндр с сильным наклоном b-участков к оси. Такую упаковку часто так и называют, ≈ b-цилиндром или b-бочонком, хотя в b-цилиндрах, сложенных из антипараллельной b-структуры (в отличие от b-цилиндров, сложенных из параллельной b-структуры, о которых речь впереди), ≈ в данном случае сеть водородных связей часто разорвана (или надорвана) на противоположных боках бочонка, что позволяет довольно четко выделить два b-листа. В «закрытом» углу такой упаковки b-участки обоих листов близко сходятся, так что цепь перетекает из листа в лист ценой изгиба и поворота на 900: можно сказать, что единый b-лист согнут и уложен сам на себя. В противоположных ≈ «открытых» ≈ углах b-листы расходятся, а образующаяся щель обычно заполняется или a-спиралью, или нерегулярными петлями, ≈ или активным центром, как в ретинол-связывающем белке (Рис.13-7).

Рис.13-7. Ретинол-связывающий белок: пример ортогонально упакованного b-листа. Ход цепи напоминает узор «меандр» (см. топологическую схему ≈ плоскую развертку b-цилиндра ≈ сбоку). На этой схеме b-тяжи изображены стрелками. «Меандр» получается потому, что соседние по цепи b-тяжи являются соседями на поверхности цилиндра; они связаны водородными связями (связь, существующая между крайними b-тяжами, изображена на плоской развертке маленькими черточками). Ретинол-связывающий центр находится у оси цилиндра. Сам ретинол окрашен в фиолетовый цвет. Цветная кодировка прослеживает ход цепи по b-цилиндру. Цифры на топологической схеме указывают порядок структурных сегментов в цепи.

Продольная упаковка (Рис.13-6б) характерна для листов, которые лишь скручены, как пропеллер, но не изогнуты дугой. Такую упаковку обычно называют b-сэндвичем. Торцы b-сэндвича прикрыты нерегулярными петлями (вы это видите на Рис.13-8). В некоторых b-сэндвичах крайние тяжи b-листов столь сближены (иногда они даже соединены несколькими водородными связями), что эта упаковка принимает форму цилиндра с малым наклоном b-участков к оси.

Рис.13-8. Примеры продольной упаковки b-листов. Мотивы укладки цепи в домене g кристаллина (а) (см. также Рис.13-2), в b-домене белка ≈ катаболитического активатора (б) и в белке оболочки сателлитного вируса некроза табака (в). Внизу показаны топологические схемы этих белков. Все эти белки включают характерную топологию «греческого ключа» (или «согнутой пополам b-шпильки»), в которой четыре соседних по цепи b-тяжа антипараллельны, причем первый и четвертый связаны водородными связями. На топологических схемах двухслойный b-сэндвич развернут (как разрезанный сбоку цилиндр) и представлен в одной плоскости. Место разреза выбрано так, чтобы подчеркнуть симметрию укладки цепи. Так, в g кристаллине он приходится на стык b-тяжей 3 и 8 ≈ с тем, чтобы подчеркнуть сходство структур первой (тяжи 1 ≈ 4) и второй (тяжи 5 ≈ 8) половинок домена. На топологической схеме сближением b-тяжей показаны Н-связи между ними; дополнительно, Н-связи между краями развертки (если они есть) показаны маленькими черточками на краях. Увеличенное расстояние между b-тяжами отделяет один b-лист сэндвича от другого (если там нет водородных связей b-тяжей). Домен g кристаллина содержит повтор, два греческих ключа: из тяжей 1 ≈ 4 и 5 ≈ 8; и еще один греческий ключ образован b-тяжами 4 ≈ 7. Изображенные на рисунках (б,в) белки содержат «ключи» из тяжей 3 ≈ 6 и 4 ≈ 7. Более того, они имеют топологию многократно согнутой b-шпильки (она обычно называется «рулет»): здесь Н-связи соединяют также b-тяжи 1 и 8, 2 и 7, ≈ в дополнение к связям тяжей 3 и 6, 4 и 5, типичным для «греческих ключей». Обратите внимание, что топология «греческого ключа» позволяет белковой цепи окружить ядро глобулы лучше, чем позволяет «меандр» (Рис.13-7): не только b-структурой с боков, но и петлями сверху и снизу. Обычно продольные упаковки b-листов представляют собой b-сэндвич (а,б), но некоторые из них (например ≈ белка оболочки сателлитного вируса некроза табака и белков оболочки ряда других вирусов) можно представить также в форме b-цилиндров с колинеарными b-тяжами (в).

Необходимо подчеркнуть, что мотивов укладки белковой цепи имеется гораздо меньше, чем архитектур белковых глобул, а типов «штабелей» ≈ гораздо меньше, чем мотивов укладки белковой цепи.
Так, одному и тому же «штабелю», т.е. одной и той же упаковке структурных сегментов могут соответствовать разные мотивы укладки цепи в глобулу, т.е. эти сегменты могут быть по-разному связаны единой полипептидной цепью. Рис.13-8 показывает, как один и тот же b-сэндвич (при различной топологии, т.е. при различном ходе цепи через этот сэндвич) служит основой структуры трех разных белковых доменов ≈ домена g кристаллина (а), b-домена белка ≈ катаболитического активатора (б), а также белка вирусной оболочки (в). Причем два последних белка имеют даже одинаковый мотив укладки цепи – то есть в них цепь одинаково проходит через одинаковый b-структурный штабель (это подчеркивается фигурной скобкой на рисунке 13-8)!
Здесь я не могу удержаться от искушения показать вам еще один белок, в основе которого лежит b-сэндвич. Это ≈ иммуноглобулин, точнее ≈ так (или примерно так) устроен каждый домен этого большого белка (Рис.13-9).

Рис.13-9. Продольная упаковка b-листов в константном домене легкой цепи иммуноглобулина . Слева представлена подробная картина белка; радужная расцветка (от синего до красного) трассирует ход цепи, от N- к С-концу. На топологической схеме (в центре рисунка) подчеркнуты «греческие ключи». На рисунке справа дан вид на белок «снизу» (с торцов структурных сегментов). Прямоугольники – торцы b-тяжей. Крестик соответствует N-концу сегмента (т.е. он «идет от нас»), точка ≈ его С-концу (т.е. он «идет к нам»). Ход петель, соединяющих структурные сегменты, показан черной линией, если петля обращена к нам, и светлой, если она находится на противоположной стороне укладки. Обратите внимание, что такая схема позволяет представить колинеарную упаковку этих сегментов (b-тяжей) наиболее просто. Кроме того, она дает возмохность увидеть пространственное строение «греческих ключей» и заметить, что два имеющихся «ключа» в пространстве организованы по-разному.

Подобным же образом уложены цепи белков примерно пятидесяти (!) других суперсемейств, ≈ белков, не похожих на иммуноглобулин по аминокислотной последовательности (хотя часть из них и отвечает, как иммуноглобулин, за специфическое связывание каких-то объектов ≈ например, при межклеточном узнавании). Помимо удовольствия показать вам столь популярный мотив укладки цепи, я преследую еще одну цель: показать, что мотив строения белка с более или менее колинеарной упаковкой структурных сегментов проще всего отражается схемой, представляющей вид с торца на такой белок.

Перейдем к ортогональной упаковке b-листов. Рисунок 13-10 показывает, как один и тот же b-цилиндр (при различной топологии, при различном ходе цепи через ортогональную укладку b-листов) служит основой и сериновой протеазы типа трипсина (а), и протеазы кислой, типа пепсина (б).

Рис.13-10. Мотив укладки цепи в сериновой протеазе (а) и в кислой протеазе (б). В последнем белке петли укорочены и изображены довольно схематично. Показана схема ортогональной упаковки b-листов в этих белках, а также топологические схемы b-листов. Эти листы согнуты (при изгибе края листов уходят от читателя и смыкаются; возникающая при этом водородная связь краев b-листа изображена черточками); места перегибов b-тяжей соответствуют их более светлым частям. «Греческий ключ» в трипсине подчеркнут.

При этом b-домен белка ≈ катаболитического активатора имеет точно такой же мотив укладки цепи (т.е. ту же топологию хода цепи через такого же вида b-структурный штабель), что и совершенно не связанный с ним (ни генетически, ни функционально) белок оболочки сателлитного вируса некроза табака.
Примеры такого сходства структур при отсутствии какой-либо другой видимой связи между белками очень многочисленны.

Выше мы рассмотрели «базовые» конструкции b-белков. Есть и более сложные ≈ например, «многозаходный пропеллер».
В «пропеллере» нейраминидазы (Рис.13-11) ≈ шесть наклонно уложенных b-листов образуют розетку (в других белках бывает до восьми b-листов). Если рассматривать эти листы попарно ≈ они образуют b-сэндвичи, так что «пропеллер» часто описывают как суперцилиндр, сложенный из b-сэндвичей.


Рис.13-11. b-Структура в форме «шестилопастного пропеллера» в нейраминидазе. Внизу ≈ схема топологии этого белка, состоящего из шести антипараллельных b-листов.

Во «вмятине» на оси этого суперцилиндра ≈ вы видите, что она не прикрыта петлями ≈ находится активный центр. В ретинол-связывающем белке мы уже встречались с таким расположением активного центра ≈ во вмятине в центре цилиндра, и мы встретимся с ним еще.
Интересна также ≈ прежде всего своей регулярностью ≈ конструкция типа «b-призмы» или (другое название) «b-спирали» (Рис.13-12). Три грани такой призмы образованы тремя b-листами ≈ причем параллельными! ≈ а цепь проходит сквозь них по спирали, непрерывно переходя из одного листа в другой. При этом она как бы навивается на ось призмы, образуя либо обычную при соединении параллельных b-тяжей правую спираль, либо (в других призмах) спираль левую, исключительно редкую при соединении b-тяжей.

Рис.13-12. b-Призма в ацилтрансферазе (а) и в пиктатлиазе С (б). Обратите внимание на разную закрученность цепи вокруг длинной оси призмы: необычную, левую на рисунке (а) и обычную, правую ≈ на рисунке (б), а также на то, что при левой закрученности цепи отсутствует обычная (правопропеллерная, если смотреть вдоль b-тяжей, см. Рис.13-12б и Рис.13-5 ≈ 13-11) скрученность b-листа.

Теперь уместно поговорить о топологии b-белков. Прежде всего обращает на себя внимание то, что b-белки сложены преимущественно из антипараллельной b-структуры. Большинство рассмотренных нами до сих пор b-белков состояло из чистой антипараллельной b-структуры. Порой к ним примешивается небольшое количество параллельной (см. Рис.13-10б). Очень редко, но бывают белки, сложенные из чисто параллельной b-структуры (см. Рис.13-12).
То, что «примесь» параллельной к антипараллельной b-структуре довольно мала ≈ в общем, не удивительно, так как они имеют несколько разные конформации, так что их стык должен быть энергетически невыгодным. В какой мере энергетическая невыгодность структуры сочетается с относительной редкостью ее встречаемости ≈ об этом мы поговорим на одной из ближайших лекций; однако в целом ясно, что стабильная система ≈ а белок стабилен ≈ должна состоять в основном из стабильных же элементов и избегать внутренне нестабильных.
Преимущественно же антипараллельный характер b-листов в b-белках тесно связан с тем, что их архитектура обычно основана на b-шпильках (Рис.13-13). Такие шпильки часто бывают согнуты пополам, а иногда ≈ согнуты дважды или даже трижды (как на Рис.13-8б,в).

Рис.13-13. Антипараллельные b-шпильки.

Петли, соединяющие b-участки, обычно имеют вход и выход на одном и том же краю укладки (т.е. они не пересекают «штабель», а прикрывают его торец). Это видно почти на всех рисунках. При этом петли, даже если они длинны, чаще всего соединяют близкие между собой в пространстве концы b-участков. Поэтому соседние по цепи b участки, как правило, не параллельны ≈ и часто образуют анитипараллельные b-шпильки.
Отметим также, что «наложение» петли на петлю (или, как говорят, «пересечение петель») встречается редко (такое исключение из правил показано на Рис.13-10б, снизу), ≈ видимо, потому что при этом петли должны дополнительно изгибаться (чтобы избежать столкновения или дегидратации), что опять-таки энергетически невыгодно. Избегание наложения петель ≈ общее структурное правило, наблюдающееся в белках.
В результате, из многих изображенных на Рис.13-14 возможных конфигураций b-листа, сложенного из единого куска цепи, ≈ по-настоящему часто встречаются лишь три мотива: «меандр» и два «греческих ключа» (они подчеркнуты на рисунке) ≈ именно эти мотивы свободны от всех отмеченных выше недостатков.

Рис.13-14. Возможные топологии листов из четырех b-участков. Показаны только листы, где каждые два подряд (в цепи) идущих b-участка направлены в противоположные стороны. Из этих топологий часто встречаются только «меандр» (подчеркнут одной чертой) и два (подчеркнуты двойной чертой) «греческих ключа» (они различаются только направлением поворота цепи от шпильки из тяжей 1,4 к шпильке из тяжей 3,4). Пример белка с меандром ≈ ретинол-связывающий белок (см. Рис.13-7); примеры белков с «греческим ключом» ≈ g-кристаллин и другие белки, изображенные на Рис.13-8), или трипсин (Рис.13-10).

«Меандр» ≈ это, кстати, имя очень извилистой реки в Греции ≈ характерен тем, что соседние по цепи b-тяжи являются также ближайшими соседями в пространстве (Рис.13-8); обычно (но не всегда) они связаны водородными связями. «Греческий ключ» (такой орнамент можно увидеть на старых вазах и садовых решетках) характерен тем, что четыре соседних по цепи b-тяжа антипараллельны, причем первый и четвертый связаны водородными связями. При этом на самом деле второй и/или третий b-тяжи «ключа» часто лежат не в том же (как может показаться из Рис.13-14), а в другом b-листе. При этом в пространстве образуются различные структуры ≈ так называемые «abcd» структуры Ефимова ≈ с одной и той же топологией греческого ключа (Рис.13-15). Найдите их на рисунках 13-8, 13-10.

Рис.13-15. Различные пространственные «abcd» структуры Ефимова с топологией греческого ключа. Обратите внимание на правый ход суперспирали, состоящей из двух параллельных b-тяжей одного b-листа и лежащего между ними в цепи b-тяжа другого листа (т.е. на суперспираль из b-тяжей b-c-d на втором слева внизу и на суперспираль из тяжей a-b-c на второй справа внизу схемах). Именно такое ≈ «правовинтовое» ≈ соединение параллельных b-тяжей одного b-листа типично для белков; обратное, «левовинтовое» встречается очень редко.

Все такие характерные, часто встречающиеся в белках структуры (шпильки, меандр, греческий ключ, abcd структуры и т.д.), сложенные из соседних по цепи элементов b (и/или a) структуры, часто называют «супервторичными» структурами.

ПРОСТРАНСТВЕННОЕ СТРОЕНИЕ БЕЛКОВ 2

Автор:mb. Дата:Июль 8, 2011

Рассмотрим теперь мембранные белки. Они тоже ≈ я имею в виду их трансмембранные части ≈ устроены довольно просто, почти как фибриллярные белки.

Мембраны создают поверхность клетки, а внутри нее, ≈ разные замкнутые объемы ≈ или, как говорят, компартменты. Мембраны состоят из жира (липидов) и белков (Рис.12-1). Особая роль мембранных белков (а они составляют до половины веса мембраны) ≈ обеспечивать транспорт через нее различных веществ, а также сигналов. Мембрана ≈ это, так сказать, «изолятор», а белки ≈ точнее, как мы увидим, каналы в них ≈ «проводники». Эти проводники специфичны, каждый из них пропускает через мембрану только определенные молекулы (или ≈ по-видимому, посредством небольшого изменения конформации белка ≈ сигналы от определенных молекул).

Рис.12-1. Белки в мембране. Серым цветом выделены внемембранные домены. Внутримембранные части белка практически не содержат нерегулярных участков цепи.

Истинно мембранные белки «живут» внутри мембраны ≈ там воды практически нет, так что внутримембранные части таких белков должны состоять (и состоят, как мы увидим) из регулярной вторичной структуры, причем размер этих частей ограничен толщиной мембраны.

Рис.12-2. Бактериородопсин в мембране (а – вид вдоль мембраны, б – вид на мембрану сверху). Цилиндрами показаны семь спиралей этого белка. Показаны и соединяющие эти спирали петли, а также (голубым цветом) молекула ретинола, прикрепленная внутри бактериородопсина.

Посмотрим, на нескольких примерах, как устроены мембранные белки. Вообще надо сказать, что мы еще знаем мало структур мембранных белков, ≈ их расшифровано меньше десятка, ≈ так как эти белки плохо растворимы в воде (приходится использовать детергенты и т.д.), и их очень трудно кристаллизовать, так как они склонны слипаться неупорядоченно.

Структура бактериородопсина ≈ он проводит протон через мембрану ≈ показана на Рис.12-2; эта структура построена на основе анализа множества электронных микрофотографий очень высокого разрешения, так как получить трехмерные кристаллы бактериородопсина не удалось.
Мы видим, что трансмембранная часть бактериородопсина сложена из семи регулярных a-спиралей, идущих от одного до другого края мембраны и образующих слегка наклоненный к ее плоскости пучок, а одинокая b-шпилька и все нерегулярные участки цепи (соединяющие спирали петли) выходят из мембраны.
Высокая регулярность укладки остова трансмембранной белковой цепи закономерна: в «жирном», почти безводном липидном окружении цена каждой водородной связи очень высока, что заставляет белковую цепь, уж если она попадает в мембрану, принимать структуры с полностью завязанными водородными связями ≈ т.е. либо a-спираль, либо b-структуру (точнее, b-цилиндр, не оставляющий края b-листа открытыми ≈ см. ниже).
Сидящие на a-спиралях бактериородопсина гидрофобные группы обращены «наружу», к (тоже гидрофобным) липидам мембраны. Полярные же группы ≈ их немного ≈ обращены внутрь узкого канала, по которому идет протон. Протонная проводимость осуществляется при содействии прикрепленной внутри пучка спиралей молекулы кофактора ≈ ретинола.
Аналогичные, устроенные как полый пучок спиралей поры могут образовываться в других случаях и из отдельных a-спиральных трансмембранных пептидов.

Посмотрим еще на один трансмембранный белок, порин (Рис.12-3). Он также высоко регулярен и имеет вид широкого цилиндра, сложенного из b-структуры. Обратите внимание, что b-лист здесь образует замкнутый b-цилиндр, что позволяет избежать «незавязанных» водородных связей, типичных для краев плоского b-листа. В этом цилиндре 16 очень длинных b-участков, а диаметр проходящей по его центру довольно широкой поры ≈ около 15. В сторону поры обращены боковые группы полярных остатков, входящих в b-тяжи, а чередующиеся с ними в b-тяжах неполярные остатки обращены своими боковыми группами в мембрану.
Порин служит проводником полярных молекул ≈ кстати, не очень селективным.

Рис.12-3. Порин. (а) Вид вдоль плоскости мембраны (расположение липидов в ней показано очень схематично). (б) Вид поперек плоскости мембраны.

Селективность проводимости, т.е. специфичность действия мембранных белков во многом связана с тем, что полярные, а тем более заряженные группы «сами по себе» проникают внутрь мембраны с большим трудом.
Вы помните, что свободная энергия заряда q в среде с диэлектрической постоянной e равна +q2/2er, где r ≈ Вандерваальсов радиус заряда. Легко прикинуть, что при q, равном электронному заряду, и r =1.5 (характерный радиус однозарядного иона), величина +q2 /2er близка к 1.5 ккал/моль при e=80 (т.е. в воде), а при eмембр=3 (т.е. внутри «чистой», сложенной лишь из липида мембраны), величина +q2/2er близка уже к 37 ккал/моль. Итого ≈ повышение свободной энергии на DF = +35 ккал/моль. Вероятность набрать такую свободную энергию есть, по формуле Больцмана, exp(-DF/kT) = exp(-35/0.6) = 10-25. Значит, успешной будет лишь одна из 1025 атак мембраны ионом. А так как «атака» длится не менее 10-13 сек (это ≈ время теплового колебания, как мы помним), то для проникновения иона через чисто липидную мембрану нужно по крайней мере порядка 1012 секунд, или порядка десятка тысяч лет… Все это делает чисто липидную мембрану практически непроницаемой для ионов.
Другое дело, если в мембрану встроен белок, а внутри него образован более или менее широкий, заполненный водой канал, по которому ион может идти, не покидая среду с высокой диэлектрической проницаемостью. Правда, и в канале ион будет чувствовать низкую диэлектрическую проницаемость окружающей канал мембраны, но эффект будет уже много меньше ≈ грубая оценка показывает, что он порядка +q2/(4eмембрR), где R ≈ радиус канала, а eмембр =3. Легко прикинуть, что при этом канал радиусом ╩2 в мембране преодолевается ионом за секунду, а ╩3 ≈ за долю миллисекунды.

Пропускание иона через канал регулируется наличием в нем центров, способных притянуть данный ион и тем уменьшить барьер, который ему приходится преодолевать.

Рис.12-4. Схема трансмембранной поры (мембрана в данном случае расположена вертикально а пора ≈ горизонтально), и электростатическая свободная энергия U для положительно ( ………….. + ………….. ) и отрицательно ( ………….. – …………..) заряженных ионов. (а) На внутренней поверхности поры нет заряда. (б) На внутренней поверхности поры ≈ положительный заряд.

Например, наличие на белке вблизи канала хоть какого-то положительного заряда ускоряет пропускание отрицательно заряженных ионов и резко замедляет пропускание ионов, заряженных положительно (Рис.12-4), а наличие отрицательного заряда ≈ наоборот, ускоряет пропускание положительных ионов и замедляет пропускание отрицательных. Этот эффект служит основой селективности той проводимости, что обеспечивается мембранными белками.

Теперь давайте более подробно рассмотрим фотосинтетический реакционный центр (Рис.12-5). Его задача ≈ проводить выбитые светом электроны на другую сторону мембраны, и тем самым создавать тот электрический потенциал, на котором и работает фотосинтез.

Рис.12-5. Фотосинтетический реакционный центр. Мембрана показана схематично. Трансмембранная субъединица М выделена голубой раскраской, трансмембранная субъединица L ≈ зеленой, субъединица Н (у нее есть одна трансмембранная спиралью) ≈ желтой; цитохром ≈ серый. Обратите внимание, насколко внутримембранные части регулярнее внемембранных! Субъединицы L и М связывают фотосинтетические пигменты ≈ хлорофиллы (красные с желтым ионом магния в центре) и феофитины (темно-синие). И у тех, и у других есть длинные гидрофобные «хвосты», выступающие из белка в мембрану. Субъединицы L, M связывают и два хинона (выделенные фиолетовой окраской). Цитохром, лежащий вне мембраны, включает четыре гема (черно-серые, с оранжевыми ионами железа внутри). Все кофакторы изображены в виде скелетных моделей; см. также Рис.12-6.

Фотосинтетический реакционный центр включает в себя цитохром с четырьмя гемами (это, собственно говоря, ≈ не мембранный белок: он находится вне ее, в периплазматическом пространстве) и три мембранные субъединицы: L, M и H. (от последней, впрочем, в мембране находится только одна a-спираль). Субъединицы L и M очень похожи.
Все трансмембранные части ≈ a-спирали. Они, как всегда, длинны (их длина равна толщине мембраны) и регулярны. Внутри мембраны нет нерегулярных петель. В то же время лежащая вне мембраны цепь значительно менее регулярна и содержит много петель; в общем, она уложена так же, как в «обычных» водорастворимых глобулярных белках, о которых нам еще предстоит говорить.
Обратите внимание на множество небольших циклических молекул, сидящих в белке фотосинтетического реакционного центра: именно по сложенным из них дорожкам, «проводникам» идет электрон (это видно по изменениям электронных спектров этих молекул), а сам полипептид служит только, так сказать, формообразующим изолятором.

Рис.12-6. Схема расположения фотосинтетических пигментов в фотосинтетическом реакционном центре. Ось псевдосимметрии L и М субъединиц проходит через «специальную пару» хлорофиллов и ион Fe. Длинные «хвосты» пигментов «сбриты», чтобы не загромождать рисунок. Электрон преимущественно идет по правой (на рисунке) ветви пигментов, привязанной к субъединице L. Путь электрона отмечен синими стрелками. Большая фиолетово-синяя стрелка отмечает выход хинона, нагруженного двумя последовательно прибывшими электронами. Левая цепь не используется. Предполагается, что она использовалась в прошлом, а теперь осталась, как аппендикс.

Как же работает фотосинтетический реакционный центр?
Сначала квант света выбивает электрон из сидящей в белке «специальной пары» («special pair») хлорофиллов (см. схему на Рис.12-6). Этот электрон мгновенно (менее чем за 10- 12 сек) перескакивает на соседний «добавочный» (accessory) хлорофилл, отстоящий на 3 от ближайшего хлорофилла «специальной пары», а затем ≈ за ~10-10 сек, через феофитин РА, ≈ на хинон (quinone) QA (именно QA, а не на QB!). Потом ≈ уже за ~10-4 сек ≈ электрон переходит на хинон QВ. Почему электрон идет столь кружным путем на хинон QВ, почему он не регистрируется (по электронным спектрам) на феофитине ВВ ≈ еще неясно.
Ушедший со «специальной пары» хлорофиллов электрон возмещается электроном, пришедшим с гема цитохрома. На этом завершается первый полуцикл реакции.
В результате второго аналогичного полуцикла, хинон QB нагружается вторым электроном и уходит с обоими электронами (дважды заряженный, он легче вырывается из мембраны), чтобы принять участие в дальнейшем фотосинтезе.

Итак, фотосинтетический реакционный центр переносит электроны из верхнего (на Рис.12-5, 12-6) в нижний компартмент ≈ против создающейся, в результате, разности потенциалов между компартментами. Коэффициент полезного действия этого реакционного центра ≈ около 50% (т.е. 50% поглощенного света превращается в энергию разделенных зарядов: вполне неплохо!).

Отметим два важных физических момента:
1) И хлорофиллы (Рис.12-7), и феофитины, и хиноны, и другие пигменты включают в себя системы «полуторных» (…-С=C-С=…), т.е. p-электронных связей. Иначе говоря, электронные облака в этих молекулах обобществлены (вследствие Полингова резонанса: …С=С-… Ы …С-С=…), и электроны бегают по этим молекулам, как по кусочкам металла. Тем самым создается потенциальная яма для электронов, где они «делокализованы», т.е. могут смещаться на расстояния, значительно превышающие диаметр атома (кстати, именно делокализация электронов создает характерную окрашенность пигментов: локализованный в отдельной валентной связи электрон возбуждается коротковолновым ультрафиолетовым светом, а делокализованный электрон ≈ «обычным», более длинноволновым светом).

Рис.12-7. Молекула бактериохлорофилла.

2) Передача электрона с одного «кусочка металла» (пигмента) на другой не требует непосредственного контакта этих пигментов. Эта передача осуществляется путем квантового туннельного перехода (см. схему на Рис.12-8).

Рис.12-8. Схема, поясняющая туннельный эффект. Жирная линия показывает профиль потенциальной энергии U электрона. Пунктир ≈ уровень полной (потенциальной + кинетической) энергии электрона. Тонкая линия (со штриховкой под ней) ≈ плотность электронного облака r. Электрон первоначально сидит в левой яме (это его состояние и показано на рисунке), но край его облака (пусть и обладающего здесь очень малой плотностью) достигает правой ямы, так что электрон может со временем весь перетечь туда, если там энергия ниже. При глубине ямы в несколько электрон-вольт (характерной энергии, необходимой для ионизации молекулы) ≈ характерное расстояние, на котором плотность его облака спадает на порядок, ≈ около 1.

Суть туннельного перехода (или, как говорят, «подбарьерного» перехода: ведь при этом электрон проходит как бы под энергетическим барьером), ≈ в том, что, по законам квантовой механики, электрон (как и всякая частица, а в особенности ≈ легкая частица) несколько «выступает» за пределы той потенциальной ямы, в которой он находится. «Потенциальной ямой» (областью низкой потенциальной энергии U) в данном случае служит та молекула (хлорофилл, феофитин и т.д.), на которой сидит электрон. Вне «ямы», в которой сидит этот электрон (Рис.12-8), его потенциальная энергия выше, чем его полная (потенциальная + кинетическая) энергия в яме. Если бы не квантовый эффект, этот дефицит энергии не давал бы электрону возможности высовываться из ямы. Квантовый же эффект приводит к тому, что волновая функция электрона (или, попросту, плотность электронного облака) «выплескивается» за потенциальную яму, ≈ хотя величина этой плотности и очень быстро, экспоненциально спадает по мере удаления от «ямы».
Это ≈ тот же квантовый эффект, что не позволяет электрону упасть на ядро: хоть это падение и уменьшило бы потенциальную энергию электрона, его кинетическая энергия возросла бы при этом еще больше. Дело здесь в том, что, при стремлении к нулю расстояния от электрона до ядра (Dx), ≈ потенциальная энергия электростатического взаимодействия электрона с ядром стремится к минус бесконечности как 1/(Dx), а его кинетическая энергия, в силу принципа неопределенности Гайзенберга стремится (при Dx╝0) к плюс бесконечности куда быстрее, ≈ как 1/(Dx)2.
Действительно, согласно принципу Гайзенберга, неопределенность в скорости (Dv) и неопределенность в координате (Dx) частицы связаны соотношением mDvDx ~ , где ≈ постоянная Планка, а m ≈ масса частицы. Иными словами, абсолютная величина скорости частицы (v) в яме шириной Dx составляет порядка /(mDx) ≈ при полной неопределенности направления движения частицы в данный момент времени. Следовательно, кинетическая энергия частицы, E = mv2/2, есть величина порядка m[/mDx)] 2 = (2/m)/Dx2.
Так же обстоит дело и в случае электрона в потенциальной яме: если бы он ни на йоту не выступал бы за свою яму, его полная энергия была бы выше.
Поэтому электронное облако слегка «выплескивается» за потенциальную яму. При этом плотность его спадает экспоненциально ≈ как и плотность электронного облака атома. Характерное расстояние, на котором плотность этого облака спадает на порядок (в 10 раз) ≈ около 1 (это, как мы знаем, ≈ характерный радиус атома).
Значит, плотность электронного облака спадает в 1000 раз на расстоянии в 3 от «своей ямы». Это означает, что вероятность того, что за одно колебание электрон отойдет от «своей ямы» на 3 ≈ порядка 10-3 (а на 5 , ≈ порядка 10-5, на 10 , ≈ порядка 10-10 и т.д.). Электрон в «яме» (молекуле пигмента) совершает ~1015 колебаний в секунду (в видимом световом диапазоне частот: это хорошо видно по спектрам поглощения таких молекул). Значит, характерное время его перехода в другую «яму» (другую молекулу пигмента), отстоящую на 3 ≈ порядка 10-12 сек; в яму, отстоящую на 5 ≈ порядка 10- 10 сек; в яму, отстоящую на 10 ≈ 10-5 сек; а в яму, отстоящую на 15 ≈ порядка 1 сек. Такая зависимость скоростей переходов от расстояний согласуется с тем, что наблюдается в фотосинтетическом реакционном центре.

Обратите внимание на ряд существенных моментов.
Первое. Суммарный переход совершается на расстояние около 40. Такое расстояние нельзя покрыть одним туннельным прыжком (такой прыжок занял бы ~ 1040×10- 15 сек ~ ~1025 сек ~ 1017 лет ≈ на него не хватило бы всего времени жизни Вселенной). Однако конструкция белка разбивает этот большой прыжок на четыре малых ≈ от одного притягивающего электрон пигмента к другому ≈ и электрон покрывает эти 40 за долю миллисекунды.
Второе. Для того, чтобы электрон не вернулся бы тотчас со второго пигмента на первый, а пошел бы дальше, на третий и т.д. ≈ его суммарная (потенциальная + кинетическая) энергия должна падать по ходу процесса ≈ или, иными словами, электрон должен на каждом шаге переходить с высокоэнергетической атомной орбиты на низкоэнергетическую. Конструкция фотосинтетического реакционного центра призвана обеспечить такое понижение энергии электрона на пигментах по ходу процесса.
Третье. Совершая туннельный переход, электрон не расходует энергии на преодоление барьера (здесь нет никакого «трения») ≈ однако электрон на каждом шаге идет от более высокоэнергетической атомной орбиты к более низкоэнергетической, его энергия понижается ≈ и она расходуется на то, чтобы сделать туннельный переход «эффективным», т.е. необратимым.
И последнее. Туннельный (или, как говорят, «под-барьерный») переход можно отличить от обычного активационного механизма перехода через энергетический барьер по тому, что на скорость туннельного перехода температура не влияет, а скорость активационного перехода (пропорциональная exp(-DE#/kBT), где DE# ≈ энергия активационного барьера, а Т ≈ температура) резко уменьшается при падении температуры.

ПРОСТРАНСТВЕННОЕ СТРОЕНИЕ БЕЛКОВ 1

Автор:mb. Дата:Июль 8, 2011

Теперь, когда мы знаем свойства вторичных структур полипептидов и свойства аминокислотных остатков ≈ обратимся, наконец, к белкам.
Как уже говорилось, по «жизненным условиям», по стабилизующим структуру белков взаимодействиям и общему типу строения белки можно разбить на три класса: (1) фибриллярные белки; (2) мембранные белки; и (3) водорастворимые глобулярные белки.

Рассмотрим сначала фибриллярные белки.

Фибриллярные белки играют в основном структурную роль. Они образуют микрофиламенты, микротрубочки, ≈ а также фибриллы, волосы, шелк и другие защитные покровы; они армируют мембраны и поддерживают структуру клеток и тканей.
Фибриллярные белки часто образуют огромные агрегаты; их пространственная структура высоко регулярна, сложена в основном из очень больших блоков вторичной структуры, и держится в значительной степени на взаимодействии между разными полипептидными цепями. Первичная структура фибриллярных белков также высоко регулярна, периодична, ≈ потому-то из нее и образуется обширная регулярная вторичная структура.

Типичными представителями фибриллярных белков являются:

а) b-структурный белок фиброин шелка. У b-листа, как мы знаем, периодичность состоит в чередовании остатков, обращенных «вверх» и «вниз» (Рис.11-1).

Рис.11-1. Лист b-структуры. Подчеркнута его складчатость и периодичность. Голубые линии – водородные связи между цепями, слагающими b-листа.

Соответственно, в фиброине шелка основной мотив первичной структуры выглядит как повтор восьми блоков, где в каждом из блоков идет чередование маленьких (Gly) и более крупных остатков, например:

и этот восьмикратный повтор шести остатков повторяется около 50 раз.
Антипараллельные (такие, как на Рис.11-1) b-слои фиброина шелка уложены друга на друга по принципу «лицом к лицу, спина к спине»: двойной слой глицинов (расстояние между плоскостями ≈ 3.5) ≈ двойной слой аланинов/серинов (расстояние между плоскостями ≈ 5.7; это хорошо видит рентген) ≈ двойной слой глицинов ≈ и т.д.

б) a-структурные фибриллярные белки, сложенные из длинных перевитых спиралей (coiled coil) (Рис.11-2). В a-кератине или тропомиозине такие спирали охватывают всю белковую цепь, ≈ да и большая часть миозиновой цепи образует фибриллу такого типа. Такие структуры содержатся также в шелке ≈ но не обычном шелке тутового шелкопряда, а шелке пчел и муравьев.
Слипаясь, отдельные цепи образуют суперспираль.

Рис.11-2. Перевитые правые a-спирали. В комплексе они лежат параллельно друг другу и слегка закручены одна вокруг другой так, что каждая из них образует левую суперспираль. Контактирующие аминокислотные остатки занимают в цепи позиции a и d (см. Рис.11-3, 11-4).

Рис.11-3. Взаимодействие a-спиралей в двойной (а) и тройной (б) суперспирали (вид с торца спирали). В двойной суперспирали непосредственно контактируют с другой спиралью только остатки а и d, а в тройной ≈ еще и остатки e и g (хотя и более слабо).

На следующем структурном уровне изображенные на Рис.11-2 суперспирали часто (но не всегда ≈ например, не в тропомиозине) слипаются друг с другом и образуют фибриллы.
Входящие в суперспираль a-спирали обычно параллельны, и перевиты они ≈ в разных белках ≈ по две, три или четыре. У a-спирали, как мы уже знаем, период равен 3.6 остатка на виток. В перевитых спиралях периодичность ≈ 7 остатков на два витка a-спирали, т.е. 3.5 остатка на виток (Рис.11-3, 11-4).
Типичная первичная структура при этом выглядит, как на Рис.11-4.

Рис.11-4.

На этом рисунке жирные буквы соответствуют гидрофобным (жирным, слипающимся) аминокислотам, а прочие буквы ≈ аминокислотам гидрофильным. Интересно, что небольшое увеличение гидрофобности остатков e и g превращает двойную перевитую спираль (Рис.11-3а) в тройную (Рис.11-3б), а еще большее ≈ в четверную.

Остановимся чуть подробнее на том, как спирали слипаются между собой. На a-спирали (Рис.11-5, слева) есть несколько спиральных нарезок ≈ «хребтов» из сближенных в пространстве боковых групп. Одни хребты имеют периодичность типа 1 ≈ 4 ≈ 7 ≈ … , и та их часть, что входит в зону контакта, состоит из пар a1 ≈ d4, a8 ≈ d11, … (Рис.11-5, в центре). Другие хребты имеют периодичность типа 0 ≈ 4 ≈ 8 ≈ 12 ≈ … . Та часть этих хребтов, что входит в зону контакта, состоит из пар d4 ≈ a8, d11 ≈ a15, … (Рис.11-5, справа).

Рис.11-5. a-Спираль (главная цепь и Cb-атомы) и два сорта хребтов (тонкие линии) из сближенных боковых групп на ее поверхности. В центре: хребты типа i, i+3; справа: хребты типа i, i+4. Полосой показана контактная поверхность; ее краями выделены линии остатков a и d. Отмечены типичные углы наклона хребтов i, i+3 и i, i+4 относительно оси спирали (на рисунке углы представляются меньшими, так как типичные хребты проходят через массивные боковые группы, а на рисунке – через центры Cb-атомов).

Первые хребты (если проводить их через выступы, образованные боковыми группами) идут под углом примерно 25о к оси спирали, вторые ≈ под углом примерно 45о (Рис.11-5б и 11-5в). Если, перевернув вокруг вертикальной оси, наложить одну поверхность на другую (Рис.11-6, слева), а затем повернуть на 20о вокруг вертикальной оси, ≈ то хребты типа «1 ≈ 4 ≈ 7″ одной спирали окажутся между хребтами типа «0 ≈ 4 ≈ 8″ другой, что обеспечит их плотный контакт (Рис.11-6, справа). При этом группы а одной спирали окажутся между группами d другой, а зона контакта образует на поверхности обеих спиралей (пока они не суперспирализованы) слабо скрученную спиральную полосу. А когда эти спирали суперспирализуются (Рис.11-2) и обовьются вокруг общей оси ≈ зона контакта окажется в центре слегка перевитого пучка.

Рис.11-6. Плотная упаковка хребтов боковых групп при контакте спиралей требует разворота на 20о одной спирали относительно другой. Мы смотрим на зону контакта сквозь одну спираль (сквозь перевернутую вдоль оси a2). Остатки «нижней» спирали a1 изображены более светлыми, а верхней (a2) ≈ более темными. Бледно-голубыми линиями показаны линии контактирующих остатков a и d.

Это ≈ не единственный способ плотного контакта спиралей (с другими мы познакомимся, когда будем говорить о глобулярных белках), ≈ но единственный, пригодный для очень длинных спиралей, типичных для фибриллярных белков. Он был предсказан еще Криком в том же 1953 году, когда он ≈ вместе с Уотсоном ≈ предсказал двойную спираль ДНК.

в) Коллаген. Главный опорный белок. Он образуется особой, тройной суперспиралью, сложенной из трех полипептидов (Рис.11-7). При этом внутри каждого полипептида, внутри каждой нити этой тройной спирали водородных связей нет ≈ они есть только между нитями.
Конформация всех остатков в каждой цепи коллагена близка к конформации полипролиновой [точнее ≈ poly(Pro)II] спирали. Это ≈ левая спираль, и период ее равен трем. Соответственно, основной мотив первичной структуры в коллагене выглядит как многократный повтор троек (Gly-Pro-Pro)n, или, точнее, (Gly-нечто-Pro)n, причем Gly в такой тройке необходим для образования водородных связей: у него есть NH-группа (в отличие от Pro), и нет боковой группы, ≈ а любая боковая группа была бы лишней в центре тугой коллагеновой спирали, где сидит глицин.
Интересно, что экзоны, кодирующие коллагеновую цепь, всегда начинаются с глицинов и всегда содержат число кодонов, кратное трем. Я надеюсь, вы помните, что гены эукариот содержат экзоны, кодирующие белки, и интроны, которые выщепляются из матричной РНК (и потому белки не кодируют).

Рис.11-7. Модель тройной суперспирали коллагена для последовательности (глицин ≈ пролин ≈ пролин)n. Каждая цепь выделена своим цветом. Отмечены завязывающие водородные связи Н-атомы NH-групп глицина (синим) и О-атомы СО-групп первого пролина тройки Gly-Pro-Pro (красным). При этом Gly цепи «1″ завязывает связь с цепью «2″, а Pro ≈ с цепью «3″, и т.д. Завиваясь вокруг двух других, каждая цепь коллагена образует правую суперспираль. «Супер» ≈ потому что на более мелком масштабе, на масштабе конформаций отдельных остатков, коллагеновая цепь уже образует спираль типа poly(Pro)II (причем эта «микроспираль» ≈ левая); ее можно проследить по направлению пролиновых колец.

На следующем структурном уровне, коллагеновые суперспирали также слипаются друг с другом и образуют фибриллы коллагена.

Биосинтез коллагена, его последующая модификация и образование зрелой структуры коллагеновой фибриллы хорошо изучены (Рис.11-8). Замечу, что сам по себе коллаген не способен к спонтанной и при этом правильной самоорганизации своей пространственной структуры in vitro ≈ так же, как и фиброин шелка, ≈ и в отличие от глобулярных белков, о которых я буду говорить потом. Для самоорганизации нужен проколлаген, включающий, кроме коллагеновых нитей, глобулярные головки и хвостики. Лишенные головок и хвостиков коллагеновые нити, самоорганизуясь из развернутого состояния in vitro, тоже складываются в тройные спирали ≈ но «неправильные», без присущей нативному коллагену гетерогенности тройной спирали (включающей нити двух сортов), без присущего ему регистра (т.е. с неправильным сдвигом нитей относительно друг друга), и т.д.

Рис.11-8. Образование коллагена in vivo. Шаг 1. Биосинтез про-a1-цепей и про-a2-цепей (по 1300 остатков в каждой) в пропорции 2:1. Шаг 2. Гидроксилирование некоторых остатков Pro и Lys. Шаг 3. Присоединение сахаров (GLC-GAL) к гидроксилированным остаткам. Шаг 4. Образование тримера и SS связей на его концах. Шаг 5. Образование тройной спирали в середине проколлагена. Шаг 6. Секреция проколлагена во внеклеточное пространство. Шаг 7. Отщепление глобулярных частей. Шаги 8-10. Спонтанное образование фибрилл из тройных суперспиралей, окончательная модификация аминокислотных остатков и образование ковалентных сшивок модифицированных остатков коллагеновых цепей. Картинка взята из [3] и адаптирована.

В заключение, я хочу подчеркнуть, что фибриллярные белки устроены относительно просто в силу периодичности своей первичной и, в силу этого, ≈ также и своей вторичной структуры.