Source code for deepfold.modules.template_pair_block

from typing import Optional

import torch
import torch.nn as nn

import deepfold.distributed.model_parallel as mp
from deepfold.modules.dropout import DropoutColumnwise, DropoutRowwise
from deepfold.modules.pair_transition import PairTransition
from deepfold.modules.triangular_attention import TriangleAttentionEndingNode, TriangleAttentionStartingNode
from deepfold.modules.triangular_multiplicative_update import TriangleMultiplicationIncoming, TriangleMultiplicationOutgoing
from deepfold.utils.tensor_utils import add



[docs]
class TemplatePairBlock(nn.Module):
    """Template Pair Block module.

    Supplementary '1.7.1 Template stack': Algorithm 16.

    Args:
        c_t: Template representation dimension (channels).
        c_hidden_tri_att: Hidden dimension in triangular attention.
        c_hidden_tri_mul: Hidden dimension in multiplicative updates.
        num_heads_tri: Number of heads used in triangular attention.
        pair_transition_n: Channel multiplier in pair transition.
        dropout_rate: Dropout rate for pair activations.
        inf: Safe infinity value.
        chunk_size_tri_att: Optional chunk size for a batch-like dimension
            in triangular attention.

    """

    def __init__(
        self,
        c_t: int,
        c_hidden_tri_att: int,
        c_hidden_tri_mul: int,
        num_heads_tri: int,
        pair_transition_n: int,
        dropout_rate: float,
        inf: float,
        chunk_size_tri_att: Optional[int],
        block_size_tri_mul: Optional[int],
        tri_att_first: bool = True,
    ) -> None:
        super().__init__()
        self.tri_att_first = tri_att_first

        self.tri_att_start = TriangleAttentionStartingNode(
            c_z=c_t,
            c_hidden=c_hidden_tri_att,
            num_heads=num_heads_tri,
            inf=inf,
            chunk_size=chunk_size_tri_att,
        )
        self.tasn_dropout_rowwise = DropoutRowwise(
            p=dropout_rate,
        )
        self.tri_att_end = TriangleAttentionEndingNode(
            c_z=c_t,
            c_hidden=c_hidden_tri_att,
            num_heads=num_heads_tri,
            inf=inf,
            chunk_size=chunk_size_tri_att,
        )
        self.taen_dropout_columnwise = DropoutColumnwise(
            p=dropout_rate,
        )
        self.tri_mul_out = TriangleMultiplicationOutgoing(
            c_z=c_t,
            c_hidden=c_hidden_tri_mul,
            block_size=block_size_tri_mul,
        )
        self.tmo_dropout_rowwise = DropoutRowwise(
            p=dropout_rate,
        )
        self.tri_mul_in = TriangleMultiplicationIncoming(
            c_z=c_t,
            c_hidden=c_hidden_tri_mul,
            block_size=block_size_tri_mul,
        )
        self.tmi_dropout_rowwise = DropoutRowwise(
            p=dropout_rate,
        )
        self.pair_transition = PairTransition(
            c_z=c_t,
            n=pair_transition_n,
        )


[docs]
    def forward(
        self,
        t: torch.Tensor,
        mask: torch.Tensor,
        inplace_safe: bool,
    ) -> torch.Tensor:
        """Template Pair Block forward pass.

        Args:
            t: [batch, N_templ, N_res, N_res, c_t] template representation
            mask: [batch, N_res, N_res] pair mask

        Returns:
            t: [batch, N_templ, N_res, N_res, c_t] updated template representation

        """

        t_list = list(torch.unbind(t, dim=-4))
        # t_list = [t.unsqueeze(-4) for t in torch.unbind(t, dim=-4)]

        for i in range(len(t_list)):
            t = t_list[i]
            # t: [batch, N_res, N_res, c_t]

            if mp.is_enabled():
                mask_row = mp.scatter(mask, dim=-2)
                mask_col = mp.scatter(mask, dim=-1)

                if self.tri_att_first:
                    t = self.tasn_dropout_rowwise(
                        self.tri_att_start(z=t, mask=mask_row),
                        add_output_to=t,
                        inplace=inplace_safe,
                    )
                    t = mp.row_to_col(t)
                    t = self.taen_dropout_columnwise(
                        self.tri_att_end(z=t, mask=mask_col),
                        add_output_to=t,
                        inplace=inplace_safe,
                    )
                    t = mp.col_to_row(t)
                    t = self.tmo_dropout_rowwise(
                        self.tri_mul_out(z=t, mask=mask_row),
                        add_output_to=t,
                        inplace=inplace_safe,
                    )
                    t = mp.row_to_col(t)
                    t = self.tmi_dropout_rowwise(
                        self.tri_mul_in(z=t, mask=mask_col),
                        dap_scattered_dim=2,
                        add_output_to=t,
                        inplace=inplace_safe,
                    )
                    t = self.pair_transition(
                        z=t,
                        mask=mask_col,
                        inplace_safe=inplace_safe,
                    )
                    t = mp.col_to_row(t)
                else:
                    t = self.tmo_dropout_rowwise(
                        self.tri_mul_out(z=t, mask=mask_row),
                        add_output_to=t,
                        inplace=inplace_safe,
                    )
                    t = mp.row_to_col(t)
                    t = self.tmi_dropout_rowwise(
                        self.tri_mul_in(z=t, mask=mask_col),
                        add_output_to=t,
                        inplace=inplace_safe,
                    )
                    t = mp.col_to_row(t)
                    t = self.tasn_dropout_rowwise(
                        self.tri_att_start(z=t, mask=mask_row),
                        add_output_to=t,
                        inplace=inplace_safe,
                    )
                    t = mp.row_to_col(t)
                    t = self.taen_dropout_columnwise(
                        self.tri_att_end(z=t, mask=mask_col),
                        add_output_to=t,
                        inplace=inplace_safe,
                    )
                    t = self.pair_transition(
                        z=t,
                        mask=mask_col,
                        inplace_safe=inplace_safe,
                    )
                    t = mp.col_to_row(t)
            else:
                if self.tri_att_first:
                    t = self.tasn_dropout_rowwise(
                        self.tri_att_start(z=t, mask=mask),
                        add_output_to=t,
                        inplace=inplace_safe,
                    )
                    t = self.taen_dropout_columnwise(
                        self.tri_att_end(z=t, mask=mask),
                        add_output_to=t,
                        inplace=inplace_safe,
                    )
                    t = self.tmo_dropout_rowwise(
                        self.tri_mul_out(z=t, mask=mask),
                        add_output_to=t,
                        inplace=inplace_safe,
                    )
                    t = self.tmi_dropout_rowwise(
                        self.tri_mul_in(z=t, mask=mask),
                        add_output_to=t,
                        inplace=inplace_safe,
                    )
                    t = self.pair_transition(
                        z=t,
                        mask=mask,
                        inplace_safe=inplace_safe,
                    )
                else:
                    t = self.tmo_dropout_rowwise(
                        self.tri_mul_out(z=t, mask=mask),
                        add_output_to=t,
                        inplace=inplace_safe,
                    )
                    t = self.tmi_dropout_rowwise(
                        self.tri_mul_in(z=t, mask=mask),
                        add_output_to=t,
                        inplace=inplace_safe,
                    )
                    t = self.tasn_dropout_rowwise(
                        self.tri_att_start(z=t, mask=mask),
                        add_output_to=t,
                        inplace=inplace_safe,
                    )
                    t = self.taen_dropout_columnwise(
                        self.tri_att_end(z=t, mask=mask),
                        add_output_to=t,
                        inplace=inplace_safe,
                    )
                    t = self.pair_transition(
                        z=t,
                        mask=mask,
                        inplace_safe=inplace_safe,
                    )
            if not inplace_safe:
                t_list[i] = t

        t = torch.stack(t_list, dim=-4)
        # t: [batch, N_templ, N_res, N_res, c_t]

        return t