mycaffe/html/_multi_head_attention_interp_parameter_8cs_source.html

using System;

using System.Collections.Generic;

using System.Linq;

using System.Text;

using System.ComponentModel;

using MyCaffe.basecode;


namespace MyCaffe.param.tft

{

    [Serializable]

    [TypeConverter(typeof(ExpandableObjectConverter))]

    public class MultiHeadAttentionInterpParameter : LayerParameterBase

    {

        FillerParameter m_fillerParam_weights = new FillerParameter("xavier");

        FillerParameter m_fillerParam_bias = new FillerParameter("constant", 0.1);

        bool m_bEnableNoise = false;

        double m_dfSigmaInit = 0.017;

        uint m_nEmbedDim;

        uint m_nNumHeads;

        uint m_nNumHistoricalSteps = 0;

        uint m_nNumFutureSteps = 0;

        bool m_bEnableSelfAttention = true;


        public MultiHeadAttentionInterpParameter()

        {

        }


        [Description("Specifies to enable self attention (one input, default = true).")]

        public bool enable_self_attention

        {

            get { return m_bEnableSelfAttention; }

            set { m_bEnableSelfAttention = value; }

        }


        [Description("Specifies the number of historical steps.")]

        public uint num_historical_steps

        {

            get { return m_nNumHistoricalSteps; }

            set { m_nNumHistoricalSteps = value; }

        }


        [Description("Specifies the number of future steps.")]

        public uint num_future_steps

        {

            get { return m_nNumFutureSteps; }

            set { m_nNumFutureSteps = value; }

        }


        [Description("Specifies the state size corresponding to both the input and output sizes.")]

        public uint embed_dim

        {

            get { return m_nEmbedDim; }

            set { m_nEmbedDim = value; }

        }


        [Description("Specifies number of attention heads used in the multi-attention.")]

        public uint num_heads

        {

            get { return m_nNumHeads; }

            set { m_nNumHeads = value; }

        }


        [Description("Enable/disable noise in the inner-product layer (default = false).")]

        public bool enable_noise

        {

            get { return m_bEnableNoise; }

            set { m_bEnableNoise = value; }

        }


        [Description("Specifies the initialization value for the sigma weight and sigma bias used when 'enable_noise' = true.")]

        public double sigma_init

        {

            get { return m_dfSigmaInit; }

            set { m_dfSigmaInit = value; }

        }


        [Category("Fillers")]

        [Description("The filler for the weights.")]

        public FillerParameter weight_filler

        {

            get { return m_fillerParam_weights; }

            set { m_fillerParam_weights = value; }

        }


        [Category("Fillers")]

        [Description("The filler for the bias.")]

        public FillerParameter bias_filler

        {

            get { return m_fillerParam_bias; }

            set { m_fillerParam_bias = value; }

        }


        public override object Load(System.IO.BinaryReader br, bool bNewInstance = true)

        {

            RawProto proto = RawProto.Parse(br.ReadString());

            MultiHeadAttentionInterpParameter p = FromProto(proto);


            if (!bNewInstance)

                Copy(p);


            return p;

        }


        public override void Copy(LayerParameterBase src)

        {

            MultiHeadAttentionInterpParameter p = (MultiHeadAttentionInterpParameter)src;


            m_bEnableSelfAttention = p.enable_self_attention;

            m_nNumHistoricalSteps = p.num_historical_steps;

            m_nNumFutureSteps = p.num_future_steps;


            m_nEmbedDim = p.embed_dim;

            m_nNumHeads = p.num_heads;


            if (p.m_fillerParam_bias != null)

                m_fillerParam_bias = p.m_fillerParam_bias.Clone();


            if (p.m_fillerParam_weights != null)

                m_fillerParam_weights = p.m_fillerParam_weights.Clone();


            m_bEnableNoise = p.m_bEnableNoise;

            m_dfSigmaInit = p.m_dfSigmaInit;

        }


        public override LayerParameterBase Clone()

        {

            MultiHeadAttentionInterpParameter p = new MultiHeadAttentionInterpParameter();

            p.Copy(this);

            return p;

        }


        public override RawProto ToProto(string strName)

        {

            RawProtoCollection rgChildren = new RawProtoCollection();


            rgChildren.Add("enable_self_attention", enable_self_attention.ToString());

            rgChildren.Add("num_historical_steps", num_historical_steps.ToString());

            rgChildren.Add("num_future_steps", num_future_steps.ToString());


            rgChildren.Add("embed_dim", embed_dim.ToString());

            rgChildren.Add("num_heads", num_heads.ToString());


            if (weight_filler != null)

                rgChildren.Add(weight_filler.ToProto("weight_filler"));


            if (bias_filler != null)

                rgChildren.Add(bias_filler.ToProto("bias_filler"));


            if (m_bEnableNoise)

            {

                rgChildren.Add("enable_noise", m_bEnableNoise.ToString());

                rgChildren.Add("sigma_init", m_dfSigmaInit.ToString());

            }


            return new RawProto(strName, "", rgChildren);

        }


        public static MultiHeadAttentionInterpParameter FromProto(RawProto rp)

        {

            string strVal;

            MultiHeadAttentionInterpParameter p = new MultiHeadAttentionInterpParameter();


            if ((strVal = rp.FindValue("enable_self_attention")) != null)

                p.enable_self_attention = bool.Parse(strVal);


            if ((strVal = rp.FindValue("embed_dim")) != null)

                p.embed_dim = uint.Parse(strVal);


            if ((strVal = rp.FindValue("num_heads")) != null)

                p.num_heads = uint.Parse(strVal);


            RawProto rpWeightFiller = rp.FindChild("weight_filler");

            if (rpWeightFiller != null)

                p.weight_filler = FillerParameter.FromProto(rpWeightFiller);


            RawProto rpBiasFiller = rp.FindChild("bias_filler");

            if (rpBiasFiller != null)

                p.bias_filler = FillerParameter.FromProto(rpBiasFiller);


            if ((strVal = rp.FindValue("enable_noise")) != null)

                p.enable_noise = bool.Parse(strVal);


            if ((strVal = rp.FindValue("sigma_init")) != null)

                p.sigma_init = ParseDouble(strVal);


            if ((strVal = rp.FindValue("num_historical_steps")) != null)

                p.num_historical_steps = uint.Parse(strVal);


            if ((strVal = rp.FindValue("num_future_steps")) != null)

                p.num_future_steps = uint.Parse(strVal);


            return p;

        }

    }

}

MyCaffe.basecode.BaseParameter.ParseDouble
static double ParseDouble(string strVal)
Parse double values using the US culture if the decimal separator = '.', then using the native cultur...
Definition: BaseParameter.cs:35

MyCaffe.basecode.RawProtoCollection
The RawProtoCollection class is a list of RawProto objects.
Definition: RawProtoCollection.cs:12

MyCaffe.basecode.RawProtoCollection.Add
void Add(RawProto p)
Adds a RawProto to the collection.
Definition: RawProtoCollection.cs:55

MyCaffe.basecode.RawProto
The RawProto class is used to parse and output Google prototxt file data.
Definition: RawProto.cs:17

MyCaffe.basecode.RawProto.FindChild
RawProto FindChild(string strName)
Searches for a given node.
Definition: RawProto.cs:231

MyCaffe.basecode.RawProto.Parse
static RawProto Parse(string str)
Parses a prototxt and places it in a new RawProto.
Definition: RawProto.cs:306

MyCaffe.basecode.RawProto.FindValue
string FindValue(string strName)
Searches for a falue of a node within this nodes children.
Definition: RawProto.cs:105

MyCaffe.param.FillerParameter
Specifies the filler parameters used to create each Filler.
Definition: FillerParameter.cs:16

MyCaffe.param.FillerParameter.FromProto
static FillerParameter FromProto(RawProto rp)
Parses the parameter from a RawProto.
Definition: FillerParameter.cs:350

MyCaffe.param.FillerParameter.ToProto
override RawProto ToProto(string strName)
Convert the parameter into a RawProto.
Definition: FillerParameter.cs:314

MyCaffe.param.FillerParameter.Clone
FillerParameter Clone()
Creates a new copy of this instance of the parameter.
Definition: FillerParameter.cs:293

MyCaffe.param.LayerParameterBase
The LayerParameterBase is the base class for all other layer specific parameters.
Definition: LayerParameterBase.cs:18

MyCaffe.param.tft.MultiHeadAttentionInterpParameter
Specifies the parameters for the MultiHeadAttentionInterpLayer (Interpretable Multi-Head Attention La...
Definition: MultiHeadAttentionInterpParameter.cs:28

MyCaffe.param.tft.MultiHeadAttentionInterpParameter.enable_self_attention
bool enable_self_attention
Specifies to enable self attention (one input, default = true).
Definition: MultiHeadAttentionInterpParameter.cs:49

MyCaffe.param.tft.MultiHeadAttentionInterpParameter.bias_filler
FillerParameter bias_filler
The filler for the bias.
Definition: MultiHeadAttentionInterpParameter.cs:134

MyCaffe.param.tft.MultiHeadAttentionInterpParameter.num_historical_steps
uint num_historical_steps
Specifies the number of historical steps
Definition: MultiHeadAttentionInterpParameter.cs:59

MyCaffe.param.tft.MultiHeadAttentionInterpParameter.num_future_steps
uint num_future_steps
Specifies the number of future steps
Definition: MultiHeadAttentionInterpParameter.cs:69

MyCaffe.param.tft.MultiHeadAttentionInterpParameter.enable_noise
bool enable_noise
Enable/disable noise in the inner-product layer (default = false).
Definition: MultiHeadAttentionInterpParameter.cs:102

MyCaffe.param.tft.MultiHeadAttentionInterpParameter.num_heads
uint num_heads
Specifies number of attention heads used in the multi-attention.
Definition: MultiHeadAttentionInterpParameter.cs:89

MyCaffe.param.tft.MultiHeadAttentionInterpParameter.Load
override object Load(System.IO.BinaryReader br, bool bNewInstance=true)
Load the parameter from a binary reader.
Definition: MultiHeadAttentionInterpParameter.cs:140

MyCaffe.param.tft.MultiHeadAttentionInterpParameter.embed_dim
uint embed_dim
Specifies the state size corresponding to both the input and output sizes.
Definition: MultiHeadAttentionInterpParameter.cs:79

MyCaffe.param.tft.MultiHeadAttentionInterpParameter.FromProto
static MultiHeadAttentionInterpParameter FromProto(RawProto rp)
Parses the parameter from a RawProto.
Definition: MultiHeadAttentionInterpParameter.cs:217

MyCaffe.param.tft.MultiHeadAttentionInterpParameter.Copy
override void Copy(LayerParameterBase src)
Copy on parameter to another.
Definition: MultiHeadAttentionInterpParameter.cs:152

MyCaffe.param.tft.MultiHeadAttentionInterpParameter.weight_filler
FillerParameter weight_filler
The filler for the weights.
Definition: MultiHeadAttentionInterpParameter.cs:123

MyCaffe.param.tft.MultiHeadAttentionInterpParameter.sigma_init
double sigma_init
Specifies the initialization value for the sigma weight and sigma bias used when 'enable_noise' = tru...
Definition: MultiHeadAttentionInterpParameter.cs:112

MyCaffe.param.tft.MultiHeadAttentionInterpParameter.MultiHeadAttentionInterpParameter
MultiHeadAttentionInterpParameter()
Constructor for the parameter.
Definition: MultiHeadAttentionInterpParameter.cs:40

MyCaffe.param.tft.MultiHeadAttentionInterpParameter.ToProto
override RawProto ToProto(string strName)
Convert the parameter into a RawProto.
Definition: MultiHeadAttentionInterpParameter.cs:186

MyCaffe.param.tft.MultiHeadAttentionInterpParameter.Clone
override LayerParameterBase Clone()
Creates a new copy of this instance of the parameter.
Definition: MultiHeadAttentionInterpParameter.cs:174

MyCaffe.basecode
The MyCaffe.basecode contains all generic types used throughout MyCaffe.
Definition: Annotation.cs:12

MyCaffe.param.tft
Definition: CategoricalTransformationParameter.cs:9

MyCaffe
The MyCaffe namespace contains the main body of MyCaffe code that closesly tracks the C++ Caffe open-...
Definition: Annotation.cs:12

System.ComponentModel
Definition: Component.cs:11

System
Definition: Component.cs:11