AllenNLP Models v2.0.0

Home
Repository
Versions
Versions
- Latest
- Stable
- Commit
Models
Models
- classification
  classification
  - dataset_readers
    dataset_readers
    
    stanford_sentiment_tree_bank
  - models
    models
    
    biattentive_classification_network
- common
  common
  - ontonotes
- coref
  coref
  - dataset_readers
    dataset_readers
    
    conll
    
    preco
    
    winobias
  - metrics
    metrics
    
    conll_coref_scores
    
    mention_recall
  - models
    models
    
    coref
  - predictors
    predictors
    
    coref
  - util
- generation
  generation
  - dataset_readers
    dataset_readers
    
    cnn_dm
    
    copynet_seq2seq
    
    seq2seq
  - models
    models
    
    bart
    
    composed_seq2seq
    
    copynet_seq2seq
    
    simple_seq2seq
  - modules
    modules
    
    decoder_nets
    decoder_nets
    
    decoder_net
    
    lstm_cell
    
    stacked_self_attention
    
    seq_decoders
    seq_decoders
    
    auto_regressive
    
    seq_decoder
  - predictors
    predictors
    
    seq2seq
- lm
  lm
  - dataset_readers
    dataset_readers
    
    masked_language_model
    
    next_token_lm
    
    simple_language_modeling
  - models
    models
    
    bidirectional_lm
    
    language_model
    
    masked_language_model
    
    next_token_lm
  - modules
    modules
    
    language_model_heads
    language_model_heads
    
    bert
    
    gpt2 gpt2
    Table of contents
    
    Gpt2LanguageModelHead
    
    get_input_dim
    
    get_output_dim
    
    forward
    
    language_model_head
    
    linear
    
    seq2seq_encoders
    seq2seq_encoders
    
    bidirectional_lm_transformer
    
    token_embedders
    token_embedders
    
    bidirectional_lm
    
    language_model
  - predictors
    predictors
    
    masked_language_model
    
    next_token_lm
  - util
    util
    
    beam_search_generators
    beam_search_generators
    
    beam_search_generator
    
    transformer_beam_search_generator
- mc
  mc
  - dataset_readers
    dataset_readers
    
    commonsenseqa
    
    fake
    
    piqa
    
    swag
    
    transformer_mc
  - models
    models
    
    transformer_mc
  - predictors
    predictors
    
    transformer_mc
- pair_classification
  pair_classification
  - dataset_readers
    dataset_readers
    
    quora_paraphrase
    
    snli
  - models
    models
    
    bimpm
    
    decomposable_attention
    
    esim
  - predictors
    predictors
    
    textual_entailment
- pretrained
- rc
  rc
  - dataset_readers
    dataset_readers
    
    drop
    
    qangaroo
    
    quac
    
    squad
    
    transformer_squad
    
    triviaqa
    
    utils
  - metrics
    metrics
    
    drop_em_and_f1
    
    squad_em_and_f1
  - models
    models
    
    bidaf
    
    bidaf_ensemble
    
    dialog_qa
    
    naqanet
    
    qanet
    
    transformer_qa
    
    utils
  - modules
    modules
    
    seq2seq_encoders
    seq2seq_encoders
    
    multi_head_self_attention
    
    qanet_encoder
    
    stacked_self_attention
  - predictors
    predictors
    
    bidaf
    
    dialog_qa
    
    transformer_qa
  - tools
    tools
    
    drop
    
    narrativeqa
    
    orb
    
    orb_utils
    
    quoref
    
    squad
    
    transformer_qa_eval
- structured_prediction
  structured_prediction
  - dataset_readers
    dataset_readers
    
    penn_tree_bank
    
    semantic_dependencies
    
    srl
    
    universal_dependencies
  - metrics
    metrics
    
    srl_eval_scorer
  - models
    models
    
    biaffine_dependency_parser
    
    constituency_parser
    
    graph_parser
    
    srl
    
    srl_bert
  - predictors
    predictors
    
    biaffine_dependency_parser
    
    constituency_parser
    
    openie
    
    srl
  - tools
    tools
    
    convert_openie_to_conll
    
    write_srl_predictions_to_conll_format
- tagging
  tagging
  - dataset_readers
    dataset_readers
    
    ccgbank
    
    conll2000
    
    conll2003
    
    ontonotes_ner
  - models
    models
    
    crf_tagger
  - predictors
    predictors
    
    sentence_tagger
- vision
  vision
  - dataset_readers
    dataset_readers
    
    gqa
    
    vision_reader
    
    visual_entailment
    
    vqav2
  - metrics
    metrics
    
    vqa
  - models
    models
    
    heads
    heads
    
    visual_entailment_head
    
    vqa_head
    
    vilbert_vqa
    
    vision_text_model
    
    visual_entailment
  - predictors
    predictors
    
    vilbert_vqa
    
    visual_entailment
CHANGELOG
License

gpt2

allennlp_models.lm.modules.language_model_heads.gpt2

Gpt2LanguageModelHead#

@LanguageModelHead.register("gpt2")
class Gpt2LanguageModelHead(LanguageModelHead):
 | def __init__(self, model_name: str) -> None

Loads just the LM head from transformers.GPT2LMHeadModel. It was easiest to load the entire model before only pulling out the head, so this is a bit slower than it could be, but for practical use in a model, the few seconds of extra loading time is probably not a big deal.

get_input_dim#

class Gpt2LanguageModelHead(LanguageModelHead):
 | ...
 | @overrides
 | def get_input_dim(self) -> int

get_output_dim#

class Gpt2LanguageModelHead(LanguageModelHead):
 | ...
 | @overrides
 | def get_output_dim(self) -> int

forward#

class Gpt2LanguageModelHead(LanguageModelHead):
 | ...
 | def forward(self, hidden_states: torch.Tensor) -> torch.Tensor