Skip to content

AllenNLP Models v2.10.1

vqa

AllenNLP Models v2.10.1

Home
Repository
Versions
Versions
- Latest
- Stable
- Commit
Models
Models
- classification
  classification
  - dataset_readers
    dataset_readers
    
    boolq
    
    stanford_sentiment_tree_bank
  - models
    models
    
    biattentive_classification_network
    
    transformer_classification_tt
- common
  common
  - ontonotes
- coref
  coref
  - dataset_readers
    dataset_readers
    
    conll
    
    preco
    
    winobias
  - metrics
    metrics
    
    conll_coref_scores
    
    mention_recall
  - models
    models
    
    coref
  - predictors
    predictors
    
    coref
  - util
- generation
  generation
  - dataset_readers
    dataset_readers
    
    cnn_dm
    
    copynet_seq2seq
    
    seq2seq
  - models
    models
    
    bart
    
    composed_seq2seq
    
    copynet_seq2seq
    
    simple_seq2seq
    
    t5
  - modules
    modules
    
    decoder_nets
    decoder_nets
    
    decoder_net
    
    lstm_cell
    
    stacked_self_attention
    
    seq_decoders
    seq_decoders
    
    auto_regressive
    
    seq_decoder
  - predictors
    predictors
    
    seq2seq
- lm
  lm
  - dataset_readers
    dataset_readers
    
    masked_language_model
    
    next_token_lm
    
    simple_language_modeling
  - models
    models
    
    bidirectional_lm
    
    language_model
    
    masked_language_model
    
    next_token_lm
  - modules
    modules
    
    language_model_heads
    language_model_heads
    
    bert
    
    gpt2
    
    language_model_head
    
    linear
    
    seq2seq_encoders
    seq2seq_encoders
    
    bidirectional_lm_transformer
    
    token_embedders
    token_embedders
    
    bidirectional_lm
    
    language_model
  - predictors
    predictors
    
    masked_language_model
    
    next_token_lm
  - util
    util
    
    beam_search_generators
    beam_search_generators
    
    beam_search_generator
    
    transformer_beam_search_generator
- mc
  mc
  - dataset_readers
    dataset_readers
    
    commonsenseqa
    
    fake
    
    piqa
    
    piqa_tt
    
    swag
    
    transformer_mc
    
    transformer_mc_tt
  - models
    models
    
    transformer_mc
    
    transformer_mc_tt
  - predictors
    predictors
    
    transformer_mc
- pair_classification
  pair_classification
  - dataset_readers
    dataset_readers
    
    quora_paraphrase
    
    snli
    
    transformer_superglue_rte
  - models
    models
    
    bimpm
    
    decomposable_attention
    
    esim
  - predictors
    predictors
    
    textual_entailment
- pretrained
- rc
  rc
  - dataset_readers
    dataset_readers
    
    drop
    
    qangaroo
    
    quac
    
    record_reader
    
    squad
    
    transformer_squad
    
    triviaqa
    
    utils
  - metrics
    metrics
    
    drop_em_and_f1
    
    squad_em_and_f1
  - models
    models
    
    bidaf
    
    bidaf_ensemble
    
    dialog_qa
    
    naqanet
    
    qanet
    
    transformer_qa
    
    utils
  - modules
    modules
    
    seq2seq_encoders
    seq2seq_encoders
    
    multi_head_self_attention
    
    qanet_encoder
    
    stacked_self_attention
  - predictors
    predictors
    
    bidaf
    
    dialog_qa
    
    transformer_qa
  - tools
    tools
    
    drop
    
    narrativeqa
    
    orb
    
    orb_utils
    
    quoref
    
    squad
    
    transformer_qa_eval
- structured_prediction
  structured_prediction
  - dataset_readers
    dataset_readers
    
    penn_tree_bank
    
    semantic_dependencies
    
    srl
    
    universal_dependencies
  - metrics
    metrics
    
    srl_eval_scorer
  - models
    models
    
    biaffine_dependency_parser
    
    constituency_parser
    
    graph_parser
    
    srl
    
    srl_bert
  - predictors
    predictors
    
    biaffine_dependency_parser
    
    constituency_parser
    
    openie
    
    srl
    
    util
  - tools
    tools
    
    convert_openie_to_conll
    
    write_srl_predictions_to_conll_format
- tagging
  tagging
  - dataset_readers
    dataset_readers
    
    ccgbank
    
    conll2000
    
    conll2003
    
    ontonotes_ner
  - models
    models
    
    crf_tagger
  - predictors
    predictors
    
    sentence_tagger
- vision
  vision
  - dataset_readers
    dataset_readers
    
    flickr30k
    
    gqa
    
    nlvr2
    
    utils
    
    vgqa
    
    vision_reader
    
    visual_entailment
    
    vqav2
  - metrics
    metrics
    
    vqa vqa
    Table of contents
    
    VqaMeasure
    
    9595call9595
    
    get95metric
    
    reset
  - models
    models
    
    heads
    heads
    
    nlvr2_head
    
    visual_entailment_head
    
    vqa_head
    
    nlvr2
    
    vilbert_image_retrieval
    
    vilbert_vqa
    
    vision_text_model
    
    visual_entailment
  - predictors
    predictors
    
    nlvr2
    
    vilbert_vqa
    
    visual_entailment
CHANGELOG
License

vqa

allennlp_models.vision.metrics.vqa

VqaMeasure#

@Metric.register("vqa")
class VqaMeasure(Metric):
 | def __init__(self) -> None

Compute the VQA metric, as described in https://www.semanticscholar.org/paper/VQA%3A-Visual-Question-Answering-Agrawal-Lu/97ad70a9fa3f99adf18030e5e38ebe3d90daa2db

In VQA, we take the answer with the highest score, and then we find out how often humans decided this was the right answer. The accuracy score for an answer is min(1.0, human_count / 3).

This metric takes the logits from the models, i.e., a score for each possible answer, and the labels for the question, together with their weights.

call#

class VqaMeasure(Metric):
 | ...
 | def __call__(
 |     self,
 |     logits: torch.Tensor,
 |     labels: torch.Tensor,
 |     label_weights: torch.Tensor
 | )

Parameters¶

logits : torch.Tensor
A tensor of predictions of shape (batch_size, num_classes).
labels : torch.Tensor
A tensor of integer class label of shape (batch_size, num_labels).
label_weights : torch.Tensor
A tensor of floats of shape (batch_size, num_labels), giving a weight or score to every one of the labels.

get_metric#

class VqaMeasure(Metric):
 | ...
 | def get_metric(self, reset: bool = False)

reset#

class VqaMeasure(Metric):
 | ...
 | def reset(self) -> None