Skip to content

AllenNLP Models v2.10.1

drop_em_and_f1

AllenNLP Models v2.10.1

Home
Repository
Versions
Versions
- Latest
- Stable
- Commit
Models
Models
- classification
  classification
  - dataset_readers
    dataset_readers
    
    boolq
    
    stanford_sentiment_tree_bank
  - models
    models
    
    biattentive_classification_network
    
    transformer_classification_tt
- common
  common
  - ontonotes
- coref
  coref
  - dataset_readers
    dataset_readers
    
    conll
    
    preco
    
    winobias
  - metrics
    metrics
    
    conll_coref_scores
    
    mention_recall
  - models
    models
    
    coref
  - predictors
    predictors
    
    coref
  - util
- generation
  generation
  - dataset_readers
    dataset_readers
    
    cnn_dm
    
    copynet_seq2seq
    
    seq2seq
  - models
    models
    
    bart
    
    composed_seq2seq
    
    copynet_seq2seq
    
    simple_seq2seq
    
    t5
  - modules
    modules
    
    decoder_nets
    decoder_nets
    
    decoder_net
    
    lstm_cell
    
    stacked_self_attention
    
    seq_decoders
    seq_decoders
    
    auto_regressive
    
    seq_decoder
  - predictors
    predictors
    
    seq2seq
- lm
  lm
  - dataset_readers
    dataset_readers
    
    masked_language_model
    
    next_token_lm
    
    simple_language_modeling
  - models
    models
    
    bidirectional_lm
    
    language_model
    
    masked_language_model
    
    next_token_lm
  - modules
    modules
    
    language_model_heads
    language_model_heads
    
    bert
    
    gpt2
    
    language_model_head
    
    linear
    
    seq2seq_encoders
    seq2seq_encoders
    
    bidirectional_lm_transformer
    
    token_embedders
    token_embedders
    
    bidirectional_lm
    
    language_model
  - predictors
    predictors
    
    masked_language_model
    
    next_token_lm
  - util
    util
    
    beam_search_generators
    beam_search_generators
    
    beam_search_generator
    
    transformer_beam_search_generator
- mc
  mc
  - dataset_readers
    dataset_readers
    
    commonsenseqa
    
    fake
    
    piqa
    
    piqa_tt
    
    swag
    
    transformer_mc
    
    transformer_mc_tt
  - models
    models
    
    transformer_mc
    
    transformer_mc_tt
  - predictors
    predictors
    
    transformer_mc
- pair_classification
  pair_classification
  - dataset_readers
    dataset_readers
    
    quora_paraphrase
    
    snli
    
    transformer_superglue_rte
  - models
    models
    
    bimpm
    
    decomposable_attention
    
    esim
  - predictors
    predictors
    
    textual_entailment
- pretrained
- rc
  rc
  - dataset_readers
    dataset_readers
    
    drop
    
    qangaroo
    
    quac
    
    record_reader
    
    squad
    
    transformer_squad
    
    triviaqa
    
    utils
  - metrics
    metrics
    
    drop_em_and_f1 drop_em_and_f1
    Table of contents
    
    DropEmAndF1
    
    9595call9595
    
    get95metric
    
    reset
    
    squad_em_and_f1
  - models
    models
    
    bidaf
    
    bidaf_ensemble
    
    dialog_qa
    
    naqanet
    
    qanet
    
    transformer_qa
    
    utils
  - modules
    modules
    
    seq2seq_encoders
    seq2seq_encoders
    
    multi_head_self_attention
    
    qanet_encoder
    
    stacked_self_attention
  - predictors
    predictors
    
    bidaf
    
    dialog_qa
    
    transformer_qa
  - tools
    tools
    
    drop
    
    narrativeqa
    
    orb
    
    orb_utils
    
    quoref
    
    squad
    
    transformer_qa_eval
- structured_prediction
  structured_prediction
  - dataset_readers
    dataset_readers
    
    penn_tree_bank
    
    semantic_dependencies
    
    srl
    
    universal_dependencies
  - metrics
    metrics
    
    srl_eval_scorer
  - models
    models
    
    biaffine_dependency_parser
    
    constituency_parser
    
    graph_parser
    
    srl
    
    srl_bert
  - predictors
    predictors
    
    biaffine_dependency_parser
    
    constituency_parser
    
    openie
    
    srl
    
    util
  - tools
    tools
    
    convert_openie_to_conll
    
    write_srl_predictions_to_conll_format
- tagging
  tagging
  - dataset_readers
    dataset_readers
    
    ccgbank
    
    conll2000
    
    conll2003
    
    ontonotes_ner
  - models
    models
    
    crf_tagger
  - predictors
    predictors
    
    sentence_tagger
- vision
  vision
  - dataset_readers
    dataset_readers
    
    flickr30k
    
    gqa
    
    nlvr2
    
    utils
    
    vgqa
    
    vision_reader
    
    visual_entailment
    
    vqav2
  - metrics
    metrics
    
    vqa
  - models
    models
    
    heads
    heads
    
    nlvr2_head
    
    visual_entailment_head
    
    vqa_head
    
    nlvr2
    
    vilbert_image_retrieval
    
    vilbert_vqa
    
    vision_text_model
    
    visual_entailment
  - predictors
    predictors
    
    nlvr2
    
    vilbert_vqa
    
    visual_entailment
CHANGELOG
License

drop_em_and_f1

allennlp_models.rc.metrics.drop_em_and_f1

DropEmAndF1#

@Metric.register("drop")
class DropEmAndF1(Metric):
 | def __init__(self) -> None

This Metric takes the best span string computed by a model, along with the answer strings labeled in the data, and computes exact match and F1 score using the official DROP evaluator (which has special handling for numbers and for questions with multiple answer spans, among other things).

call#

class DropEmAndF1(Metric):
 | ...
 | def __call__(
 |     self,
 |     prediction: Union[str, List],
 |     ground_truths: List
 | )

Parametersprediction: ``Union[str, List]``¶

The predicted answer from the model evaluated. This could be a string, or a list of string
when multiple spans are predicted as answer.

ground_truths: List All the ground truth answer annotations.

get_metric#

class DropEmAndF1(Metric):
 | ...
 | def get_metric(self, reset: bool = False) -> Tuple[float, float]

ReturnsAverage exact match and F1 score (in that order) as computed by the official DROP script¶

over all inputs.

reset#

class DropEmAndF1(Metric):
 | ...
 | def reset(self)