Extreme Summarization (xsum)

A dataset for evaluating an LLM's ability to summarize a single document. Each entry in the dataset consists of:

A document authored by the British Broadcasting Corporation (BBC).

A one-sentence summary of that document.

Created for this library

1.
An LLM evaluation team includes Extreme Summarization in its benchmark suite to measure abstractive summarization quality on news articles.
2.
A research lab reports xsum ROUGE scores in model cards so downstream users can compare abstractive summarization quality.
3.
A summarization product team uses xsum as one of several benchmarks when selecting a base model for its meeting-notes feature.

Loading…