Enough is Enough! A Case Study on the Effect of Data Size for Evaluation Using Universal Dependencie

Maklum balas
Laporan

8 Tontonan Premium16/05/2024

When creating a new dataset for evaluation, one of the first considerations is the size of the dataset. If our evaluation data is too small, we risk making unsupported claims based on the results on such data. If, on the other hand, the data is too large, we waste valuable annotation time and costs that could have been used to widen the scope of our evaluation (i.e.\ annotate for more domains/languages). Hence, we investigate the effect of the size, and a variety of sampling strategies of evaluation data to optimize annotation efforts, using dependency parsing as a test case. We show that for in-language, in-domain datasets, 5,000 tokens is enough to obtain a reliable ranking of different parsers; especially if the data is distant enough from the training split (otherwise, we recommend 10,000). In cross-domain setups, the same amounts are required, but in cross-lingual setups much less (2,000 tokens) is enough.

Siaran semula adalah dilarang tanpa kebenaran pencipta.

0 Pengikut · 11 Video

Disyorkan untuk anda

Semua
Anime

DFP 40263 SMC | Types of Attacks in Mobile Computing. What Can We Do and Advices to Avoid Them

10:17

DFP 40263 SMC | Types of Attacks in Mobile Computing. What Can We Do and Advices to Avoid Them

Muhammad Zharfa_3809

2 Tontonan

🇨🇳 骨语 Talking Bones (w/Eng sub) 2018 (Season 1, Episode 30)

32:51

🇨🇳 骨语 Talking Bones (w/Eng sub) 2018 (Season 1, Episode 30)

Suspense-Movies

6 Tontonan

马到功成

0:27

1 Tontonan

Left Behind

3:21

John zam Daniel

0 Tontonan

Films Division logos (1971-2011)

1:34

Films Division logos (1971-2011)

1 Tontonan

ultimate Arc epSP2 Malaysia dub

25:12

ultimate Arc epSP2 Malaysia dub

Zulfitri Bolhat_9923

1 Tontonan

Benaran Si

0:22

0 Tontonan

Tiada Kebetulan Di Dunia Ini

0:23

Tiada Kebetulan Di Dunia Ini

0 Tontonan

ENGLISH F5 SPEAKING

59:42

ENGLISH F5 SPEAKING

Online.Class.SPM

1 Tontonan

PERNIAGAAN F5 BAB T4 ULANGKAJI

1:32:55

PERNIAGAAN F5 BAB T4 ULANGKAJI

Online.Class.SPM

1 Tontonan

SEJARAH F5 BAB 4 SISTEM PERSEKUTUAN

1:26:03

SEJARAH F5 BAB 4 SISTEM PERSEKUTUAN

Online.Class.SPM

0 Tontonan

ENGLISH F5 SPEAKING

1:00:12

ENGLISH F5 SPEAKING

Online.Class.SPM

1 Tontonan

ADD MATH F4 BAB 4 LOGARITHMA

47:40

ADD MATH F4 BAB 4 LOGARITHMA

Online.Class.SPM

0 Tontonan

ADD MATH F5 BAB 3 CIRI CIRI KAMIRAN

1:29:26

ADD MATH F5 BAB 3 CIRI CIRI KAMIRAN

Online.Class.SPM

1 Tontonan

MATEMATIK F5 BAB 3 INSURANS KEBAKARAN

1:30:00

MATEMATIK F5 BAB 3 INSURANS KEBAKARAN

Online.Class.SPM

0 Tontonan

SEJARAH F5 BAB 3.5/4

1:22:45

SEJARAH F5 BAB 3.5/4

Online.Class.SPM

0 Tontonan

SAINS F5 BAB 4 KTB PREP

59:47

SAINS F5 BAB 4 KTB PREP

Online.Class.SPM

0 Tontonan

SAINS F5 BAB 5 SEBATIAN KARBON

1:33:49

SAINS F5 BAB 5 SEBATIAN KARBON

Online.Class.SPM

1 Tontonan

ADD MATH F5 BAB 3 CIRI KAMIRAN

1:56:18

ADD MATH F5 BAB 3 CIRI KAMIRAN

Online.Class.SPM

0 Tontonan

SEJARAH F5 BAB 3 PREP

56:36

SEJARAH F5 BAB 3 PREP

Online.Class.SPM

0 Tontonan