Embracing the tyranny of testing
Di., 17. März 2026 um 11:30
ETH Zurich
ETH Zürich, 130, Binzmühlestrasse, Oerlikon, Kreis 11, Zürich, Bezirk Zürich, Zürich, 8050, Schweiz/Suisse/Svizzera/Svizra
Eintritt frei
Drinnen
Beschreibung
Forschungsvortrag an der ETH Zurich darüber, wie benchmarkgetriebenes 'training on the test' Modellvergleiche verzerrt und die Validität von Benchmarks gefährdet. Er untersucht die Auswirkungen und mögliche Gegenmaßnahmen für die ML‑Evaluation.