VortragTechnologyGratis

Embracing the tyranny of testing

Di., 17. März 2026 um 11:30

ETH Zurich

ETH Zürich, 130, Binzmühlestrasse, Oerlikon, Kreis 11, Zürich, Bezirk Zürich, Zürich, 8050, Schweiz/Suisse/Svizzera/Svizra

Eintritt frei

Drinnen

Beschreibung

Forschungsvortrag an der ETH Zurich darüber, wie benchmarkgetriebenes 'training on the test' Modellvergleiche verzerrt und die Validität von Benchmarks gefährdet. Er untersucht die Auswirkungen und mögliche Gegenmaßnahmen für die ML‑Evaluation.

Embracing the tyranny of testing — Zurich Events