Auf diese sekundengenauen Ergebnisse würde ich nicht zuviel geben, das kennen wir schon von den Akku-Tests, wo stromhungrigere Max-Chips manchmal besser abschneiden als Modelle mit besserer Laufzeit, weil nicht sichergestellt wurde, dass im Hintergrund nix mitläuft. Das hatte linustechtips zB gemacht beim Test mit den M1-Modellen, da war noch ein anderes Benutzerkonto angemeldet und das Testergebnis damit falsch. So weiß ich auch hier nicht, wie vergleichbar die Ergebnisse sind. Selbst routinierten Testern unterlaufen manchmal Fehler, zB dass die OS-Version nicht ident ist und zufällig genau durch diesen Versionsunterschied im Hintergrund eine andere Treiber- oder Firmwareversion läuft.
Testergebnisse können auch ganz banal zB durch den Füllstand der eingebauten SSD verfälscht werden. Eine mehr als 80% befüllte SSD kann je nach Gerät/Modell (wieviele NAND-Chips befinden sich auf der Platine) und Art des Tests Rechenzeiten beeinflussen. Daher schneidet auch ein M2-Air manchmal schlechter ab, wenn es nicht mindestens die 1TB große SSD drin hat (evtl. reichten auch die 500GB, bin mir nicht ganz sicher).
Bei einem Air kommt es bei der Performance auch darauf an, ob man einen Durchgang vom Leerlauf aus misst, wo das Gerät kühl ist und länger volle Performance liefern kann, oder ob man einen Durchgang misst während das Gerät schon gut warmgelaufen ist, oder ob man einen Durchschnittswert aus einigen Durchgängen hintereinander nimmt, und ob das in einem klimatisierten Raum getestet wurde oder ob das ein Reviewer bei sich zuhause bei 27 Grad Sommertemperatur gemacht hat.
Auch die Displayskalierung hat einen durchaus signifikanten GPU-Impact, bei Modellen mit dem M1-SoC (nicht Pro/Max) ruckelt bei Videobearbeitung in 4k das Timeline-Scrolling, wenn man ein non integer scaling mit einem externen Monitor hernimmt.
Ob alle diese Sachen und noch viele mehr bei solchen sekundengenauen Tests berücksichtigt wurden?