Das Wichtigste in Kürze

  • Der nächtliche Ruhepuls wird genau gemessen. Über 536 Nächte lag der mittlere absolute Fehler aller getesteten Geräte gegenüber einem EKG-Brustgurt bei 0,98 bis 1,78 Schlägen pro Minute (Dial et al. 2025).
  • Bei der HRV ist die Spannweite größer. Oura Gen 3 und 4 erreichen eine fast perfekte Übereinstimmung (CCC 0,97 bis 0,99), Polar fällt mit CCC 0,82 und bis zu 16 Prozent Fehler klar ab.
  • Der Recovery-Score ist eine Blackbox. Kein Hersteller legt seine Formel offen, kaum einer liefert peer-reviewte Validierung. HRV (86 Prozent) und Ruhepuls (79 Prozent) sind die häufigsten Bausteine (Doherty et al. 2025).
  • Die Rohwerte sind belastbar, ihre Verrechnung nicht. Eine genaue Messung garantiert keinen aussagekräftigen Score. Beides sind zwei völlig verschiedene Fragen.
  • Trau dem Trend, nicht der Einzelzahl. Aussagekraft hat erst der Verlauf deiner Rohwerte über Tage und Wochen, nicht die Prozentanzeige von heute Morgen.

Kannst du deinem Recovery-Score trauen?

Moderne Wearables messen nächtlichen Ruhepuls und HRV bei guten Geräten genau genug für den Hausgebrauch. Der zusammengesetzte Recovery-Score ist dagegen eine ungeprüfte Blackbox. Verlässlich ist der Trend deiner Rohwerte über Tage, nicht die einzelne Zahl oder der Prozentwert von heute Morgen.

Diese Trennung ist der Kern des ganzen Themas. Eine Messung kann sehr gut sein und der daraus gebaute Score trotzdem fragwürdig. In diesem Artikel klären wir genau das auf: Wie gut messen die Geräte deinen Ruhepuls? Wie genau ist die HRV? Was passiert, wenn beide Werte zu einer Prozentzahl verrechnet werden? Und wie liest du deine Daten so, dass sie dir wirklich helfen?

Was steckt eigentlich hinter dem Recovery-Score?

Jeden Morgen liefert dein Tracker eine Zahl: 78 Prozent erholt, bereit für Belastung, grüner Ring. Diese Zahl fühlt sich präzise und objektiv an, deshalb richten viele ihr Training danach aus. Doch der Score ist keine Messung, sondern eine Rechnung. Er fasst mehrere Rohwerte zusammen, allen voran deinen nächtlichen Ruhepuls und deine Herzratenvariabilität, oft ergänzt um Schlafdauer, Atemfrequenz und Aktivität vom Vortag.

Die entscheidende Trennung, die dieser Artikel zieht: Wie gut sind die zugrunde liegenden Messungen, und wie gut ist die Verrechnung zu dieser einen Zahl? Beide Fragen sind sehr unterschiedlich zu beantworten. Eine Auswertung von Doherty und Kollegen (2025) hat 14 solcher Composite-Scores über zehn Hersteller katalogisiert, von Garmin Body Battery über Oura Readiness bis WHOOP Recovery. Der häufigste Baustein ist die HRV (in 86 Prozent der Scores), gefolgt vom Ruhepuls (79 Prozent), Aktivität und Schlafdauer (je 71 Prozent).

Die gute Nachricht steckt schon hier: Die wichtigsten Zutaten sind genau die zwei Herz-Werte, deren Messgenauigkeit wir inzwischen ziemlich gut kennen. Schauen wir sie uns nacheinander an, bevor wir zum Score selbst kommen.

Ruhepuls: überraschend genau gemessen

Hier kommt die erste belastbare Nachricht, und sie ist positiv. Dial und Kollegen (2025) haben fünf Geräte (Garmin Fenix 6, Oura Gen 3 und Gen 4, Polar Grit X Pro, WHOOP 4.0) über 536 Nächte gegen einen Polar-H10-Brustgurt mit Einkanal-EKG getestet, also gegen den Goldstandard der mobilen Herzmessung. Beim nächtlichen Ruhepuls lag der mittlere absolute Fehler aller getesteten Geräte zwischen 0,98 und 1,78 Schlägen pro Minute.

Oura Gen 3 schnitt am besten ab (Fehler 0,98 bpm, Konkordanz CCC 0,97), Oura Gen 4 fast identisch (CCC 0,98), WHOOP und Polar mit knapp unter zwei Schlägen Abweichung. Ein bis zwei Schläge Unterschied auf einen Ruhepuls von vielleicht 48 bis 55 in der Nacht. Das ist klein genug, dass du eine echte Veränderung deines Ruhepulses von Tag zu Tag tatsächlich erkennen kannst, sofern sie groß genug ist.

Eingeordnet wird das durch die Meta-Analyse von Zhang und Kollegen (2020). Über 44 Studien und 738 Effektstärken zeigte die optische Pulsmessung am Handgelenk im Schlaf eine mittlere Abweichung von nur minus 0,40 bpm. Im Ruhezustand und in der Nacht, also genau dann, wenn der Recovery-Score gebildet wird, ist die optische Messung am genauesten. Die Bewegung tagsüber, die optische Sensoren ins Schleudern bringt, fällt nachts weg. Die Technik dahinter ist die Photoplethysmographie, also die Messung der Blutdruckwelle per Lichtsensor.

HRV: gut, aber stärker geräteabhängig

Die HRV ist der empfindlichere Wert, und hier spreizt sich das Feld. In derselben Untersuchung von Dial und Kollegen (2025) erreichten die Oura-Ringe eine fast perfekte Übereinstimmung mit dem EKG (Gen 4: CCC 0,99, mittlerer prozentualer Fehler rund 6 Prozent; Gen 3: CCC 0,97). WHOOP lag im moderaten Bereich (CCC 0,94), Garmin (CCC 0,87) und vor allem Polar (CCC 0,82, mittlerer Fehler bis 16 Prozent) fielen klar ab.

Wie nah die Geräte am EKG liegen (Übereinstimmung CCC, höher ist besser)

Ruhepuls (RHR) HRV (RMSSD) Übereinstimmung mit EKG (CCC) 1,00 0,95 0,90 0,85 0,80 0,97 0,97 Oura Gen 3 0,98 0,99 Oura Gen 4 0,91 0,94 WHOOP 4.0 n.a. 0,87 Garmin Fenix 6 0,86 0,82 Polar Grit X Pro Gerät, sortiert von höchster zu niedrigster Genauigkeit
Übereinstimmung (Lins Concordance, CCC) der fünf Geräte mit dem EKG-Brustgurt über 536 Nächte. Bei der HRV spreizt sich das Feld deutlich, Polar (orange) fällt am stärksten ab. Garmin lieferte keine auswertbaren Ruhepuls-Daten. Quelle: Dial et al. 2025.

Warum die größere Streuung? Die HRV misst Millisekunden-Unterschiede zwischen Herzschlägen. Ein optischer Sensor erfasst aber nicht den elektrischen Schlag wie ein EKG, sondern die Blutdruckwelle, also die Pulswellen-Variabilität statt der echten Herzraten-Variabilität. Wie aus diesem Signal Artefakte gefiltert und Lücken interpoliert werden, ist Sache des Herstellers, und genau das erklärt die Geräteunterschiede.

Die systematische Übersicht von Georgiou und Kollegen (2018) ordnet das ein: Im Ruhezustand reicht die Übereinstimmung von sehr gut bis exzellent, mit steigender Belastung sinkt sie. Für den Recovery-Score zählt der Ruhezustand, also die günstige Bedingung. Praktisch heißt das: Ein gutes Gerät misst deine nächtliche HRV genau genug, um deinen persönlichen Trend abzubilden. Aber vergleiche nie deine Oura-HRV mit der WHOOP-HRV deines Trainingspartners. Die Absolutwerte sind nicht ohne Weiteres übertragbar, der Trend innerhalb desselben Geräts schon. Mehr zur Frage Sensortyp findest du im Artikel zu optischer versus Brustgurt-Messung.

Der Score selbst: eine ungeprüfte Blackbox

Jetzt der Kern des Problems. Die Rohwerte sind belastbar, aber was der Score daraus macht, ist intransparent. Doherty und Kollegen (2025) haben für ihre Auswertung 14 Composite-Scores über zehn Hersteller untersucht und ein klares Muster gefunden: Kein einziger Hersteller legt seine genaue Formel offen, und nur wenige liefern überhaupt peer-reviewte Belege für Genauigkeit oder klinische Relevanz ihrer Scores.

Eine Sport-Smartwatch am Handgelenk auf einem Holztisch zeigt einen Erholungsring mit der Zahl 61, daneben liegt ein aufgerollter Brustgurt-Herzfrequenzsensor neben einem Glas Wasser im Morgenlicht
Dieselben zwei Rohwerte, zwei verschiedene Geräte, womöglich zwei verschiedene Prozentzahlen. Die Messung kannst du nachvollziehen, die Gewichtung dahinter nicht.

Die Geräte unterscheiden sich darin, über welchen Zeitraum sie messen, wie sie die einzelnen Bausteine gewichten und nach welcher Logik sie verrechnen. Zwei Ringe können denselben Ruhepuls und dieselbe HRV messen und trotzdem unterschiedliche Recovery-Prozente ausgeben, weil ihre Black-Box-Algorithmen anders gewichten. Dazu kommt: Diese Algorithmen werden per Software-Update still verändert, sodass dein "85 Prozent" von heute nicht zwingend dasselbe bedeutet wie vor einem halben Jahr (Dial et al. 2025).

Der JACC-State-of-the-Art-Review von Petek und Kollegen (2023) formuliert es für die klinische Praxis deutlich: Komplexe Metriken stammen aus herstellereigenen Algorithmen, unterscheiden sich zwischen Geräten und entbehren einer klaren Goldstandard-Validierung. Die Empfehlung der Kardiologen: Daten über individuelle Verläufe interpretieren, nicht über Absolutwerte. Genau das ist die Brücke zur Praxis. Diese grundsätzliche Vorsicht gilt für alle abgeleiteten Kennzahlen, wie wir sie auch im Überblick zu Wearables und KI-Datenanalyse beschreiben.

So nutzt du die Daten richtig: Trend statt Einzelzahl

Die Konsequenz ist kein "Wearables sind nutzlos", sondern eine andere Lesart. Vier Prinzipien machen aus rohen Zahlen eine bessere Entscheidung.

Vertrau den Rohwerten, nicht dem Score. Such in deiner App die Kurven für nächtlichen Ruhepuls und HRV und schau dir an, wie sie sich über die letzten ein bis zwei Wochen entwickeln, statt nur auf die Tagesprozentzahl zu starren. Die Rohwerte sind das, was die Geräte tatsächlich gut messen.

Denk in Trends, nicht in Tagen. Eine einzelne hohe oder niedrige Nacht sagt fast nichts. Ein später Espresso, ein Glas Wein, eine warme Schlafumgebung oder schlicht ein schlechter Sensorkontakt können die HRV einer Nacht kippen. Erst wenn dein Ruhepuls über mehrere Tage erhöht bleibt oder deine HRV mehrere Tage unter deinem persönlichen Normalbereich liegt, ist das ein echtes Signal.

Bilde deinen eigenen Normalbereich. Die meisten Apps zeigen ein rollierendes Mittel mit Streuband. Erst Abweichungen aus diesem Band heraus sind aussagekräftig, eine absolute Zahl ohne diesen Bezug nicht. Dein Normalbereich ist individuell, der Vergleich mit anderen Menschen führt in die Irre.

Behandle den Score als Gesprächsanstoß, nicht als Befehl. Wenn der Ring rot zeigt, du dich aber frisch fühlst und deine Rohwerte normal sind, trainiere. Fühlst du dich platt, obwohl der Score grün ist, dann ruh dich aus. Das Körpergefühl und der mehrtägige Datentrend schlagen die Einzelzahl. Wer nach HRV trainieren will, findet die Methodik dahinter im Artikel zum HRV-gesteuerten Training.

So wird aus dem Tracker ein nützliches Werkzeug statt eines launischen Orakels. Die Geräte sind gut genug, um deinen Körper über die Zeit zu beobachten. Sie sind nur nicht gut genug, um dir mit einer einzelnen Prozentzahl zu sagen, was du heute tun sollst.