Recovery-Score und Wearable-Genauigkeit: Wie verlässlich Ruhepuls und HRV vom Tracker sind
Jeden Morgen liefert dein Tracker eine Zahl: 78 Prozent erholt, grüner Ring, bereit für Belastung. Sie fühlt sich präzise an, also richtest du dein Training danach aus. Aber wie genau ist diese Zahl wirklich, und was steckt überhaupt dahinter?
Das Wichtigste in Kürze
Der nächtliche Ruhepuls wird genau gemessen. Über 536 Nächte lag der mittlere absolute Fehler aller getesteten Geräte gegenüber einem EKG-Brustgurt bei 0,98 bis 1,78 Schlägen pro Minute (Dial et al. 2025).
Bei der HRV ist die Spannweite größer. Oura Gen 3 und 4 erreichen eine fast perfekte Übereinstimmung (CCC 0,97 bis 0,99), Polar fällt mit CCC 0,82 und bis zu 16 Prozent Fehler klar ab.
Der Recovery-Score ist eine Blackbox. Kein Hersteller legt seine Formel offen, kaum einer liefert peer-reviewte Validierung. HRV (86 Prozent) und Ruhepuls (79 Prozent) sind die häufigsten Bausteine (Doherty et al. 2025).
Die Rohwerte sind belastbar, ihre Verrechnung nicht. Eine genaue Messung garantiert keinen aussagekräftigen Score. Beides sind zwei völlig verschiedene Fragen.
Trau dem Trend, nicht der Einzelzahl. Aussagekraft hat erst der Verlauf deiner Rohwerte über Tage und Wochen, nicht die Prozentanzeige von heute Morgen.
Moderne Wearables messen nächtlichen Ruhepuls und HRV bei guten Geräten genau genug für den Hausgebrauch. Der zusammengesetzte Recovery-Score ist dagegen eine ungeprüfte Blackbox. Verlässlich ist der Trend deiner Rohwerte über Tage, nicht die einzelne Zahl oder der Prozentwert von heute Morgen.
Diese Trennung ist der Kern des ganzen Themas. Eine Messung kann sehr gut sein und der daraus gebaute Score trotzdem fragwürdig. In diesem Artikel klären wir genau das auf: Wie gut messen die Geräte deinen Ruhepuls? Wie genau ist die HRV? Was passiert, wenn beide Werte zu einer Prozentzahl verrechnet werden? Und wie liest du deine Daten so, dass sie dir wirklich helfen?
Was steckt eigentlich hinter dem Recovery-Score?
Jeden Morgen liefert dein Tracker eine Zahl: 78 Prozent erholt, bereit für Belastung, grüner Ring. Diese Zahl fühlt sich präzise und objektiv an, deshalb richten viele ihr Training danach aus. Doch der Score ist keine Messung, sondern eine Rechnung. Er fasst mehrere Rohwerte zusammen, allen voran deinen nächtlichen Ruhepuls und deine Herzratenvariabilität, oft ergänzt um Schlafdauer, Atemfrequenz und Aktivität vom Vortag.
Die entscheidende Trennung, die dieser Artikel zieht: Wie gut sind die zugrunde liegenden Messungen, und wie gut ist die Verrechnung zu dieser einen Zahl? Beide Fragen sind sehr unterschiedlich zu beantworten. Eine Auswertung von Doherty und Kollegen (2025) hat 14 solcher Composite-Scores über zehn Hersteller katalogisiert, von Garmin Body Battery über Oura Readiness bis WHOOP Recovery. Der häufigste Baustein ist die HRV (in 86 Prozent der Scores), gefolgt vom Ruhepuls (79 Prozent), Aktivität und Schlafdauer (je 71 Prozent).
Die gute Nachricht steckt schon hier: Die wichtigsten Zutaten sind genau die zwei Herz-Werte, deren Messgenauigkeit wir inzwischen ziemlich gut kennen. Schauen wir sie uns nacheinander an, bevor wir zum Score selbst kommen.
Ruhepuls: überraschend genau gemessen
Hier kommt die erste belastbare Nachricht, und sie ist positiv. Dial und Kollegen (2025) haben fünf Geräte (Garmin Fenix 6, Oura Gen 3 und Gen 4, Polar Grit X Pro, WHOOP 4.0) über 536 Nächte gegen einen Polar-H10-Brustgurt mit Einkanal-EKG getestet, also gegen den Goldstandard der mobilen Herzmessung. Beim nächtlichen Ruhepuls lag der mittlere absolute Fehler aller getesteten Geräte zwischen 0,98 und 1,78 Schlägen pro Minute.
Oura Gen 3 schnitt am besten ab (Fehler 0,98 bpm, Konkordanz CCC 0,97), Oura Gen 4 fast identisch (CCC 0,98), WHOOP und Polar mit knapp unter zwei Schlägen Abweichung. Ein bis zwei Schläge Unterschied auf einen Ruhepuls von vielleicht 48 bis 55 in der Nacht. Das ist klein genug, dass du eine echte Veränderung deines Ruhepulses von Tag zu Tag tatsächlich erkennen kannst, sofern sie groß genug ist.
Eingeordnet wird das durch die Meta-Analyse von Zhang und Kollegen (2020). Über 44 Studien und 738 Effektstärken zeigte die optische Pulsmessung am Handgelenk im Schlaf eine mittlere Abweichung von nur minus 0,40 bpm. Im Ruhezustand und in der Nacht, also genau dann, wenn der Recovery-Score gebildet wird, ist die optische Messung am genauesten. Die Bewegung tagsüber, die optische Sensoren ins Schleudern bringt, fällt nachts weg. Die Technik dahinter ist die Photoplethysmographie, also die Messung der Blutdruckwelle per Lichtsensor.
HRV: gut, aber stärker geräteabhängig
Die HRV ist der empfindlichere Wert, und hier spreizt sich das Feld. In derselben Untersuchung von Dial und Kollegen (2025) erreichten die Oura-Ringe eine fast perfekte Übereinstimmung mit dem EKG (Gen 4: CCC 0,99, mittlerer prozentualer Fehler rund 6 Prozent; Gen 3: CCC 0,97). WHOOP lag im moderaten Bereich (CCC 0,94), Garmin (CCC 0,87) und vor allem Polar (CCC 0,82, mittlerer Fehler bis 16 Prozent) fielen klar ab.
Wie nah die Geräte am EKG liegen (Übereinstimmung CCC, höher ist besser)
Übereinstimmung (Lins Concordance, CCC) der fünf Geräte mit dem EKG-Brustgurt über 536 Nächte. Bei der HRV spreizt sich das Feld deutlich, Polar (orange) fällt am stärksten ab. Garmin lieferte keine auswertbaren Ruhepuls-Daten. Quelle: Dial et al. 2025.
Warum die größere Streuung? Die HRV misst Millisekunden-Unterschiede zwischen Herzschlägen. Ein optischer Sensor erfasst aber nicht den elektrischen Schlag wie ein EKG, sondern die Blutdruckwelle, also die Pulswellen-Variabilität statt der echten Herzraten-Variabilität. Wie aus diesem Signal Artefakte gefiltert und Lücken interpoliert werden, ist Sache des Herstellers, und genau das erklärt die Geräteunterschiede.
Die systematische Übersicht von Georgiou und Kollegen (2018) ordnet das ein: Im Ruhezustand reicht die Übereinstimmung von sehr gut bis exzellent, mit steigender Belastung sinkt sie. Für den Recovery-Score zählt der Ruhezustand, also die günstige Bedingung. Praktisch heißt das: Ein gutes Gerät misst deine nächtliche HRV genau genug, um deinen persönlichen Trend abzubilden. Aber vergleiche nie deine Oura-HRV mit der WHOOP-HRV deines Trainingspartners. Die Absolutwerte sind nicht ohne Weiteres übertragbar, der Trend innerhalb desselben Geräts schon. Mehr zur Frage Sensortyp findest du im Artikel zu optischer versus Brustgurt-Messung.
Der Score selbst: eine ungeprüfte Blackbox
Jetzt der Kern des Problems. Die Rohwerte sind belastbar, aber was der Score daraus macht, ist intransparent. Doherty und Kollegen (2025) haben für ihre Auswertung 14 Composite-Scores über zehn Hersteller untersucht und ein klares Muster gefunden: Kein einziger Hersteller legt seine genaue Formel offen, und nur wenige liefern überhaupt peer-reviewte Belege für Genauigkeit oder klinische Relevanz ihrer Scores.
Dieselben zwei Rohwerte, zwei verschiedene Geräte, womöglich zwei verschiedene Prozentzahlen. Die Messung kannst du nachvollziehen, die Gewichtung dahinter nicht.
Die Geräte unterscheiden sich darin, über welchen Zeitraum sie messen, wie sie die einzelnen Bausteine gewichten und nach welcher Logik sie verrechnen. Zwei Ringe können denselben Ruhepuls und dieselbe HRV messen und trotzdem unterschiedliche Recovery-Prozente ausgeben, weil ihre Black-Box-Algorithmen anders gewichten. Dazu kommt: Diese Algorithmen werden per Software-Update still verändert, sodass dein "85 Prozent" von heute nicht zwingend dasselbe bedeutet wie vor einem halben Jahr (Dial et al. 2025).
Der JACC-State-of-the-Art-Review von Petek und Kollegen (2023) formuliert es für die klinische Praxis deutlich: Komplexe Metriken stammen aus herstellereigenen Algorithmen, unterscheiden sich zwischen Geräten und entbehren einer klaren Goldstandard-Validierung. Die Empfehlung der Kardiologen: Daten über individuelle Verläufe interpretieren, nicht über Absolutwerte. Genau das ist die Brücke zur Praxis. Diese grundsätzliche Vorsicht gilt für alle abgeleiteten Kennzahlen, wie wir sie auch im Überblick zu Wearables und KI-Datenanalyse beschreiben.
So nutzt du die Daten richtig: Trend statt Einzelzahl
Die Konsequenz ist kein "Wearables sind nutzlos", sondern eine andere Lesart. Vier Prinzipien machen aus rohen Zahlen eine bessere Entscheidung.
Vertrau den Rohwerten, nicht dem Score. Such in deiner App die Kurven für nächtlichen Ruhepuls und HRV und schau dir an, wie sie sich über die letzten ein bis zwei Wochen entwickeln, statt nur auf die Tagesprozentzahl zu starren. Die Rohwerte sind das, was die Geräte tatsächlich gut messen.
Denk in Trends, nicht in Tagen. Eine einzelne hohe oder niedrige Nacht sagt fast nichts. Ein später Espresso, ein Glas Wein, eine warme Schlafumgebung oder schlicht ein schlechter Sensorkontakt können die HRV einer Nacht kippen. Erst wenn dein Ruhepuls über mehrere Tage erhöht bleibt oder deine HRV mehrere Tage unter deinem persönlichen Normalbereich liegt, ist das ein echtes Signal.
Bilde deinen eigenen Normalbereich. Die meisten Apps zeigen ein rollierendes Mittel mit Streuband. Erst Abweichungen aus diesem Band heraus sind aussagekräftig, eine absolute Zahl ohne diesen Bezug nicht. Dein Normalbereich ist individuell, der Vergleich mit anderen Menschen führt in die Irre.
Behandle den Score als Gesprächsanstoß, nicht als Befehl. Wenn der Ring rot zeigt, du dich aber frisch fühlst und deine Rohwerte normal sind, trainiere. Fühlst du dich platt, obwohl der Score grün ist, dann ruh dich aus. Das Körpergefühl und der mehrtägige Datentrend schlagen die Einzelzahl. Wer nach HRV trainieren will, findet die Methodik dahinter im Artikel zum HRV-gesteuerten Training.
So wird aus dem Tracker ein nützliches Werkzeug statt eines launischen Orakels. Die Geräte sind gut genug, um deinen Körper über die Zeit zu beobachten. Sie sind nur nicht gut genug, um dir mit einer einzelnen Prozentzahl zu sagen, was du heute tun sollst.
Wie das strongerlab Coaching deinen Recovery-Score einordnet
Eine Prozentzahl am Morgen ersetzt keine Entscheidung. Genau hier setzen wir an. Im strongerlab Coaching
nutzen wir nicht den fertigen Score, sondern deine Rohwerte: nächtlicher Ruhepuls und HRV im Trend,
verbunden mit Trainingsbelastung, Schlaf und deinem subjektiven Empfinden.
So entscheiden wir gemeinsam, ob ein roter Tag eine echte Bremse ist oder nur Rauschen einer einzelnen
Nacht, und passen die Woche an, ohne den großen Plan aus den Augen zu verlieren. Aus einer Blackbox-Zahl
wird eine nachvollziehbare Entscheidung.
✓Rohwerte im Trend statt blindem Vertrauen in die Score-Prozente
Sehr genau, solange sie nachts misst. In einer Validierungsstudie über 536 Nächte lag der mittlere absolute Fehler aller getesteten Geräte gegenüber einem EKG-Brustgurt zwischen 0,98 und 1,78 Schlägen pro Minute. Oura Gen 3 schnitt am besten ab. Tagsüber unter Bewegung wird die optische Messung deutlich ungenauer, im Schlaf ist sie am besten.
Ist die HRV vom Wearable zuverlässig?
Das hängt stark vom Gerät ab. In derselben Studie erreichten die Oura-Ringe eine fast perfekte Übereinstimmung mit dem EKG (CCC 0,97 bis 0,99), WHOOP lag im moderaten Bereich, Garmin und Polar fielen ab (Polar bis 16 Prozent Fehler). Ein gutes Gerät bildet deinen persönlichen HRV-Trend zuverlässig ab. Vergleiche aber nie deinen Absolutwert mit einem anderen Gerät.
Kann ich dem Recovery-Score vertrauen?
Nur bedingt. Der Recovery- oder Readiness-Score ist keine Messung, sondern eine herstellereigene Rechnung aus Ruhepuls, HRV und weiteren Werten. In einer Auswertung von 14 solcher Scores legte kein einziger Hersteller seine Formel offen, kaum einer lieferte peer-reviewte Validierung. Die Rohwerte sind belastbar, ihre Verrechnung zu einer Prozentzahl ist es nicht.
Warum schwankt mein Recovery-Score so stark?
Weil HRV und Ruhepuls von Nacht zu Nacht empfindlich auf Alltagsfaktoren reagieren. Ein später Kaffee, ein Glas Wein, eine warme Schlafumgebung oder schlechter Sensorkontakt können die Werte einer einzelnen Nacht kippen. Deshalb sagt ein einzelner Tageswert fast nichts. Aussagekraft hat erst der Trend über mehrere Tage und Wochen.
Soll ich nach dem Recovery-Score trainieren oder pausieren?
Nutze den Score als Hinweis, nicht als Befehl. Schau dir lieber die Rohkurven von Ruhepuls und HRV über ein bis zwei Wochen an und kombiniere sie mit deinem Körpergefühl. Fühlst du dich frisch und sind deine Werte normal, trainiere, auch wenn der Ring rot zeigt. Fühlst du dich platt, ruh dich aus, auch wenn der Score grün ist.
Brustgurt oder optischer Sensor für genaue Werte?
Der EKG-Brustgurt bleibt der Goldstandard, gerade für die HRV mit ihren Millisekunden-Abständen. Für den nächtlichen Ruhepuls und den HRV-Trend reicht ein gutes optisches Gerät im Ruhezustand aber aus. Entscheidend ist, dass du die Messmethode nicht ständig wechselst, sonst wird der Trend unbrauchbar.
Deine Tracker-Daten in echte Entscheidungen übersetzen?
Ruhepuls, HRV und Schlaf ergeben erst im Trend ein Bild. Lass uns deine Rohwerte so lesen, dass daraus die richtige Einheit zur richtigen Zeit wird, statt blinder Score-Gläubigkeit.
Quellen und Referenzen
Zhang, Y., Weaver, R. G., Armstrong, B., Burkart, S., Zhang, S., Beets, M. W.
Validity of Wrist-Worn photoplethysmography devices to measure heart rate: A systematic review and meta-analysis
Meta-Analyse
Journal of Sports Sciences, 38(17):2021-2034 (2020)