Wie genau trackt die Uhr deinen Schlaf? Schlafphasen-Daten vs. Schlaflabor
Morgens zeigt die App Tiefschlaf, REM und einen Score auf die Minute genau. Doch deine Uhr hat in der Nacht keine einzige Gehirnwelle gesehen. Was die Daten gegen das Schlaflabor wirklich taugen.
Das Wichtigste in Kürze
Deine Uhr misst keinen Schlaf, sie schätzt ihn. Aus Bewegung (Aktigraphie), Herzfrequenz und HRV, oft plus Temperatur. Die Gehirnströme, die das Schlaflabor per Polysomnographie liest, sieht sie nie.
Die robusteste Zahl ist die Gesamtschlafzeit. Schlaf gegen Wach trifft die Uhr mit über 90 Prozent Sensitivität, die Schlafdauer liegt oft nur Minuten daneben.
Die schwächste Zahl sind die Schlafphasen. Bei der Vier-Stadien-Einteilung erreichen gute Geräte nur ein Cohen-Kappa von rund 0,55 bis 0,65. Tiefschlaf und REM werden um 15 bis 45 Minuten daneben geschätzt.
Wach liegen erkennt die Uhr am schlechtesten. Sie hält ruhiges Wachliegen oft für Schlaf (Spezifität teils unter 50 Prozent) und schmeichelt damit deinem Schlafscore.
Lies Trends über Wochen, nicht die Einzelnacht. Eine sinkende Schlafzeit ist verlässlicher als die Tiefschlaf-Prozente einer einzelnen Nacht.
Deine Uhr misst keinen Schlaf, sie schätzt ihn aus Bewegung, Herzfrequenz und HRV. Gesamtschlafzeit und Schlaf gegen Wach trifft sie gut, mit über 90 Prozent Sensitivität. Die einzelnen Schlafphasen REM und Tiefschlaf aber nur moderat. Vertrau den Trends über Wochen, nicht den Phasen-Prozenten einer Nacht.
Du wachst auf, greifst zum Handy, und die App sagt dir: 6 Stunden 42 Minuten Schlaf, davon 54 Minuten Tiefschlaf, 1 Stunde 18 REM, Schlafscore 81. Das sieht aus wie eine Messung aus dem Labor. Ist es aber nicht. Deine Uhr hat in der Nacht keine einzige Gehirnwelle gesehen. Sie hat geschätzt, und manche dieser Schätzungen sind richtig gut, andere kaum besser als ein gebildeter Tipp. Dieser Artikel trennt beides: Was du den Schlafdaten deiner Uhr glauben darfst und was nicht. Grundlage sind Validierungsstudien, die Wearables Nacht für Nacht direkt gegen die Polysomnographie im Schlaflabor gestellt haben, also gegen den Goldstandard der Schlafmedizin.
Wie eine Uhr überhaupt Schlaf misst
Das Schlaflabor misst Schlaf direkt. Per Polysomnographie (PSG) zeichnet es Gehirnströme (EEG), Augenbewegungen und Muskelspannung auf. Daraus lesen geschulte Auswerter in 30-Sekunden-Abschnitten die Schlafstadien ab: Wach, Leichtschlaf, Tiefschlaf und REM. Das ist die Referenz, an der alles gemessen wird.
Deine Uhr hat nichts davon. Sie sitzt am Handgelenk oder als Ring am Finger und kommt ans Gehirn nicht heran. Stattdessen kombiniert sie indirekte Signale:
Aktigraphie (Bewegung): Ein winziger Beschleunigungssensor zählt, wie viel du dich bewegst. Die Grundannahme ist Jahrzehnte alt und simpel. Wer still liegt, schläft wahrscheinlich, wer sich bewegt, ist wahrscheinlich wach. Das ist die Basis fast jedes Schlaftrackers.
Herzfrequenz und HRV: Per optischem Sensor (Photoplethysmographie) misst die Uhr den Puls am Handgelenk und daraus die Herzratenvariabilität. Das vegetative Nervensystem arbeitet in jedem Schlafstadium anders: Im Tiefschlaf sinken Puls und Atmung am stärksten ab, im REM wird das Muster unruhiger und ähnelt fast dem Wachzustand.
Temperatur und Atmung: Bessere Geräte ergänzen Hauttemperatur, Atemfrequenz und Sauerstoffsättigung, um die Phasen-Schätzung zu schärfen.
Das grüne Licht an der Unterseite der Uhr ist der optische Pulssensor. Aus diesem indirekten Signal plus Bewegung schätzt der Algorithmus deine Schlafphasen, das Gehirn selbst sieht er nicht.
Aus diesen Rohdaten macht ein Algorithmus, heute meist ein neuronales Netz, eine Schlafkurve. Walch und Kollegen (2019) haben genau das offengelegt: Aus reiner Beschleunigung plus PPG-Herzfrequenz einer Consumer-Uhr lassen sich Schlaf und Wach mit rund 90 Prozent Genauigkeit trennen, die Drei-Klassen-Einteilung Wach-NREM-REM aber nur noch mit etwa 72 Prozent (Cohen-Kappa 0,28). Der Punkt ist: Die Uhr rekonstruiert deinen Schlaf aus Stellvertreter-Signalen. Sie misst ihn nicht.
Was die Uhr gut kann: Gesamtschlafzeit und Schlaf gegen Wach
Die gute Nachricht zuerst. Die Frage "Habe ich geschlafen oder nicht?" beantworten moderne Tracker erstaunlich zuverlässig. In der Validierungsstudie von Robbins und Kollegen (2024) gegen das Schlaflabor erreichten Oura Ring, Fitbit und Apple Watch bei der Schlaf-gegen-Wach-Erkennung Sensitivitäten von 95 bis 97 Prozent. Sie erkennen also fast jeden Schlaf-Abschnitt als Schlaf. In der Sechs-Geräte-Studie von Schyvens und Kollegen (2025) lag diese Sensitivität über alle Geräte bei 92 bis 96 Prozent.
Auch die Gesamtschlafzeit ist meist nah dran. Im systematischen Review von Schyvens und Kollegen (2024) wich die Schlafdauer je nach Gerät nur wenige Minuten vom Labor ab. Beim WHOOP waren es 1,4 Minuten, beim Fitbit Charge 4 rund 6 Minuten. Ein Ausreißer war die Garmin Vivosmart 4 mit fast 47 Minuten zu viel. Die Tendenz über viele Geräte: Schlaftracker neigen dazu, die Schlafzeit eher zu überschätzen, weil sie ruhiges Wachliegen als Schlaf verbuchen. Die Fitbit-Meta-Analyse von Haghayegh und Kollegen (2019) zeigt denselben Bias, dort wurde die Gesamtschlafzeit um rund 7 bis 67 Minuten überschätzt.
Das ist die Kennzahl, der du am meisten trauen darfst: wie lange du grob geschlafen hast. Für dich als Ausdauersportler ist das die wichtigste Information überhaupt, denn chronischer Schlafmangel ist der direkteste Bremsklotz für Regeneration und Anpassung.
Wo es schwierig wird: Schlafphasen, REM und Tiefschlaf
Jetzt die ehrliche Nachricht. Sobald die Uhr nicht mehr nur Schlaf von Wach trennen, sondern die einzelnen Schlafphasen auseinanderhalten soll, fällt die Genauigkeit deutlich ab. Bei der Vier-Stadien-Einteilung erreichten in der Robbins-Studie die besten Geräte nur eine moderate bis substanzielle Übereinstimmung mit dem Labor: Oura ein Cohen-Kappa von 0,65, Apple Watch 0,60, Fitbit 0,55. Ein Kappa von 1,0 wäre perfekte Übereinstimmung, ein Kappa um 0 reiner Zufall. 0,55 bis 0,65 heißt: deutlich besser als geraten, aber weit von einer Messung entfernt.
Sensitivität pro Schlafstadium: Schlaf gegen Wach trifft die Uhr, die Phasen wackeln
Türkis = gute Trefferquote, Orange = schwacher Wert. Schlaf gegen Wach trifft jede Uhr, aber Tiefschlaf (Apple 50, Fitbit 62 Prozent) und REM (Fitbit 67 Prozent) sind die wackeligen Werte. Quelle: Robbins et al. 2024 (PSG-Validierung, 35 Erwachsene).
Bei der Sensitivität pro Phase zeigt sich das Muster klar. Tiefschlaf und REM treffen die Geräte am unzuverlässigsten:
Tiefschlaf: Oura erkannte ihn mit 79,5 Prozent Sensitivität noch ordentlich, der Fitbit kam auf 61,7 Prozent, die Apple Watch nur auf 50,5 Prozent. In Minuten: Der Fitbit unterschätzte den Tiefschlaf im Schnitt um 15 Minuten, die Apple Watch um satte 43 Minuten.
REM: Apple Watch (82,6 Prozent) und Oura (76,0 Prozent) lagen hier gut, der Fitbit fiel auf 67,3 Prozent ab.
Leichtschlaf: Wird von fast allen Geräten überschätzt, oft um 18 bis 45 Minuten, weil das, was nicht sauber als Tiefschlaf oder REM erkannt wird, im Leichtschlaf landet.
Der eigentliche Schwachpunkt ist aber das Wachliegen. Die Spezifität, also wie gut die Uhr echte Wach-Phasen als wach erkennt, ist niedrig. In der Sechs-Geräte-Studie lag sie nur zwischen 29 und 52 Prozent. Anders gesagt: Wenn du nachts ruhig wach im Bett liegst, ohne dich groß zu bewegen, verbucht die Uhr das mit hoher Wahrscheinlichkeit als Schlaf. Das ist die alte Achillesferse der Aktigraphie: Stillliegen ist nicht gleich Schlafen. Genau diese Schwäche schmeichelt deinem Schlafscore.
Warum gerade die Phasen so schwer sind
Der Grund ist physikalisch, nicht eine Frage des nächsten Software-Updates. Tiefschlaf und REM unterscheiden sich im Gehirn massiv, am Handgelenk aber kaum. Das EEG sieht im Tiefschlaf langsame Delta-Wellen und im REM ein fast waches Muster mit Augenbewegungen. Deine Uhr sieht nur: wenig Bewegung, niedriger Puls. Und niedriger Puls plus Stillliegen sieht im Tiefschlaf und in ruhigen Leichtschlaf-Phasen ähnlich aus. Auch kurze Aufwach-Momente, die das EEG sekundengenau erfasst, gehen am Handgelenk meist unter.
Der Goldstandard ist deshalb der Goldstandard, weil er direkt am Organ misst, das schläft. Eine Uhr am Handgelenk hat diese Information schlicht nicht. Sie rechnet eine plausible Verteilung aus Statistik und Trainingsdaten zusammen. Deshalb können zwei Marken für dieselbe Nacht völlig unterschiedliche Tiefschlaf-Werte ausgeben, beide überzeugend präsentiert. In der Multizenter-Studie von Lee und Kollegen (2023) über elf Tracker reichte die Vier-Stadien-Genauigkeit denn auch von schwach bis ordentlich, je nach Gerät und Bauart.
Wichtig zur Einordnung: Diese Validierungsstudien laufen meist eine einzige Nacht im Labor an gesunden Erwachsenen. Bei Schlafstörungen, unregelmäßigem Schlaf oder im höheren Alter wird die Genauigkeit eher schlechter, nicht besser. Verallgemeinere die guten Laborwerte also nicht blind auf jede deiner Nächte.
Was du den Daten glauben darfst und wie du sie nutzt
Daraus folgt eine klare Hierarchie, was du ernst nehmen solltest:
Vertrau der Gesamtschlafzeit und dem Trend. Wie lange du schläfst und ob das über Wochen steigt oder fällt, ist die belastbarste Information. Eine Trainingswoche mit drei Nächten unter sechs Stunden ist ein echtes Warnsignal, egal was der Schlafscore sagt.
Nimm Ruhepuls und HRV im Schlaf ernst. Diese Rohwerte misst die Uhr direkter als die Phasen. Ein über mehrere Nächte erhöhter nächtlicher Puls oder eine eingebrochene HRV ist ein gutes Früh-Signal für beginnenden Infekt, Alkohol, spätes Essen oder Überlastung.
Behandle Phasen-Prozente als groben Hinweis, nicht als Messwert. Ob deine App 18 oder 24 Prozent Tiefschlaf anzeigt, ist innerhalb des Messfehlers und sagt für eine einzelne Nacht wenig. Erst ein konsistentes Muster über viele Nächte trägt eine Aussage.
Lies immer den Trend, nie die Einzelnacht. Genau hier liegt die Stärke der Wearables: Sie messen jede Nacht zu Hause, das Labor nur einmal. Diese Längsschnitt-Sicht ist mehr wert als die Phasen-Genauigkeit einer Nacht.
Lass dich nicht vom Score stressen. Es gibt das Phänomen der Orthosomnie, bei dem die Jagd nach perfekten Schlafdaten den Schlaf selbst verschlechtert. Wenn ein schlechter Score dich morgens runterzieht, obwohl du dich ausgeruht fühlst, glaub deinem Körpergefühl.
So nutzt du die Uhr richtig: nicht die eine Nacht starren, sondern den Trend über Wochen lesen. Die Längsschnitt-Sicht jede Nacht zu Hause ist die eigentliche Stärke gegenüber der einmaligen Labornacht.
Praktisch heißt das: Nutze die Uhr als Verhaltens-Spiegel. Sie ist ein gutes Werkzeug, um Muster zu erkennen (gehst du früher ins Bett, schläfst du länger), aber ein schlechtes Diagnose-Instrument. Wer einen echten Verdacht auf eine Schlafstörung wie Schlafapnoe hat, gehört ins Schlaflabor, nicht zur App. Wer einfach besser regenerieren will, ist mit dem Trend der Gesamtschlafzeit bestens bedient. Wie du diesen Schlaf dann tatsächlich verbesserst, steht in unserem Leitfaden zur Schlafoptimierung für Ausdauersportler. Und wer verstehen will, wie die ganze Datenkette von Rohsignal bis Score zustande kommt, findet das bei Wearables und KI-Datenanalyse. Dieselbe Logik wie bei der Pulsmessung am Handgelenk gilt auch hier: Jede Auswertung ist nur so gut wie das Rohsignal darunter.
Wie dich das strongerlab Coaching beim Lesen deiner Schlafdaten unterstützt
Schlafdaten sind ein starkes Werkzeug, wenn du die richtigen Zahlen ernst nimmst und die
wackeligen ignorierst. Wer jede Nacht den Tiefschlaf-Prozenten hinterherjagt, verliert das
Wesentliche aus dem Blick.
Im strongerlab Coaching schauen wir auf das, was zählt: Gesamtschlafzeit, Ruhepuls und HRV im
Trend über Wochen, gekoppelt an deine Trainingslast. So wird der Schlaftracker zum
Frühwarnsystem für Erholung, statt zum täglichen Stressfaktor.
✓Die belastbaren Kennzahlen herausfiltern statt jede Phase zu deuten
✓Schlaf-Trends mit der Trainingslast verknüpfen statt isoliert betrachten
✓Ruhepuls und HRV im Schlaf als Frühwarnsystem nutzen
✓Orthosomnie vermeiden: Daten ernst nehmen, ohne sich von ihnen stressen zu lassen
Empfehlung von strongerlab. Lies den Trend, nicht die einzelne Nacht.
1
Trend vor Einzelnacht
Wir bewerten Schlafdaten über Wochen, nicht eine Nacht. Erst das Muster trägt eine
Aussage, der einzelne Score ist Rauschen.
2
Die richtige Zahl
Gesamtschlafzeit, Ruhepuls und HRV sind belastbar. Tiefschlaf-Prozente nehmen wir nur als
groben Hinweis, nicht als Messwert.
3
Daten ohne Stress
Der Tracker soll dich informieren, nicht runterziehen. Wir koppeln die Werte ans
Körpergefühl, statt ihnen blind zu folgen.
Es kommt darauf an, welche Zahl du meinst. Ob du schläfst oder wach bist, erkennt deine Uhr sehr zuverlässig: Moderne Tracker erreichen gegen das Schlaflabor über 90 Prozent Sensitivität, oft 95 bis 97 Prozent. Auch die Gesamtschlafzeit liegt meist nur wenige Minuten daneben. Die einzelnen Schlafphasen REM, Tiefschlaf und Leichtschlaf trifft die Uhr dagegen nur moderat. Bei der Vier-Stadien-Einteilung erreichen gute Geräte ein Cohen-Kappa von rund 0,55 bis 0,65, also deutlich besser als Zufall, aber weit weg von einer echten Messung.
Wie misst eine Uhr überhaupt den Schlaf, wenn sie keine Gehirnwellen sieht?
Deine Uhr misst Schlaf nicht direkt, sie schätzt ihn aus indirekten Signalen. Wichtigste Quelle ist die Aktigraphie, also Bewegung über einen Beschleunigungssensor: Wer still liegt, schläft wahrscheinlich. Dazu kommen Herzfrequenz und Herzratenvariabilität über einen optischen Sensor am Handgelenk, oft ergänzt um Hauttemperatur und Atemfrequenz. Ein Algorithmus, meist ein neuronales Netz, formt daraus eine Schlafkurve. Das Schlaflabor misst per Polysomnographie dagegen direkt die Gehirnströme, die deine Uhr nie sieht.
Warum trifft die Uhr Tiefschlaf und REM so schlecht?
Weil sich Tiefschlaf und REM im Gehirn massiv unterscheiden, am Handgelenk aber kaum. Das Schlaflabor sieht im Tiefschlaf langsame Delta-Wellen und im REM ein fast waches Muster mit Augenbewegungen. Deine Uhr sieht nur wenig Bewegung und einen niedrigen Puls, und das sieht in Tiefschlaf und ruhigen Leichtschlafphasen ähnlich aus. In der Robbins-Studie unterschätzte die Apple Watch den Tiefschlaf im Schnitt um 43 Minuten, der Fitbit um 15 Minuten. Das ist ein physikalisches Limit, kein Software-Problem, das das nächste Update löst.
Sollte ich der einzelnen Nacht oder dem Trend vertrauen?
Vertrau dem Trend über Wochen, nicht der Einzelnacht. Ob deine App für eine Nacht 18 oder 24 Prozent Tiefschlaf anzeigt, liegt innerhalb des Messfehlers und sagt wenig aus. Aussagekräftig wird es erst, wenn sich ein Muster über viele Nächte zeigt, etwa eine sinkende Gesamtschlafzeit in einer harten Trainingswoche oder ein über mehrere Nächte erhöhter Ruhepuls im Schlaf. Genau hier liegt die Stärke der Wearables: Sie messen jede Nacht zu Hause, das Labor nur einmal.
Kann meine Uhr eine Schlafstörung wie Schlafapnoe erkennen?
Nein, dafür ist sie nicht gemacht und nicht zugelassen. Validierungsstudien laufen meist eine einzige Nacht an gesunden Erwachsenen, und genau die Schwäche der Uhr, ruhiges Wachliegen als Schlaf zu verbuchen und kurze Aufwachmomente zu übersehen, macht sie als Diagnoseinstrument unbrauchbar. Bei einem echten Verdacht auf eine Schlafstörung wie Schlafapnoe gehörst du ins Schlaflabor, nicht zur App. Die Uhr ist ein guter Verhaltensspiegel, aber kein medizinisches Messgerät.
Welche Uhr misst den Schlaf am genauesten?
In den aktuellen PSG-Validierungsstudien schneidet bei der Schlafphasen-Erkennung der Oura Ring tendenziell am besten ab. In der Robbins-Studie erreichte Oura ein Cohen-Kappa von 0,65 in der Vier-Stadien-Einteilung, die Apple Watch 0,60 und der Fitbit 0,55. Wichtiger als die Markenwahl ist aber, dass selbst das beste Gerät die Schlafphasen nur moderat trifft. Statt das genaueste Gerät zu jagen, solltest du die Zahl, der du am meisten trauen darfst, nämlich die Gesamtschlafzeit, konsequent über die Zeit verfolgen.
Dein Tracker liefert mehr Zahlen, als gut für dich sind. Lass uns die belastbaren herausfiltern, deine Schlaf-Trends an deine Trainingslast koppeln und den Tracker zum Frühwarnsystem für Erholung machen, statt zum täglichen Stress.
Quellen und Referenzen
Haghayegh, S., Khoshnevis, S., Smolensky, M. H., Diller, K. R., Castriotta, R. J.
Accuracy of Wristband Fitbit Models in Assessing Sleep: Systematic Review and Meta-Analysis