Das Wichtigste in Kürze

  • Deine Uhr misst keinen Schlaf, sie schätzt ihn. Aus Bewegung (Aktigraphie), Herzfrequenz und HRV, oft plus Temperatur. Die Gehirnströme, die das Schlaflabor per Polysomnographie liest, sieht sie nie.
  • Die robusteste Zahl ist die Gesamtschlafzeit. Schlaf gegen Wach trifft die Uhr mit über 90 Prozent Sensitivität, die Schlafdauer liegt oft nur Minuten daneben.
  • Die schwächste Zahl sind die Schlafphasen. Bei der Vier-Stadien-Einteilung erreichen gute Geräte nur ein Cohen-Kappa von rund 0,55 bis 0,65. Tiefschlaf und REM werden um 15 bis 45 Minuten daneben geschätzt.
  • Wach liegen erkennt die Uhr am schlechtesten. Sie hält ruhiges Wachliegen oft für Schlaf (Spezifität teils unter 50 Prozent) und schmeichelt damit deinem Schlafscore.
  • Lies Trends über Wochen, nicht die Einzelnacht. Eine sinkende Schlafzeit ist verlässlicher als die Tiefschlaf-Prozente einer einzelnen Nacht.

Wie genau trackt die Uhr deinen Schlaf wirklich?

Deine Uhr misst keinen Schlaf, sie schätzt ihn aus Bewegung, Herzfrequenz und HRV. Gesamtschlafzeit und Schlaf gegen Wach trifft sie gut, mit über 90 Prozent Sensitivität. Die einzelnen Schlafphasen REM und Tiefschlaf aber nur moderat. Vertrau den Trends über Wochen, nicht den Phasen-Prozenten einer Nacht.

Du wachst auf, greifst zum Handy, und die App sagt dir: 6 Stunden 42 Minuten Schlaf, davon 54 Minuten Tiefschlaf, 1 Stunde 18 REM, Schlafscore 81. Das sieht aus wie eine Messung aus dem Labor. Ist es aber nicht. Deine Uhr hat in der Nacht keine einzige Gehirnwelle gesehen. Sie hat geschätzt, und manche dieser Schätzungen sind richtig gut, andere kaum besser als ein gebildeter Tipp. Dieser Artikel trennt beides: Was du den Schlafdaten deiner Uhr glauben darfst und was nicht. Grundlage sind Validierungsstudien, die Wearables Nacht für Nacht direkt gegen die Polysomnographie im Schlaflabor gestellt haben, also gegen den Goldstandard der Schlafmedizin.

Wie eine Uhr überhaupt Schlaf misst

Das Schlaflabor misst Schlaf direkt. Per Polysomnographie (PSG) zeichnet es Gehirnströme (EEG), Augenbewegungen und Muskelspannung auf. Daraus lesen geschulte Auswerter in 30-Sekunden-Abschnitten die Schlafstadien ab: Wach, Leichtschlaf, Tiefschlaf und REM. Das ist die Referenz, an der alles gemessen wird.

Deine Uhr hat nichts davon. Sie sitzt am Handgelenk oder als Ring am Finger und kommt ans Gehirn nicht heran. Stattdessen kombiniert sie indirekte Signale:

  • Aktigraphie (Bewegung): Ein winziger Beschleunigungssensor zählt, wie viel du dich bewegst. Die Grundannahme ist Jahrzehnte alt und simpel. Wer still liegt, schläft wahrscheinlich, wer sich bewegt, ist wahrscheinlich wach. Das ist die Basis fast jedes Schlaftrackers.
  • Herzfrequenz und HRV: Per optischem Sensor (Photoplethysmographie) misst die Uhr den Puls am Handgelenk und daraus die Herzratenvariabilität. Das vegetative Nervensystem arbeitet in jedem Schlafstadium anders: Im Tiefschlaf sinken Puls und Atmung am stärksten ab, im REM wird das Muster unruhiger und ähnelt fast dem Wachzustand.
  • Temperatur und Atmung: Bessere Geräte ergänzen Hauttemperatur, Atemfrequenz und Sauerstoffsättigung, um die Phasen-Schätzung zu schärfen.
Handgelenk auf einer weißen Bettdecke am frühen Morgen, an der Unterseite einer Fitnessuhr leuchtet der grüne optische Herzfrequenzsensor gegen die Haut
Das grüne Licht an der Unterseite der Uhr ist der optische Pulssensor. Aus diesem indirekten Signal plus Bewegung schätzt der Algorithmus deine Schlafphasen, das Gehirn selbst sieht er nicht.

Aus diesen Rohdaten macht ein Algorithmus, heute meist ein neuronales Netz, eine Schlafkurve. Walch und Kollegen (2019) haben genau das offengelegt: Aus reiner Beschleunigung plus PPG-Herzfrequenz einer Consumer-Uhr lassen sich Schlaf und Wach mit rund 90 Prozent Genauigkeit trennen, die Drei-Klassen-Einteilung Wach-NREM-REM aber nur noch mit etwa 72 Prozent (Cohen-Kappa 0,28). Der Punkt ist: Die Uhr rekonstruiert deinen Schlaf aus Stellvertreter-Signalen. Sie misst ihn nicht.

Was die Uhr gut kann: Gesamtschlafzeit und Schlaf gegen Wach

Die gute Nachricht zuerst. Die Frage "Habe ich geschlafen oder nicht?" beantworten moderne Tracker erstaunlich zuverlässig. In der Validierungsstudie von Robbins und Kollegen (2024) gegen das Schlaflabor erreichten Oura Ring, Fitbit und Apple Watch bei der Schlaf-gegen-Wach-Erkennung Sensitivitäten von 95 bis 97 Prozent. Sie erkennen also fast jeden Schlaf-Abschnitt als Schlaf. In der Sechs-Geräte-Studie von Schyvens und Kollegen (2025) lag diese Sensitivität über alle Geräte bei 92 bis 96 Prozent.

Auch die Gesamtschlafzeit ist meist nah dran. Im systematischen Review von Schyvens und Kollegen (2024) wich die Schlafdauer je nach Gerät nur wenige Minuten vom Labor ab. Beim WHOOP waren es 1,4 Minuten, beim Fitbit Charge 4 rund 6 Minuten. Ein Ausreißer war die Garmin Vivosmart 4 mit fast 47 Minuten zu viel. Die Tendenz über viele Geräte: Schlaftracker neigen dazu, die Schlafzeit eher zu überschätzen, weil sie ruhiges Wachliegen als Schlaf verbuchen. Die Fitbit-Meta-Analyse von Haghayegh und Kollegen (2019) zeigt denselben Bias, dort wurde die Gesamtschlafzeit um rund 7 bis 67 Minuten überschätzt.

Das ist die Kennzahl, der du am meisten trauen darfst: wie lange du grob geschlafen hast. Für dich als Ausdauersportler ist das die wichtigste Information überhaupt, denn chronischer Schlafmangel ist der direkteste Bremsklotz für Regeneration und Anpassung.

Wo es schwierig wird: Schlafphasen, REM und Tiefschlaf

Jetzt die ehrliche Nachricht. Sobald die Uhr nicht mehr nur Schlaf von Wach trennen, sondern die einzelnen Schlafphasen auseinanderhalten soll, fällt die Genauigkeit deutlich ab. Bei der Vier-Stadien-Einteilung erreichten in der Robbins-Studie die besten Geräte nur eine moderate bis substanzielle Übereinstimmung mit dem Labor: Oura ein Cohen-Kappa von 0,65, Apple Watch 0,60, Fitbit 0,55. Ein Kappa von 1,0 wäre perfekte Übereinstimmung, ein Kappa um 0 reiner Zufall. 0,55 bis 0,65 heißt: deutlich besser als geraten, aber weit von einer Messung entfernt.

Sensitivität pro Schlafstadium: Schlaf gegen Wach trifft die Uhr, die Phasen wackeln

Schlaf gegen Wach 95–97 % Einzelne Schlafphasen (Sensitivität je Gerät) Leichtschlaf Oura 78 Fitbit 78 Apple 86 REM Oura 76 Fitbit 67 Apple 83 Tiefschlaf Oura 80 Fitbit 62 Apple 50 50 60 70 80 90 Sensitivität gegen Polysomnographie (%) · höher = trifft das Stadium besser
Türkis = gute Trefferquote, Orange = schwacher Wert. Schlaf gegen Wach trifft jede Uhr, aber Tiefschlaf (Apple 50, Fitbit 62 Prozent) und REM (Fitbit 67 Prozent) sind die wackeligen Werte. Quelle: Robbins et al. 2024 (PSG-Validierung, 35 Erwachsene).

Bei der Sensitivität pro Phase zeigt sich das Muster klar. Tiefschlaf und REM treffen die Geräte am unzuverlässigsten:

  • Tiefschlaf: Oura erkannte ihn mit 79,5 Prozent Sensitivität noch ordentlich, der Fitbit kam auf 61,7 Prozent, die Apple Watch nur auf 50,5 Prozent. In Minuten: Der Fitbit unterschätzte den Tiefschlaf im Schnitt um 15 Minuten, die Apple Watch um satte 43 Minuten.
  • REM: Apple Watch (82,6 Prozent) und Oura (76,0 Prozent) lagen hier gut, der Fitbit fiel auf 67,3 Prozent ab.
  • Leichtschlaf: Wird von fast allen Geräten überschätzt, oft um 18 bis 45 Minuten, weil das, was nicht sauber als Tiefschlaf oder REM erkannt wird, im Leichtschlaf landet.

Der eigentliche Schwachpunkt ist aber das Wachliegen. Die Spezifität, also wie gut die Uhr echte Wach-Phasen als wach erkennt, ist niedrig. In der Sechs-Geräte-Studie lag sie nur zwischen 29 und 52 Prozent. Anders gesagt: Wenn du nachts ruhig wach im Bett liegst, ohne dich groß zu bewegen, verbucht die Uhr das mit hoher Wahrscheinlichkeit als Schlaf. Das ist die alte Achillesferse der Aktigraphie: Stillliegen ist nicht gleich Schlafen. Genau diese Schwäche schmeichelt deinem Schlafscore.

Warum gerade die Phasen so schwer sind

Der Grund ist physikalisch, nicht eine Frage des nächsten Software-Updates. Tiefschlaf und REM unterscheiden sich im Gehirn massiv, am Handgelenk aber kaum. Das EEG sieht im Tiefschlaf langsame Delta-Wellen und im REM ein fast waches Muster mit Augenbewegungen. Deine Uhr sieht nur: wenig Bewegung, niedriger Puls. Und niedriger Puls plus Stillliegen sieht im Tiefschlaf und in ruhigen Leichtschlaf-Phasen ähnlich aus. Auch kurze Aufwach-Momente, die das EEG sekundengenau erfasst, gehen am Handgelenk meist unter.

Der Goldstandard ist deshalb der Goldstandard, weil er direkt am Organ misst, das schläft. Eine Uhr am Handgelenk hat diese Information schlicht nicht. Sie rechnet eine plausible Verteilung aus Statistik und Trainingsdaten zusammen. Deshalb können zwei Marken für dieselbe Nacht völlig unterschiedliche Tiefschlaf-Werte ausgeben, beide überzeugend präsentiert. In der Multizenter-Studie von Lee und Kollegen (2023) über elf Tracker reichte die Vier-Stadien-Genauigkeit denn auch von schwach bis ordentlich, je nach Gerät und Bauart.

Wichtig zur Einordnung: Diese Validierungsstudien laufen meist eine einzige Nacht im Labor an gesunden Erwachsenen. Bei Schlafstörungen, unregelmäßigem Schlaf oder im höheren Alter wird die Genauigkeit eher schlechter, nicht besser. Verallgemeinere die guten Laborwerte also nicht blind auf jede deiner Nächte.

Was du den Daten glauben darfst und wie du sie nutzt

Daraus folgt eine klare Hierarchie, was du ernst nehmen solltest:

  1. Vertrau der Gesamtschlafzeit und dem Trend. Wie lange du schläfst und ob das über Wochen steigt oder fällt, ist die belastbarste Information. Eine Trainingswoche mit drei Nächten unter sechs Stunden ist ein echtes Warnsignal, egal was der Schlafscore sagt.
  2. Nimm Ruhepuls und HRV im Schlaf ernst. Diese Rohwerte misst die Uhr direkter als die Phasen. Ein über mehrere Nächte erhöhter nächtlicher Puls oder eine eingebrochene HRV ist ein gutes Früh-Signal für beginnenden Infekt, Alkohol, spätes Essen oder Überlastung.
  3. Behandle Phasen-Prozente als groben Hinweis, nicht als Messwert. Ob deine App 18 oder 24 Prozent Tiefschlaf anzeigt, ist innerhalb des Messfehlers und sagt für eine einzelne Nacht wenig. Erst ein konsistentes Muster über viele Nächte trägt eine Aussage.
  4. Lies immer den Trend, nie die Einzelnacht. Genau hier liegt die Stärke der Wearables: Sie messen jede Nacht zu Hause, das Labor nur einmal. Diese Längsschnitt-Sicht ist mehr wert als die Phasen-Genauigkeit einer Nacht.
  5. Lass dich nicht vom Score stressen. Es gibt das Phänomen der Orthosomnie, bei dem die Jagd nach perfekten Schlafdaten den Schlaf selbst verschlechtert. Wenn ein schlechter Score dich morgens runterzieht, obwohl du dich ausgeruht fühlst, glaub deinem Körpergefühl.
Mann am Küchentisch am Morgen, der auf seinem Handy einen Wochen-Trend seiner Schlafdaten als Balken anschaut, daneben Kaffeetasse und Sportuhr
So nutzt du die Uhr richtig: nicht die eine Nacht starren, sondern den Trend über Wochen lesen. Die Längsschnitt-Sicht jede Nacht zu Hause ist die eigentliche Stärke gegenüber der einmaligen Labornacht.

Praktisch heißt das: Nutze die Uhr als Verhaltens-Spiegel. Sie ist ein gutes Werkzeug, um Muster zu erkennen (gehst du früher ins Bett, schläfst du länger), aber ein schlechtes Diagnose-Instrument. Wer einen echten Verdacht auf eine Schlafstörung wie Schlafapnoe hat, gehört ins Schlaflabor, nicht zur App. Wer einfach besser regenerieren will, ist mit dem Trend der Gesamtschlafzeit bestens bedient. Wie du diesen Schlaf dann tatsächlich verbesserst, steht in unserem Leitfaden zur Schlafoptimierung für Ausdauersportler. Und wer verstehen will, wie die ganze Datenkette von Rohsignal bis Score zustande kommt, findet das bei Wearables und KI-Datenanalyse. Dieselbe Logik wie bei der Pulsmessung am Handgelenk gilt auch hier: Jede Auswertung ist nur so gut wie das Rohsignal darunter.