{"title":"Diagnostische Güte des FAHW-12 – Exemplarische\n Darstellung einer Diagnosestudie","authors":"G. Wydra","doi":"10.1055/a-1820-0315","DOIUrl":null,"url":null,"abstract":"Bei der Darstellung von Testverfahren für den Gesundheitssport und die\n Sporttherapie erfolgt weitestgehend eine Orientierung an den Haupt- und\n Nebengütekriterien: Objektivität, Reliabilität und\n Validität bzw. Normierbarkeit und Ökonomie. In der Medizin und\n auch in der Physiotherapie werden darüber hinaus auch Maßzahlen\n der diagnostischen Güte genannt. Es geht um die Frage, wie gut ein\n Testverfahren Personen mit bzw. ohne Auffälligkeiten oder\n Schwierigkeiten unterscheiden kann. Dies zu klären, ist die Aufgabe von\n Diagnosestudien. In der einschlägigen eher sozialwissenschaftlich\n orientierten Testliteratur werden Maße der diagnostischen Güte\n im Gegensatz zum medizinisch-therapeutischen Milieu kaum thematisiert.Am Beispiel des FAHW-12, eines Screening-Tests zur Beurteilung des Wohlbefindens,\n wird aufgezeigt, welche Maße der diagnostischen Güte von\n Bedeutung sind und wie sie bestimmt werden können.Am häufigsten werden die Sensitivität und Spezifität\n genannt. Diese Werte werden über sog. Vierfeldertafeln berechnet. Beide\n Werte bedingen sich gegenseitig negativ. Eine Erhöhung der\n Sensitivität geht immer zu Lasten der Spezifität und umgekehrt.\n Bei einer maximalen Sensitivität eines Tests werden fast alle Patienten\n als krank klassifiziert. Dann werden aber auch sehr viele Gesunden als krank\n eingestuft. Die Diagnose hat also eine sehr geringe Spezifität. Wird\n hingegen umgekehrt fast niemand als krank eingestuft, dann werden aber auch sehr\n viele Kranke als gesund eingestuft. Die Diagnose hat also eine sehr geringe\n Sensitivität. Diese gegenseitige Abhängigkeit von\n Sensitivität und Spezifität wird vor allem bei einer grafischen\n Darstellung deutlich.Da bei der Beurteilung von Sensitivität und Spezifität jeweils\n nur Auffällige oder Unauffällige in den Blick genommen werden,\n werden auch andere komplexere Gütemaße, wie z. B. der\n RATZ-Index, beleuchtet.Eine weitere wichtige Aufgabe von Diagnosestudien besteht darin, den sog.\n Trennpunkt zu bestimmen. Das ist der Testwert, der optimal Personen mit von\n solchen ohne Störung bzw. Krankheit differenziert. Eine\n Möglichkeit hierfür stellt der Youden-Index dar. Des Weiteren\n kann die ROC-Kurve zur Beantwortung dieser Frage herangezogen werden.Spezielle Probleme ergeben sich, wenn die Referenzwerte, der sog. Goldstandard,\n nicht in dichotomer Form, sondern als Ordinal- oder Intervallskalen vorliegen.\n Dann müssen die Personen anhand definierter Cut-Off-Werte als\n auffällig bzw. unauffällig klassifiziert werden.","PeriodicalId":42423,"journal":{"name":"Bewegungstherapie und Gesundheitssport","volume":"72 1","pages":""},"PeriodicalIF":0.5000,"publicationDate":"2022-06-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Bewegungstherapie und Gesundheitssport","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.1055/a-1820-0315","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q4","JCRName":"SPORT SCIENCES","Score":null,"Total":0}
引用次数: 0
Abstract
Bei der Darstellung von Testverfahren für den Gesundheitssport und die
Sporttherapie erfolgt weitestgehend eine Orientierung an den Haupt- und
Nebengütekriterien: Objektivität, Reliabilität und
Validität bzw. Normierbarkeit und Ökonomie. In der Medizin und
auch in der Physiotherapie werden darüber hinaus auch Maßzahlen
der diagnostischen Güte genannt. Es geht um die Frage, wie gut ein
Testverfahren Personen mit bzw. ohne Auffälligkeiten oder
Schwierigkeiten unterscheiden kann. Dies zu klären, ist die Aufgabe von
Diagnosestudien. In der einschlägigen eher sozialwissenschaftlich
orientierten Testliteratur werden Maße der diagnostischen Güte
im Gegensatz zum medizinisch-therapeutischen Milieu kaum thematisiert.Am Beispiel des FAHW-12, eines Screening-Tests zur Beurteilung des Wohlbefindens,
wird aufgezeigt, welche Maße der diagnostischen Güte von
Bedeutung sind und wie sie bestimmt werden können.Am häufigsten werden die Sensitivität und Spezifität
genannt. Diese Werte werden über sog. Vierfeldertafeln berechnet. Beide
Werte bedingen sich gegenseitig negativ. Eine Erhöhung der
Sensitivität geht immer zu Lasten der Spezifität und umgekehrt.
Bei einer maximalen Sensitivität eines Tests werden fast alle Patienten
als krank klassifiziert. Dann werden aber auch sehr viele Gesunden als krank
eingestuft. Die Diagnose hat also eine sehr geringe Spezifität. Wird
hingegen umgekehrt fast niemand als krank eingestuft, dann werden aber auch sehr
viele Kranke als gesund eingestuft. Die Diagnose hat also eine sehr geringe
Sensitivität. Diese gegenseitige Abhängigkeit von
Sensitivität und Spezifität wird vor allem bei einer grafischen
Darstellung deutlich.Da bei der Beurteilung von Sensitivität und Spezifität jeweils
nur Auffällige oder Unauffällige in den Blick genommen werden,
werden auch andere komplexere Gütemaße, wie z. B. der
RATZ-Index, beleuchtet.Eine weitere wichtige Aufgabe von Diagnosestudien besteht darin, den sog.
Trennpunkt zu bestimmen. Das ist der Testwert, der optimal Personen mit von
solchen ohne Störung bzw. Krankheit differenziert. Eine
Möglichkeit hierfür stellt der Youden-Index dar. Des Weiteren
kann die ROC-Kurve zur Beantwortung dieser Frage herangezogen werden.Spezielle Probleme ergeben sich, wenn die Referenzwerte, der sog. Goldstandard,
nicht in dichotomer Form, sondern als Ordinal- oder Intervallskalen vorliegen.
Dann müssen die Personen anhand definierter Cut-Off-Werte als
auffällig bzw. unauffällig klassifiziert werden.