Wir können uns auch die Muster fehlender Werte ansehen. Wir können jede Variable in eine Dummy-Variable umcodieren, sodass 1 fehlt und 0 nicht fehlt. Dann verwenden wir den Befehl aggregat, um die Häufigkeit für jedes Muster fehlender Daten zu berechnen. Eine fortgeschrittenere statistische Analyse zielt darauf ab, Muster in Daten zu identifizieren, z. B. ob es einen Zusammenhang zwischen zwei Variablen gibt oder ob bestimmte Gruppen eher bestimmte Attribute aufweisen. Wenn nun die Fragen 1, 2 und 3 alle den numerischen IQ messen, dann sollten die Pearson-Korrelationen zwischen diesen Elementen erheblich sein: Befragte mit hohem numerischen IQ werden in der Regel bei allen 3 Fragen und umgekehrt punkten. Die gleiche Argumentation gilt für die Fragen 4, 5 und 6: Wenn sie wirklich ”das gleiche” messen, werden sie wahrscheinlich sehr korrelieren. Die Fragen 1 und 4 – die möglicherweise nicht miteinander zusammenhängende Merkmale messen – werden jedoch nicht notwendigerweise korrelieren.
Wenn also mein Faktormodell richtig ist, könnte ich erwarten, dass die Korrelationen einem Muster folgen, wie unten gezeigt. Wenn Sie die ”Slopes” des Musters einer Daten zeile erhalten möchten, wie ich annehme, müssen Sie einige lineare Modelle basierend auf Ihren Daten einrichten. Ich bin sicher, Spss kann den Trick auch, aber in R suchen Sie nach lm und glm Funktionen. Siehe das Handbuch des lm für lineare Modelle. Nun, wie verwende ich SPSS, um die Elemente einer Verteilung zu finden, die zusammen ein Muster (jede Art von Muster) in ihrer Neigung bilden? Und wie kann ich es auch Elemente enthalten, die fast diesem Muster folgen, aber leichte Variationen haben (eine Variation, die ich einstellen kann)? Diese sind alle Teil desselben Datensatzes (so kann ein x hier mehrere Werte haben, z.B. entspricht zeit = 1 dem Wert = 2,1,40,12). Ich habe sie getrennt, weil die ersten 3 ein offensichtliches Muster innerhalb ihrer Neigung haben (2, 3 und 0,5) und die letzte hat kein Muster in ihrer Neigung. Die Zeit ist in Tagen, und die Werte stellen eine Menge dar. Wenn jemand irgendwelche Bücher zu diesem Bereich der Mustererkennung in R empfehlen könnte, wäre das großartig. 1. Anzahl der fehlenden Werte vs. Anzahl der nicht fehlenden Werte Awesome…
sehr einfache Erklärung… war nie zu wissen, dass die Faktoranalyse so einfach ist.