het begrip vrijheidsgraden staat centraal in het principe van het schatten van statistieken van populaties aan de hand van steekproeven van populaties. “Graden van vrijheid” wordt vaak afgekort tot df.
zie df als een wiskundige beperking die moet worden ingevoerd bij het schatten van een statistiek uit een schatting van een andere.
laten we een voorbeeld nemen van gegevens die willekeurig zijn getrokken uit een normale distributie. Normale distributies hebben slechts twee parameters (gemiddelde en standaardafwijking) nodig voor hun definitie; bijv., de standaard normale verdeling heeft een gemiddelde van 0 en standaardafwijking (sd) van 1. De populatiewaarden van gemiddelde en sd worden respectievelijk mu en sigma genoemd, en de steekproefschattingen zijn x-bar en s.
om sigma te kunnen schatten, moeten we eerst mu hebben geschat. Mu wordt dus vervangen door x-bar in de formule voor sigma. Met andere woorden, we werken met de afwijkingen van mu geschat door de afwijkingen van x-bar. Op dit punt moeten we de beperking toepassen dat de afwijkingen moeten optellen tot nul., Dus graden van vrijheid zijn n-1 in de vergelijking voor s hieronder aangegeven:
standaardafwijking in een populatie is:
De schatting van de standaarddeviatie van een populatie berekend op basis van een aselecte steekproef is:
Wanneer dit principe van de beperking wordt toegepast op regressie en variantie-analyse, het algemene resultaat is dat je met één graad van vrijheid voor elke parameter geschat voorafgaand aan het inschatten van de (overige) standaard deviatie.,
een andere manier van denken over het beperkingsprincipe achter vrijheidsgraden is om onvoorziene gebeurtenissen voor te stellen. Stel je bijvoorbeeld voor dat je vier getallen hebt (a, b, c en d) die moeten optellen tot een totaal van m; Je bent vrij om willekeurig de eerste drie getallen te kiezen, maar de vierde moet zo gekozen worden dat het totaal gelijk is aan m – dus je vrijheidsgraad is drie.
Geef een reactie