Wkono

Hvordan beregne uteliggere

En avvikende er et datapunkt som er vesentlig forskjellig fra de andre tallmessig datapunktene i en prøve. Begrepet brukes i statistiske undersøkelser, og kan vise til forandringer i datasettet studert eller feil i målingene tatt. Å vite hvordan man skal beregne uteliggere er viktig for å sikre en riktig forståelse av dataene, og vil føre til mer nøyaktige konklusjoner fra studien. Det er en relativt enkel prosess for beregning utliggere i et gitt sett av observasjoner.

Trinn

Hvordan beregne uteliggere. Lær hvordan å gjenkjenne en potensiell avvikende.
Hvordan beregne uteliggere. Lær hvordan å gjenkjenne en potensiell avvikende.
  1. 1
    Lær hvordan å gjenkjenne en potensiell avvikende. Før beregning hvorvidt et datapunkt representerer en avvikende, er det nyttig å undersøke datasettet og plukke ut potensielle rammer. For eksempel vurdere et datasett som representerer temperaturer på 12 ulike objekter i et rom. Hvis 11 av gjenstandene har temperaturene i løpet av noen få grader 70 grader Fahrenheit (21 grader Celsius), men den tolvte objekt (kanskje en ovn) har en temperatur på 300 grader Fahrenheit (150 grader Celsius), kan en overflatisk undersøkelse fortelle deg at ovnen er en sannsynlig avvikende.
  2. 2
    Ordne datapunktene fra lavest til høyest. Fortsetter med eksempelet ovenfor, bør du vurdere følgende datasett som representerer temperaturer på flere objekter: {71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}. Settet skal sorteres som følger: {69, 69, 70, 70, 70, 70, 71, 71, 71, 72, 73, 300}.
  3. 3
    Beregne medianverdien av datasettet. Midtlinje er det datapunkt ovenfor hvilken halvdel av data sitter og under hvilken halvparten av dataene sitter. Hvis datasettet inneholder et likt antall observasjoner, da de to midterste vilkår bør gjennomsnitt. I eksempelet ovenfor, de midterste to begrepene er 70 og 71, slik at median er ((70 + 71) / 2), eller 70.5.
  4. 4
    Beregn nedre kvartil. Dette punkt, kalt Q1, er det datapunkt nedenfor som 25 prosent av observasjonene sitte. I eksemplet ovenfor vil to betingelser må midles igjen-denne tid, 70 og 70. Deres gjennomsnittlige er ((70 + 70) / 2), eller 70 år.
  5. 5
    Beregn øvre kvartil. Dette punkt, kalt Q3, er det datapunkt ovenfor som 25 prosent av dataene sitter. Fortsetter med eksempelet ovenfor, i snitt de to punktene 71 og 72 gir en Q2 på 71,5.
  6. 6
    Finne de "indre gjerder" for datasettet. Det første trinnet er å multiplisere forskjellen mellom Q1 og Q3 (kalt interkvartile området) med 1,5. I eksemplet ovenfor er det interkvartile området (71,5 til 70), eller 1,5. Multiplisere dette med 1,5 gir 2,25. Legg dette nummeret til Q3 og trekke det fra Q1 å konstruere de indre gjerder. De indre gjerder i dette eksempel vil være 67.75 og 73.75.
    • Eventuelle datapunkter som ligger utenfor dette området regnes som mild uteliggere. I datasettet i dette eksempelet, bare temperaturen i ovnen - 300 grader - regnes som en mild avvikende.
  7. 7
    Finn de "ytre gjerder" for datasettet. Dette gjøres på samme måte som de indre gjerder, bortsett fra det interkvartile området multipliseres med tre i stedet for 1,5. Multiplisere interkvartile området ovenfor med 3 gir (1,5 * 3), eller 4,5. De ytre gjerder er derfor 65,5 og 76.
    • Eventuelle datapunkter som ligger utenfor de ytre gjerder anses ekstreme uteliggere. I dette eksemplet er ovnen temperatur, 300 grader, også anses som en ekstrem outlier.

Tips

  • Når uteliggere blir funnet, forsøke å forklare sin tilstedeværelse før du kasserer dem fra datasettet, de kan vise til målefeil eller misdannelser i fordelingen.

Ting du trenger

  • Kalkulator