Ugrupperte dataeksempler og øvelser løst

4967
Charles McCarthy

De ikke-grupperte data er de som, hentet fra en studie, ennå ikke er organisert av klasser. Når det er et håndterbart antall data, vanligvis 20 eller mindre, og det er få forskjellige data, kan det behandles som ikke-gruppert og verdifull informasjon hentet fra den.

De ikke-grupperte dataene kommer som det er fra undersøkelsen eller studien som ble utført for å skaffe dem og mangler derfor behandling. La oss se på noen eksempler:

Figur 1. De ikke-grupperte dataene kommer direkte fra noen studier og har ikke blitt klassifisert. Kilde: Pxhere.

-Resultater av en IQ-test på 20 tilfeldige studenter fra et universitet. Dataene som ble innhentet var følgende:

119, 109, 124, 119, 106, 112, 112, 112, 112, 109, 112, 124, 109, 109, 109, 106, 124, 112, 112.106

-Aldere på 20 ansatte i en bestemt populær kaffebar:

24, 20, 22, 19, 18, 27, 25, 19, 27, 18, 21, 22, 23, 21, 19, 22, 27, 29, 23, 20

-Det endelige karaktergjennomsnittet på 10 studenter i en matematikktime:

3,2; 3.1; 2,4; 4,0; 3,5; 3,0; 3,5; 3,8; 4,2; 4.9

Artikkelindeks

  • 1 Dataegenskaper
  • 2 Beregning av gjennomsnitt, median og modus
  • 3 Område, avvik, standardavvik og skjevhet
    • 3.1 Avvik og standardavvik
  • 4 Øvelse løst
    • 4.1 Løsning
  • 5 Referanser

Dataegenskaper

Det er tre viktige egenskaper som kjennetegner et sett med statistiske data, enten de er gruppert eller ikke, som er:

-Posisjon, som er datatendensen til å gruppere seg rundt visse verdier.

-Spredning, en indikasjon på hvor spredt eller spredt dataene er rundt en gitt verdi.

-Form, Det refererer til måten dataene distribueres på, noe som verdsettes når en graf av den samme er konstruert. Det er veldig symmetriske kurver og også skjevt, enten til venstre eller til høyre for en viss sentral verdi.

For hver av disse egenskapene er det en rekke tiltak som beskriver dem. Når de er oppnådd, gir de oss en oversikt over oppførselen til dataene:

-De mest brukte posisjonsmålene er det aritmetiske gjennomsnittet eller ganske enkelt gjennomsnittet, medianen og modusen.

-Rekkevidde, varians og standardavvik brukes ofte i spredning, men de er ikke de eneste målingene for spredning..

-Og for å bestemme formen, sammenlignes middelverdien og medianen gjennom skjevhet, som du vil se snart.

Beregning av gjennomsnitt, median og modus

-Det aritmetiske gjennomsnittet, også kjent som gjennomsnitt og betegnet som X, beregnes det som følger:

X = (x1 + xto + x3 +... Xn) / n

Hvor x1, xto,…. xn, er dataene og n er summen av dem. I summeringsnotasjon har vi:

-Median er verdien som vises midt i en ordnet datasekvens, så for å få den, er det nødvendig å bestille dataene først og fremst.

Hvis antall observasjoner er odde, er det ikke noe problem å finne midtpunktet til settet, men hvis vi har et jevnt antall data, blir de to sentrale dataene søkt og gjennomsnittet.

-Mote er den vanligste verdien som observeres i datasettet. Det eksisterer ikke alltid, siden det er mulig at ingen verdi gjentas oftere enn en annen. Det kan også være to data med samme frekvens, i så fall snakker vi om en bi-modal fordeling.

I motsetning til de to foregående målene, kan modusen brukes med kvalitative data.

La oss se hvordan disse posisjonsmålene beregnes med et eksempel:

Arbeidet eksempel

Anta at vi vil bestemme det aritmetiske gjennomsnittet, medianen og modusen i eksemplet som ble foreslått i begynnelsen: alderen 20 ansatte i en kafeteria:

24, 20, 22, 19, 18, 27, 25, 19, 27, 18, 21, 22, 23, 21, 19, 22, 27, 29, 23, 20

De halv det beregnes ganske enkelt ved å legge til alle verdiene og dele med n = 20, som er totalt antall data. På denne måten:

X = (24 + 20 + 22 + 19 + 18 + 27+ 25 + 19 + 27 + 18 + 21 + 22 + 23 + 21+ 19 + 22 + 27+ 29 + 23+ 20) / 20 =

= 22,3 år.

For å finne median du må sortere datasettet først:

18, 18, 19, 19, 19, 20, 20, 21, 21, 22, 22, 22, 23, 23, 24, 25, 27, 27, 27, 29

Siden det er et jevnt antall data, blir de to sentrale dataene, uthevet med fet skrift, tatt og beregnet i gjennomsnitt. Fordi de begge er 22, er medianen 22 år.

Til slutt, mote Det er dataene som gjentas mest eller den som har større frekvens, dette er 22 år.

Område, avvik, standardavvik og skjevhet

Rekkevidden er rett og slett forskjellen mellom den største og minste av dataene, og lar deg raskt sette pris på variasjonen i dataene. Men bortsett fra det er andre målinger av spredning som gir mer informasjon om distribusjonen av dataene..

Avvik og standardavvik

Variansen er betegnet som s og beregnes ved uttrykket:

Så for å tolke resultatene riktig er standardavviket definert som kvadratroten til variansen, eller også kvasistandardavviket, som er kvadratroten til kvasivariansen:

Det er sammenligningen mellom gjennomsnittlig X og median Med:

-Hvis Med = betyr X: dataene er symmetriske.

-Når X> Med: skjev til høyre.

-Og hvis X < Med: los datos sesgan hacia la izquierda.

Treningen løst

Finn gjennomsnitt, median, modus, rekkevidde, varians, standardavvik og skjevhet for resultatene av en IQ-test utført på 20 studenter fra et universitet:

119, 109, 124, 119, 106, 112, 112, 112, 112, 109, 112, 124, 109, 109, 109, 106, 124, 112, 112, 106

Løsning

Vi vil bestille dataene, siden det vil være nødvendig å finne medianen.

106, 106, 106, 109, 109, 109, 109, 109, 112, 112, 112, 112, 112, 112, 112, 119, 119, 124, 124, 124

Og vi vil sette dem i en tabell som følger, for å lette beregningene. Den andre kolonnen med tittelen "Akkumulert" er summen av tilsvarende data pluss den forrige..

Denne kolonnen hjelper deg med å enkelt finne gjennomsnittet, og deler den siste akkumulerte med det totale antall data, sett på slutten av kolonnen "Akkumulert":

X = 112,9

Medianen er gjennomsnittet av de sentrale dataene som er uthevet i rødt: tallet 10 og tallet 11. Siden de er de samme, er medianen 112.

Til slutt er modusen den verdien som gjentas mest og er 112, med 7 repetisjoner..

Når det gjelder målene for spredning, er rekkevidden:

124-106 = 18.

Avviket oppnås ved å dele det endelige resultatet i høyre kolonne med n:

s = 668,6 / 20 = 33,42

I dette tilfellet er standardavviket kvadratroten til variansen: √33.42 = 5.8.

På den annen side er verdiene til kvasi-variansen og kvasi-standardavviket:

sc= 668,6 / 19 = 35,2

Kva-standardavvik = √35.2 = 5.9

Til slutt er skjevheten litt til høyre, siden gjennomsnittet 112,9 er større enn medianen 112.

Referanser

  1. Berenson, M. 1985. Statistikk for ledelse og økonomi. Interamericana S.A.
  2. Canavos, G. 1988. Sannsynlighet og statistikk: Applikasjoner og metoder. Mcgraw hill.
  3. Devore, J. 2012. Sannsynlighet og statistikk for ingeniørvitenskap og vitenskap. 8. plass. Utgave. Cengage.
  4. Levin, R. 1988. Statistikk for administratorer. 2. plass. Utgave. Prentice hall.
  5. Walpole, R. 2007. Sannsynlighet og statistikk for ingeniørfag og vitenskap. Pearson.

Ingen har kommentert denne artikkelen ennå.