Kategoriske variabelegenskaper og eksempler

2160
Anthony Golden
Kategoriske variabelegenskaper og eksempler

De kategorisk variabel Det er den som brukes i statistikk for å tildele et ikke-numerisk eller kvalitativt kjennetegn eller en eiendom til noe objekt, individ, enhet, tilstand eller prosedyre. Det er mulig å definere alle slags kategoriske variabler etter hvert behov. 

Eksempler på kategoriske variabler er: farge, kjønn, blodgruppe, sivilstand, type materiale, betalingsmåte eller bankkonto, og de brukes mye daglig..

Figur 1: Farge er en kategorisk variabel. Kilde: Pixabay

Ovennevnte er variablene, men deres mulige verdier er kvalitative, det vil si av kvalitet eller karakteristisk og ikke av en numerisk måling. For eksempel mulige verdier for variabelen kjønn De er: hann , hembra.

Når denne variabelen er lagret i et dataprogram, kan den deklareres som en tekstvariabel, og de eneste aksepterte verdiene er de som allerede er navngitt: Mann , Hunn.

Men den samme variabelen kjønn kan deklareres og lagres som et heltall hvis a Mann er tildelt 1 allerede Hunn verdien tildeles to. Det er av denne grunn at kategoriske variabler noen ganger blir referert til som enumerert type.

Hovedkarakteristikken til kategoriske variabler er at i motsetning til andre variabler, som kontinuerlig og diskret, er det ikke mulig å gjøre regning med dem. Du kan imidlertid gjøre statistikk med dem, som du vil se senere.

Artikkelindeks

  • 1 Eksempler
  • 2 Klassifisering av kategoriske variabler
    • 2.1 Nominelle kategorier 
    • 2.2 Ordinære kategorier
    • 2.3 Binære kategorier
  • 3 Statistikk med kategoriske variabler
    • 3.1 Grafisk fremstilling av kategoriske variabler
  • 4 Løst øvelser
    • 4.1 Øvelse 1
    • 4.2 Eksempel 2
    • 4.3 Eksempel 3
  • 5 Referanser

Eksempler

Legg merke til følgende eksempler på kategoriske variabler og deres mulige verdier:

-Blodtype, Verdiområde: A, B, AB, O

-Sivil status, Kategoriske verdier: Enkelt (TIL), Gift (B), Enkemann (C) , Skilt (D).

-Type materiale, Kategorier eller verdier: 1 = Tre, 2 = Metall, 3 = Plast

-Måte å betale, Verdier eller kategorier: (1) Kontanter, (2) Debet, (3) Overføring, (4) Kreditt

I de foregående eksemplene har et nummer blitt assosiert med hver kategori på en helt vilkårlig måte. 

Man kunne da tenke at denne vilkårlige numeriske assosiasjonen gjør det lik a diskret kvantitativ variabel, men det er det ikke, siden aritmetiske operasjoner ikke kan gjøres med disse tallene.

For å illustrere ideen, i variabelen Måte å betale, sumoperasjonen gir ikke mening:

 (1) Kontanter + (2) Debet vil aldri være lik (3) Overføring

Klassifisering av kategoriske variabler

Rangeringen er basert på om de har et implisitt hierarki eller om antallet mulige utfall er mer enn to eller to.

En kategorisk variabel med bare ett mulig utfall er ikke en variabel, den er en kategorisk konstant.

Nominelle kategorier 

Når de ikke kan være representert med et nummer eller ha noen ordre. For eksempel variabelen: Materielltype, thar nominelle verdier (Tre, metall, plast), har de ikke noe hierarki eller rekkefølge, selv når et vilkårlig nummer er tildelt hvert svar eller kategori.

Ordinær kategorisk

Variabel: Akademisk ytelse

Nominelle verdier: Høy, Middels, Lav

Selv om verdiene til denne variabelen ikke er numeriske, har de en implisitt rekkefølge eller et hierarki.

Binære kategorier

Dette er nominelle variabler med to mulige svar, for eksempel:

-Variabel: Svar

-Nominelle verdier: ekte, Forfalskning

Merk at variabelen Svar det har ikke et implisitt hierarki og har bare to mulige utfall, så det er en binær kategorisk variabel.

Noen forfattere kaller denne typen binær variabel, og anser det ikke å tilhøre kategoriske variabler som er begrenset til de med mer enn tre mulige kategorier.

Statistikk med kategoriske variabler

Statistikk kan gjøres med kategoriske variabler, til tross for at de ikke er numeriske eller kvantitative variabler. For å vite trenden eller mest sannsynlige verdien av en kategorisk variabel, ta Mote.

Mote det er i dette tilfellet det mest gjentatte resultatet eller verdien av en kategorisk variabel. I kategoriske variabler er det ikke mulig å beregne verken gjennomsnitt eller median.

Gjennomsnittet kan ikke beregnes fordi aritmetikk ikke kan gjøres med kategoriske variabler. Heller ikke medianen, fordi de kvantitative eller kategoriske variablene ikke har en orden eller hierarki, så det er ikke mulig å bestemme en sentral verdi..

Grafisk fremstilling av kategoriske variabler

Gitt en viss kategorisk variabel, kan frekvensen eller antall ganger som et resultat av den variabelen gjentas bli funnet. Hvis dette gjøres for hvert utfall, kan det lages en graf over frekvensen mot hver kategori eller utfall..

Her er noen eksempler på hvordan kategoriske variabler kan presenteres grafisk.

Løst øvelser

Øvelse 1

Et selskap har register over dataene til 170 ansatte. En av variablene som er i disse registrene er: Sivil status. Denne variabelen har fire kategorier eller mulige verdier:

Enkelt (TIL), Gift (B), Enkemann (C) , Skilt (D).

Selv om det er en ikke-numerisk variabel, er det mulig å vite hvor mange av de totale postene som er i en bestemt kategori og være representert i form av et søylediagram, som vist i følgende figur:

Figur 2. Representasjon av resultatene av en kategorisk variabel. Kilde: selvlaget

Eksempel 2

En skobutikk holder rede på salget. Blant variablene som administrerer postene, er skofargen for hver modell. Variabelen: 

Color_Shoe_Model_AW3

Den er kategorisk og har fem mulige kategorier eller verdier. For hver kategori av denne variabelen summeres antall salg og prosentandelen av dem fastsettes. Resultatene er presentert i grafen til følgende figur:

Figur 3. Kategorisk variabel Farge _Sko. I denne variabelen er modusen hvit. Kilde: selvlaget.

Det kan da sies at AW3-skomodellen som er i mote, den som selges hyppigst er Hvit, tett fulgt av Svart

Det kan også sies at med 70% sannsynlighet vil den neste skoen som selges av denne modellen være Hvit eller Svart.

Denne informasjonen kan være nyttig for butikken når du legger inn nye bestillinger, eller den kan til og med bruke rabatter på de minst solgte farger på grunn av overflødig varelager..

Eksempel 3

For en bestemt populasjon av blodgivere, vil du representere antall personer som tilhører en bestemt blodgruppe. En grafisk måte å visualisere resultatene på er ved hjelp av et piktogram, som er i bakgrunnen en tabell.

Den første kolonnen representerer variabelen Blodtype og mulige resultater eller kategorier. Den andre kolonnen har representasjon i ikonisk eller billedlig form av antall personer i hver kategori. I vårt eksempel brukes en rød dråpe som et ikon, som hver representerer 10 personer.

Figur 4. Piktogram. Kilde: selvlaget

Referanser

  1. Khan Academy. Analyse av kategoriske data. Gjenopprettet fra: khanacademy.org
  2. Universformler. Kvalitativ variabel. Gjenopprettet fra: univesoformulas.com
  3. Minitab. Som er kategoriske, diskrete og kontinuerlige variabler. Gjenopprettet fra: support.minitab.com
  4. Excel-veiledning. Karakterisering av variabler. Gjenopprettet fra: help.xlslat.com.
  5. Wikipedia. Statistisk variabel. Gjenopprettet fra wikipedia.com
  6. Wikipedia. Kategorisk variabel. Gjenopprettet fra wikipedia.com
  7. Wikipedia. Kategorisk variabel. Gjenopprettet fra wikipedia.com

Ingen har kommentert denne artikkelen ennå.