Bestemmelseskoeffisientformler, beregning, tolkning, eksempler

904
Simon Doyle
Bestemmelseskoeffisientformler, beregning, tolkning, eksempler

De bestemmelseskoeffisient er et tall mellom 0 og 1 som representerer brøkdelen av poeng (X, Y) som følger regresjonslinjens passform for et datasett med to variabler.

Det er også kjent som godhet av passform og er betegnet med Rto. For å beregne det tas kvotienten mellom variansen til dataene estimatedi estimert av regresjonsmodellen og variansen til dataene Yi som tilsvarer hver Xi av dataene.

Rto = Sŷ / Sy

Figur 1. Korrelasjonskoeffisient for fire datapar. Kilde: F. Zapata.

Hvis 100% av dataene er på linjen til regresjonsfunksjonen, vil bestemmelseskoeffisienten være 1.

Tvert imot, hvis koeffisienten R for et datasett og en viss justeringsfunksjonto viser seg å være lik 0,5, så kan det sies at passformen er 50% tilfredsstillende eller god. 

Tilsvarende når regresjonsmodellen returnerer verdier på Rto lavere enn 0,5, indikerer dette at den valgte justeringsfunksjonen ikke tilpasser seg tilfredsstillende til dataene, derfor er det nødvendig å se etter en annen justeringsfunksjon.

Og når kovarians eller korrelasjonskoeffisient har en tendens til null, da er variablene X og Y i dataene ikke relatert, og derfor er Rto vil også ha en tendens til null.

Artikkelindeks

  • 1 Hvordan beregne bestemmelseskoeffisienten?
    • 1.1 Illustrasjonsstil
  • 2 Tolkning
  • 3 eksempler
    • 3.1 - Eksempel 1
    • 3.2 - Eksempel 2
    • 3.3 - Eksempel 3
    • 3.4 Tilpasningssammenligning
    • 3.5 Konklusjoner
  • 4 Referanser

Hvordan beregne bestemmelseskoeffisienten?

I forrige avsnitt ble det sagt at bestemmelseskoeffisienten beregnes ved å finne kvotienten mellom avvikene:

-Estimert av regresjonsfunksjonen til variabelen Y 

-Den for variabelen Yi som tilsvarer hver av variabelen Xi for N-dataparene. 

Oppgitt matematisk ser det slik ut:

Rto = Sŷ / Sy

Fra denne formelen følger det at Rto representerer variasjonsandelen forklart av regresjonsmodellen. Alternativt kan R beregnesto ved å bruke følgende formel, helt ekvivalent med den forrige:

Rto = 1 - (Sε / Sy)

Der Sε representerer variansen til restene εi = Ŷi - Yi, mens Sy er variansen til settet med Yi-verdier for dataene. For å bestemme Ŷi brukes regresjonsfunksjonen, som betyr å bekrefte at Ŷi = f (Xi).

Variansen til datasettet Yi, med i fra 1 til N, beregnes som følger:

Sy = [Σ (Yi - )to ) / (N-1)]

Og fortsett på en lignende måte for Sŷ eller for Sε.

Illustrasjonsstil

For å vise detaljene i hvordan beregningen av bestemmelseskoeffisient vi tar følgende sett med fire par data: 

(X, Y): (1, 1); (2. 3); (3, 6) og (4, 7).

Det foreslås en lineær regresjonspassing for dette datasettet, som oppnås ved hjelp av metoden med minste kvadrat:

f (x) = 2,1 x - 1 

Ved å bruke denne justeringsfunksjonen oppnås momentene:

(X, Ŷ): (1, 1.1); (2, 3.2); (3, 5.3) og (4, 7.4).

Deretter beregner vi det aritmetiske gjennomsnittet for X og Y:

= (1 + 2 + 3 + 4) / 4 = 2,5

= (1 + 3 + 6 + 7) / 4 = 4,25

Varians Sy

Sy = [(1 - 4,25)to + (3 - 4,25)to + (6 - 4,25)to +….…. (7 - 4.25)to] / (4-1) =

= [(-3,25)to+ (-1,25)to + (1,75)to + (2,75)to) / (3)] = 7.583

Avvik Sŷ

Sŷ = [(1.1 - 4.25)to + (3,2 - 4,25)to + (5.3 - 4.25)to +.... (7.4 - 4.25)to] / (4-1) =

= [(-3,25)to + (-1,25)to + (1,75)to + (2,75)to) / (3)] = 7,35

Bestemmelseskoeffisient Rto

Rto = Sŷ / Sy = 7,35 / 7,58 = 0,97

Tolkning

Bestemmelseskoeffisienten for illustrasjonssaken som ble vurdert i forrige segment viste seg å være 0,98. Med andre ord, den lineære justeringen gjennom funksjonen:

 f (x) = 2,1 x - 1

Det er 98% pålitelig når det gjelder å forklare dataene det ble oppnådd med, ved hjelp av metoden med minste kvadrat.. 

I tillegg til bestemmelseskoeffisienten, er det lineær korrelasjonskoeffisient eller også kjent som Pearsons koeffisient. Denne koeffisienten, betegnet som r, beregnes av følgende forhold:

r = Sxy / (Sx Sy)

Her representerer telleren kovariansen mellom variablene X og Y, mens nevneren er produktet av standardavviket for variabelen X og standardavviket for variabelen Y.

Pearsons koeffisient kan ta verdier mellom -1 og +1. Når denne koeffisienten har en tendens til +1, er det en direkte lineær korrelasjon mellom X og Y. Hvis den har en tendens til -1 i stedet, er det en lineær korrelasjon, men når X øker, avtar Y. Til slutt er det nær 0, det er ingen sammenheng mellom de to variablene.

Det bør bemerkes at bestemmelseskoeffisienten sammenfaller med kvadraten til Pearson-koeffisienten, bare når den første er beregnet basert på en lineær passform, men denne likheten er ikke gyldig for andre ikke-lineære beslag..

Eksempler

- Eksempel 1

En gruppe videregående studenter satte seg for å bestemme en empirisk lov for perioden med en pendel som en funksjon av lengden. For å oppnå dette målet utfører de en serie målinger der de måler tiden for en pendelsvingning for forskjellige lengder og oppnår følgende verdier:

Lengde (m) Periode (r)
0,1 0,6
0,4 1.31
0,7 1,78
1 1,93
1.3 2.19
1.6 2.66
1.9 2.77
3 3,62

Det bes om å lage et spredningsdiagram av dataene og utføre en lineær tilpasning gjennom regresjon. Vis også regresjonsligningen og dens bestemmelseskoeffisient.

Løsning

Figur 2. Løsningsgraf for øvelse 1. Kilde: F. Zapata.

En ganske høy bestemmelseskoeffisient kan observeres (95%), så det kan tenkes at den lineære passformen er optimal. Imidlertid, hvis punktene blir sett sammen, ser det ut til at de har en tendens til å kurve nedover. Denne detaljene er ikke vurdert i den lineære modellen.

- Eksempel 2

For de samme dataene i eksempel 1, lag et spredningsdiagram over dataene. Ved denne anledningen, i motsetning til eksempel 1, blir det bedt om en regresjonsjustering ved hjelp av en potensiell funksjon.

Figur 3. Løsningsgraf for øvelse 2. Kilde: F. Zapata.

Vis også tilpasningsfunksjonen og dens bestemmelseskoeffisient Rto.

Løsning

Den potensielle funksjonen er av formen f (x) = AxB, hvor A og B er konstanter som bestemmes av minste kvadratmetoden.

Den forrige figuren viser den potensielle funksjonen og dens parametere, samt bestemmelseskoeffisienten med en veldig høy verdi på 99%. Legg merke til at dataene følger kurven på trendlinjen.

- Eksempel 3

Bruk de samme dataene fra eksempel 1 og eksempel 2, og utfør en annengrads polynomisk tilpasning. Vis graf, polynomial av passform og bestemmelseskoeffisient Rto korrespondent.

Løsning

Figur 4. Løsningsgraf for øvelse 3. Kilde: F. Zapata.

Med andregrads polynomtilpasning kan du se en trendlinje som passer godt til krumningen av dataene. Også bestemmelseskoeffisienten er over den lineære tilpasningen og under den potensielle tilpasningen..

Passer sammenligning

Av de tre viste tilpasningene er den med den høyeste bestemmelseskoeffisienten den potensielle tilpasningen (eksempel 2).

Den potensielle tilpasningen faller sammen med den fysiske teorien til pendelen, som som kjent fastslår at perioden til et pendel er proporsjonal med kvadratroten av lengden, og proporsjonalitetskonstanten er 2π / √g hvor g er akselerasjonen av tyngdekraften.

Denne typen potensielle tilpasning har ikke bare den høyeste bestemmelseskoeffisienten, men eksponenten og proporsjonalitetskonstanten samsvarer med den fysiske modellen.. 

Konklusjoner

-Regresjonstilpasning bestemmer parametrene til funksjonen som er ment å forklare dataene ved hjelp av metoden med minste kvadrat. Denne metoden består i å minimere summen av den kvadratiske forskjellen mellom Y-verdien for justering og Yi-verdien til dataene for Xi-verdiene til dataene. Dette bestemmer parametrene for justeringsfunksjonen.

-Som vi har sett er den vanligste justeringsfunksjonen linjen, men den er ikke den eneste siden justeringene også kan være polynomiske, potensielle, eksponensielle, logaritmiske og andre.. 

-Uansett avhenger bestemmelseskoeffisienten av dataene og typen av passform og er en indikasjon på godheten til den anvendte passformen..

-Til slutt angir bestemmelseskoeffisienten prosentandelen av total variabilitet mellom Y-verdien til dataene med hensyn til Ŷ-verdien av passformen for den gitte X.

Referanser

  1. González C. Generell statistikk. Gjenopprettet fra: tarwi.lamolina.edu.pe
  2. IACS. Aragonese institutt for helsevitenskap. Gjenopprettet fra: ics-aragon.com
  3. Salazar C. og Castillo S. Grunnleggende prinsipper for statistikk. (2018). Gjenopprettet fra: dspace.uce.edu.ec
  4. Superprof. Bestemmelseskoeffisient. Gjenopprettet fra: superprof.es
  5. USAC. Beskrivende statistikkhåndbok. (2011). Gjenopprettet fra: statistics.ingenieria.usac.edu.gt.
  6. Wikipedia. Bestemmelseskoeffisient. Gjenopprettet fra: es.wikipedia.com.

Ingen har kommentert denne artikkelen ennå.