Logo lt.boatexistence.com

Kokie yra trūkstamų verčių priskyrimo vidurkiams trūkumai?

Turinys:

Kokie yra trūkstamų verčių priskyrimo vidurkiams trūkumai?
Kokie yra trūkstamų verčių priskyrimo vidurkiams trūkumai?

Video: Kokie yra trūkstamų verčių priskyrimo vidurkiams trūkumai?

Video: Kokie yra trūkstamų verčių priskyrimo vidurkiams trūkumai?
Video: Dealing With Missing Data - Multiple Imputation 2024, Gegužė
Anonim

Vidutinis priskyrimas iškraipo ryšius tarp kintamųjų Tačiau vidutinis priskyrimas taip pat iškraipo daugiamatius ryšius ir turi įtakos statistikai, pvz., koreliacijai. Pavyzdžiui, šis PROC CORR iškvietimas apskaičiuoja koreliaciją tarp kintamojo Orig_Height ir svorio bei amžiaus kintamųjų.

Kodėl trūkstamų duomenų naudojimas yra blogas sprendimas?

Vidurkis sumažina duomenų dispersiją Gilinant matematiką, mažesnė dispersija lemia siauresnį pasikliautinąjį tikimybių skirstinio intervalą[3]. Tai lemia ne ką kitą, o mūsų modelio šališkumą.

Kodėl trūksta verčių?

Duomenų trūkumas sukelia įvairių problemų. Pirma, duomenų nebuvimas sumažina statistinę galią, kuri reiškia tikimybę, kad testas atmes nulinę hipotezę, kai ji klaidinga. Antra, prarasti duomenys gali sukelti paklaidą vertinant parametrus. Trečia, tai gali sumažinti mėginių reprezentatyvumą.

Kodėl vidutinis priskyrimas yra blogas?

1 problema: vidutinis įskaičiavimas neišsaugo ryšių tarp kintamųjų. Tiesa, priskaičiuojant vidurkį išsaugomas stebimų duomenų vidurkis. Taigi, jei duomenų trūksta visiškai atsitiktinai, vidurkio įvertis lieka nešališkas.

Ar reikia pakeisti trūkstamus duomenis vidurkiu?

Išskirtinių duomenų taškai turės didelę įtaką vidurkiui, todėl tokiais atvejais nerekomenduojama naudoti vidurkio trūkstamoms reikšmėms pakeisti. Naudojant vidutines reikšmes trūkstamoms reikšmėms pakeisti gali nepavykti sukurti puikaus modelio, todėl jis bus atmestas.

Rekomenduojamas: