Logo lt.boatexistence.com

Ar k reiškia dirbti su kategoriniais duomenimis?

Turinys:

Ar k reiškia dirbti su kategoriniais duomenimis?
Ar k reiškia dirbti su kategoriniais duomenimis?

Video: Ar k reiškia dirbti su kategoriniais duomenimis?

Video: Ar k reiškia dirbti su kategoriniais duomenimis?
Video: Clustering Algorithm for mixed datatypes - K-Prototypes 2024, Birželis
Anonim

K-Means algoritmas netaikomas kategoriškiems duomenims, nes kategoriniai kintamieji yra diskretūs ir neturi jokios natūralios kilmės. Taigi skaičiuoti euklidinį atstumą, pavyzdžiui, erdvei, nėra prasminga.

Ar galime naudoti grupavimą kategoriškiems duomenims?

Kategoriniai duomenys buvo konvertuoti į skaitinius priskiriant rango reikšmę. Kategorinis duomenų rinkinys gali būti sugrupuotas kaip skaitiniai duomenų rinkiniai. Pastebima, kad šios logikos įgyvendinimas, k-vidurkis, užtikrina tokį patį našumą kaip ir skaitmeniniuose duomenų rinkiniuose.

Ar vidurkis gali būti naudojamas kategoriškiems kintamiesiems?

Nėra būdo pagal šiuos duomenis rasti vidurkio, nes nėra „vidutinės“akių spalvos. Galite rasti proporcijas, bet ne vidurkį. Tikimės, kad tai padės!

Ką naudoti, kai duomenys yra kategoriški?

Kategoriniai duomenys analizuojami naudojant mode ir medianinius skirstinius, kur nominalūs duomenys analizuojami su režimu, o eiliniai duomenys naudoja abu. Kai kuriais atvejais eiliniai duomenys taip pat gali būti analizuojami naudojant vienmatę statistiką, dvimatę statistiką, regresijos programas, tiesines tendencijas ir klasifikavimo metodus.

Kas yra grupavimas naudojant kategorinius atributus?

Kategorinis duomenų grupavimas reiškia atvejį, kai duomenų objektai apibrėžiami per kategorinius atributus … Tai reiškia, kad kategoriškoms reikšmėms nėra vienos tvarkos ar būdingos atstumo funkcijos, ir nėra semantiškai prasmingo kategorinių ir skaitinių verčių susiejimo.

Rekomenduojamas: