Logistična regresija: model in metode

Metode logistične regresije

Vsebina

Splošne informacije
Ponudbe
Vrste
Primer:
Primerjalne značilnosti
Logistična regresija v spss
Ročna razvrstitev
Možnost analize
Logistična regresija
Določite kategorične spremenljivke
Shranite nove spremenljivke
Kontrola kakovosti ustreznosti in logistične regresije
Tabele
Praktična uporaba
Zaključek

in diskriminacijsko analizo, kadar je treba jasno razločiti anketirance po ciljnih kategorijah. V tem primeru skupine same predstavljajo ravni posameznega univariantnega parametra. Razmislimo podrobno model logistične regresije, in tudi ugotoviti, zakaj je to potrebno.

Splošne informacije

Primer problema v rešitvi katere regresijska logistika, je lahko razvrstitev anketirancev po skupinah, ki kupujejo in ne kupujejo gorčice. Razlikovanje poteka v skladu s socialno-demografskimi značilnostmi. Med njimi so zlasti starost, spol, število sorodnikov, dohodek itd. V operacijah so merila diferenciacije in spremenljivke. Slednja kodira ciljne kategorije, ki morajo dejansko ločiti anketirance.

Ponudbe

Treba je opozoriti, da obseg primerov, v katerih regresijska logistika, precej ožji kot za diskriminantno analizo. V zvezi s tem velja, da je uporaba slednjega kot univerzalna metoda razlikovanja boljša. Poleg tega strokovnjaki priporočajo začetek klasifikacijskih študij z diskriminacijsko analizo. In samo v primeru negotovosti za rezultate lahko uporabimo logistično regresijo. Ta potreba je posledica nekaterih dejavnikov. Logistična regresija Uporablja se, kadar obstaja jasna zamisel o vrsti neodvisnih in odvisnih spremenljivk. V skladu s tem je izbran eden od treh možnih postopkov. Z diskriminantno analizo raziskovalec vedno obravnava eno statično operacijo. Vključuje eno odvisno in več neodvisnih kategoričnih spremenljivk z lestvico vseh vrst.

Vrste

Naloga statističnih raziskav, ki jih uporablja regresijska logistika, je določiti verjetnost, da bo posamezna anketiranca dodeljena določeni skupini. Diferenciacija poteka po določenih parametrih. V praksi je mogoče, glede na vrednosti enega ali več neodvisnih dejavnikov, anketirance razvrstiti v dve skupini. V tem primeru, binarna logistična regresija. Prav tako se lahko določeni parametri uporabljajo za dodelitev skupinam, ki so več kot dve. V tem primeru obstaja večinoma logistična regresija. Nastale skupine so izražene z ravnijo ene spremenljivke.

Primer:

Recimo, da so odgovori anketirancev na vprašanje, ali so zainteresirani za ponudbo za nakup zemlje v predmestju Moskve. Možnosti so "ne" in "da". Treba je ugotoviti, kateri dejavniki imajo primarni vpliv na odločitev potencialnih kupcev. Za ta tožene zastavljenih vprašanjih o infrastrukturi ozemlja, razdalja do kapitala, površine, prisotnosti / odsotnosti stanovanjskih stavb in tako naprej. Dvojiškem regresije, se lahko razdelijo v dve skupini anketirancev. Prva bo vključevala tiste, ki jih zanima nakup - potencialni kupci, in drugi, tisti, ki se ne zanimajo za tak predlog. Za vsakega anketiranca se poleg tega izračuna tudi verjetnost, da bo dodeljena kategoriji.

Primerjalne značilnosti

Razlika med zgoraj omenjenima različicama je sestavljena iz različnih skupin in vrste odvisnih in neodvisnih spremenljivk. V binarni regresiji je na primer raziskana odvisnost dihotomnega faktorja na enem ali več neodvisnih pogojih. Slednji lahko imajo katero koli vrsto lestvice. Multinomialna regresija se šteje za spremembo te možnosti razvrstitve. V njej je odvisna spremenljivka več kot dve skupini. Neodvisni dejavniki morajo imeti bodisi rdečo ali nominalno lestvico.

Logistična regresija v spss

V statističnem paketu 11-12 je bila uvedena nova različica analize: zaporedna. Ta metoda se uporablja v primeru, ko se odvisni faktor nanaša na isto (oralno) lestvico. V tem primeru so neodvisne spremenljivke izbrane iz ene vrste. Biti morajo bodisi redki ali nominalni. Uvrstitev po več kategorijah se šteje za najbolj univerzalno. Ta metoda se lahko uporablja v vseh študijah, v katerih logistična regresija. Izboljšajte kakovost modela, Vendar pa je mogoče le s pomočjo vseh treh tehnik. kakovostni nadzor nad ustreznostjo in logistično regresijo

Ročna razvrstitev

Omeniti je treba, da prej v statističnem paketu ni bila zagotovljena značilna možnost izvedbe specializirane analize za odvisne dejavnike s podokno. Za vse spremenljivke s številom skupin, večjih od 2, je bila uporabljena večnacionalna različica. Relativno nedavno uvedena, redna analiza ima več funkcij. Upoštevajo specifiko lestvice. Medtem v metodoloških priročnikih, redni logistična regresija pogosto ne šteje za ločeno napravo. To je posledica naslednjega: redna analiza nima nobenih znatnih prednosti nad multinomialno. Raziskovalec lahko uporablja slednje, če obstaja tako redna kot tudi nominalna odvisna spremenljivka. Obenem se procesi razvrščanja med seboj ne razlikujejo veliko. To pomeni, da izvajanje runde analize ne bo povzročalo težav.

Možnost analize

Razmislite o preprostem primeru - binarni regresiji. Recimo, da je v procesu trženjskih raziskav ocenjen pomen diplomantov določene univerze v prestolnici. V vprašalniku so vprašani postavljali vprašanja, med drugim:

Ali delate? (ql).
Navedite leto diplomiranja (q 21).
Kakšna je povprečna točkovna točka (aver).
Seks (q22).

Logistična regresija bomo lahko ocenili vpliv neodvisnih dejavnikov aver, q 21 in q 22 na spremenljivko ql. Preprosto povedano, namen analize bo določiti verjetno zaposlitev diplomantov na podlagi podatkov o področju, letniku in povprečnem rezultatu. Logistični sigmoidni regresijski kazalnik

Logistična regresija

Če želite nastaviti parametre z binarno regresijo, uporabite meni Analyze►Regression►Binary Logistic. V oknu Logistična regresija morate v levem seznamu razpoložljivih spremenljivk izbrati odvisni faktor. On je ql. To spremenljivko je treba postaviti v polje Odvisno. Po tem je potrebno vnesti neodvisne dejavnike na mesto Covariates - q 21, q 22, v. Potem morate izbrati način, kako jih vključiti v analizo. Če je število neodvisnih dejavnikov večje od 2, potem se ne uporablja metoda hkratnega vnosa vseh spremenljivk, ki je privzeto nameščena, vendar po korakih. Najbolj priljubljen način se šteje za Backward: LR. S pomočjo gumba Select ne morete vključiti vseh anketirancev v študijo, temveč samo določeno ciljno kategorijo.

Določite kategorične spremenljivke

Gumb kategorij uporabite, ko je ena od neodvisnih spremenljivk nominalna in število kategorij je večje od 2. V tem primeru se v oknu Definira kategorične spremenljivke ta parameter doda v razdelek Kategorije kategorij. V tem primeru takšne spremenljivke ni. Nato v spustnem seznamu Contrast izberite Deviation in pritisnite gumb Change. Posledično bodo iz vsakega nominalnega faktorja oblikovane več odvisnih spremenljivk. Njihovo število ustreza številu kategorij prvotnega pogoja.

Shranite nove spremenljivke

Z gumbom Shrani v glavnem raziskovalnem pogovornem oknu ustvarjate nove parametre. Vključevali bodo kazalnike, izračunane v regresijskem procesu. Zlasti lahko ustvarite spremenljivke, ki določajo:

Pripadajo k posebni kategoriji razvrstitve (skupinsko posvetovanje).
Verjetnost dodelitve anketiranca vsaki študijski skupini (Verjetnost).

Ko uporabljate gumb Options, raziskovalec ne dobi nobenih pomembnih značilnosti. Zato ga je mogoče prezreti. Po kliku gumba »V redu« bodo rezultati analize prikazani v glavnem oknu. logistični regresijski koeficient

Kontrola kakovosti ustreznosti in logistične regresije

Razmislite o tabeli Omnibus Testsof Model Coefficients. Prikaže rezultate analize kakovosti približevanja modela. Glede na to, da je primarni možnost, boste morali gledati na rezultate zadnje stopnje (2. korak) je bil določen. Bi se šteje za pozitiven rezultat, v katerih je zaznati porast Chi-kvadrat indeks pri prehodu na naslednji korak na visoko stopnjo pomembnosti (Sig. < 0,05). Kakovost modela ocenjujemo v vrstici Model. Če dobimo negativno vrednost, vendar se ne šteje za pomembnega pri splošnem velikem pomenu modela, je slednje mogoče šteti za praktično koristno.

Tabele

Povzetek modela omogoča oceno indeksa agregatne variance, opisane v konstruiranem modelu (indikator R Square). Priporočljivo je, da uporabite vrednost Nagelkerja. Pozitivni kazalec je parameter Nagelkerke R Square, če je nad 0,50. Po tem ocenili rezultate klasifikacije, v kateri so dejanski kazalci, ki spada v eno ali drugo kategorijo študije v primerjavi s tistimi, ki jih je regresijski model napovedal. Če želite to narediti, uporabite tabelo razvrščanja. Omogoča tudi sklepanje o pravilnosti diferenciacije za vsako obravnavano skupino. logistični regresijski model Naslednja tabela zagotavlja priložnost za pojasnitev statističnega pomena neodvisnih dejavnikov, ki so bili vključeni v analizo, in tudi vsaka nestandardizirana logistični regresijski koeficient. Na podlagi teh kazalnikov je mogoče predvideti pripadnost vsakega anketiranca v vzorcu določeni skupini. Z gumbom Shrani lahko vnesete nove spremenljivke. Ti bo vsebovala informacije o pripadnosti določeni kategoriji razvrstitve (Preshy-dictedcategory) in verjetnost vključitve v teh skupinah (Predvidena verjetnosti članstva). Po kliku »OK« se rezultati izračunov pojavijo v glavnem oknu Multinomialne logistične regresije.

Prva tabela, v kateri so raziskovalci pomembni kazalniki, je Model Fitting Information. Visoka stopnja statistične pomembnosti bo pokazala visoko kakovost in primernost uporabe modela pri reševanju praktičnih problemov. Druga pomembna tabela je Pseudo R-Square. Omogoča nam, da ocenimo delež celotne variance v odvisnem faktorju, ki ga določajo neodvisne spremenljivke, izbrane za analizo. V skladu z razpredelnico Likelihood Ratio Tests lahko sklepate o statističnem pomenu slednjih. V ocenah parametrov se odražajo nestandardizirani koeficienti. Uporabljajo se pri konstrukciji enačbe. Poleg tega je bila za vsako kombinacijo spremenljivk določena statistična značilnost njihovega vpliva na odvisen faktor. Med tržnimi raziskavami je pogosto treba razlikovati po kategorijah anketirancev, ne posamezno, ampak kot del ciljne skupine. Če želite to narediti, uporabite tabelo Observedand Predicted Frequencies.

Praktična uporaba

Ta način analize se pogosto uporablja pri delu trgovcev. Leta 1991 je bil razvit indikator logistične sigmoidne regresije. To je enostavno za uporabo in učinkovito orodje, s katerim lahko napovedujete verjetne cene, preden se "pregrejejo". Indikator je prikazan na grafu v obliki kanala, ki ga sestavljata vzporedno dve vrstici. Enako so razmaknjeni od trenda. Širina koridorja bo odvisna samo od časovnega okvira. Kazalnik se uporablja pri delu s skoraj vsemi sredstvi - od valutnih parov do plemenitih kovin.

logistična regresija v spss

V praksi so bile oblikovane dve ključni strategiji za uporabo orodja: ob razčlenitvi in na vrsti. V slednjem primeru bo trgovec vodil dinamika spremembe cen znotraj kanala. Ker se stroški približujejo liniji podpore ali odpornosti, je stava narejena glede na verjetnost, da se bo gibanje začelo v nasprotni smeri. Če se cena približa zgornji meji, se sredstvo lahko odstrani. Če je na spodnji meji, potem je vredno razmišljati o nakupu. Strategija za razčlenitev vključuje uporabo naročil. Postavljeni so zunaj meja sorazmerno majhne razdalje. Ob upoštevanju, da cena v številnih primerih krši za kratek čas, morate biti pozavarovani in namestiti zaustavitev. Hkrati pa, seveda, ne glede na izbrane strategije zahteva od trgovca, da bi povečali hladnokrvno dojemajo in ocenjujejo stanje, ki se je pojavila na trgu.

Zaključek

Tako uporaba logistične regresije omogoča hitro in preprosto razvrstitev anketirancev v kategorije v skladu z določenimi parametri. V analizi lahko uporabite katero koli posebno metodo. Zlasti je multinomialna regresija vsestranska. Vendar strokovnjaki priporočajo uporabo vseh zgornjih metod v kompleksu. To je posledica dejstva, da bo v tem primeru kakovost modela veliko višja. To pa bo razširilo obseg njegove uporabe.

Zdieľať na sociálnych sieťach:

Príbuzný