Logistic regression: qauv thiab txoj hauv kev

Cov txheej txheem:

Logistic regression: qauv thiab txoj hauv kev
Logistic regression: qauv thiab txoj hauv kev
Anonim

Txoj kev ntawm logistic regression thiab kev txheeb xyuas kev ntxub ntxaug yog siv thaum nws tsim nyog los qhia meej qhov sib txawv ntawm cov neeg teb los ntawm cov hom phiaj. Hauv qhov no, cov pab pawg lawv tus kheej tau sawv cev los ntawm theem ntawm ib qho kev sib txawv ntawm ib leeg. Cia peb saib ze rau ntawm tus qauv logistic regression thiab nrhiav seb vim li cas nws thiaj li xav tau.

logistic regression
logistic regression

cov ntaub ntawv dav dav

Ib qho piv txwv ntawm qhov teeb meem uas siv logistic regression yog kev faib cov neeg teb rau hauv pab pawg uas yuav thiab tsis yuav mustard. Kev sib txawv yog ua raws li kev coj noj coj ua ntawm pej xeem. Cov no suav nrog, tshwj xeeb, hnub nyoog, poj niam txiv neej, cov txheeb ze, cov nyiaj tau los, thiab lwm yam. Hauv kev ua haujlwm, muaj cov qauv sib txawv thiab qhov sib txawv. Cov tom kawg encodes lub hom phiaj pawg uas, qhov tseeb, cov neeg teb yuav tsum tau muab faib.

Nuances

Nws yuav tsum tau hais tias qhov ntau ntawm cov xwm txheej uas siv logistic regression yog qhov nqaim dua li kev txheeb xyuas kev ntxub ntxaug. Nyob rau hauv no hais txog, kev siv cov tom kawg raws li ib tug universal txoj kev sib txawv yog xamnyiam dua. Tsis tas li ntawd, cov kws tshaj lij pom zoo kom pib kev tshawb fawb txog kev faib tawm nrog kev txheeb xyuas kev ntxub ntxaug. Thiab tsuas yog nyob rau hauv cov ntaub ntawv tsis paub meej txog cov txiaj ntsig, koj tuaj yeem siv logistic regression. Qhov kev xav tau no yog vim muaj ntau yam. Logistic regression yog siv thaum muaj kev nkag siab meej txog hom kev ywj pheej thiab nyob ntawm qhov sib txawv. Yog li, ib qho ntawm 3 txoj kev ua tau raug xaiv. Hauv kev txheeb xyuas kev ntxub ntxaug, tus kws tshawb fawb ib txwm cuam tshuam nrog ib qho kev ua haujlwm zoo li qub. Nws suav nrog ib qho kev vam khom thiab ntau qhov kev ywj pheej categorical variables nrog txhua hom teev.

Views

Txoj haujlwm ntawm kev tshawb fawb txheeb cais uas siv logistic regression yog los txiav txim qhov tshwm sim uas tus neeg teb tshwj xeeb yuav raug xa mus rau ib pab pawg. Kev sib txawv yog ua raws li qee qhov kev txwv. Hauv kev xyaum, raws li qhov tseem ceeb ntawm ib lossis ntau qhov kev ywj pheej, nws muaj peev xwm faib cov neeg teb rau hauv ob pawg. Hauv qhov no, binary logistic regression tshwm sim. Tsis tas li, cov txheej txheem teev tseg tuaj yeem siv tau thaum faib ua pawg ntau dua ob. Hauv qhov xwm txheej zoo li no, multinomial logistic regression tshwm sim. Cov pab pawg uas tau tshwm sim tau qhia nyob rau hauv qib ntawm ib qho kev sib txawv.

logistic regression
logistic regression

Example

Cia peb hais tias muaj cov neeg teb cov lus teb rau cov lus nug ntawm seb lawv puas txaus siab rau qhov kev thov yuav ib thaj av nyob rau hauv cheeb tsam Moscow. Cov kev xaiv yog "tsis muaj"thiab yog. Nws yog ib qho tsim nyog kom paub seb yam twg muaj feem cuam tshuam rau kev txiav txim siab ntawm cov neeg yuav khoom. Ua li no, cov neeg teb tau nug cov lus nug txog kev tsim kho vaj tse ntawm thaj chaw, qhov kev ncua deb mus rau lub peev, thaj chaw ntawm qhov chaw, qhov muaj / tsis muaj lub tsev nyob, thiab lwm yam. Siv binary regression, nws muaj peev xwm faib tau. cov neeg teb rau hauv ob pawg. Thawj yuav suav nrog cov neeg uas txaus siab rau qhov tau txais - cov neeg yuav khoom muaj peev xwm, thiab qhov thib ob, raws li, cov neeg uas tsis txaus siab rau qhov kev thov no. Rau txhua tus neeg teb, ntxiv rau, qhov yuav raug muab rau ib lossis lwm pawg yuav raug suav.

Tus yam ntxwv sib piv

Qhov txawv ntawm ob txoj kev xaiv saum toj no yog cov sib txawv ntawm pawg thiab hom kev vam khom thiab ywj pheej hloov pauv. Nyob rau hauv binary regression, piv txwv li, qhov dependence ntawm ib tug dichotomous yam ntawm ib los yog ntau tshaj kev ywj pheej yog kawm. Ntxiv mus, tom kawg tuaj yeem muaj txhua hom nplai. Multinomial regression yog suav tias yog ib qho kev hloov pauv ntawm qhov kev xaiv kev faib tawm no. Nyob rau hauv nws, ntau tshaj 2 pab pawg muaj nyob rau hauv qhov sib txawv. Cov yam ntxwv ntawm tus kheej yuav tsum muaj ib qho kev coj ua lossis qhov ntsuas nominal.

Logistic regression hauv spss

Nyob rau hauv pob ntawv txheeb cais 11-12 ib qho tshiab ntawm kev tshuaj ntsuam tau qhia - ib txwm. Txoj kev no yog siv thaum qhov kev vam meej nyob rau tib lub npe (ordinal) nplai. Hauv qhov no, cov kev hloov pauv ywj pheej raug xaiv ntawm ib hom tshwj xeeb. Lawv yuav tsum yog ordinal los yog nominal. Kev faib ua ntau pawg yog suav tias yog feem ntauuniversal. Txoj kev no tuaj yeem siv rau hauv txhua qhov kev tshawb fawb uas siv logistic regression. Txawm li cas los xij, tib txoj hauv kev los txhim kho qhov zoo ntawm tus qauv yog siv tag nrho peb cov txheej txheem.

Kev soj ntsuam zoo txaus thiab logistic regression
Kev soj ntsuam zoo txaus thiab logistic regression

Kev faib tawm

Nws yuav tsum tau hais tias ua ntej hauv pob ntawv txheeb cais tsis muaj qhov ua tau zoo ntawm kev ua haujlwm tshwj xeeb rau kev cuam tshuam nrog kev ntsuas ntsuas. Rau txhua qhov sib txawv nrog ntau dua 2 pawg, qhov sib txawv ntawm ntau lub npe tau siv. Qhov tsis ntev los no qhia txog kev tshuaj ntsuam xyuas muaj ntau yam nta. Lawv coj mus rau hauv tus account qhov tshwj xeeb ntawm qhov ntsuas. Meanwhile, nyob rau hauv cov kev pab qhia ntawv, ordinal logistic regression feem ntau tsis suav hais tias yog ib txoj kev cais. Qhov no yog vim muaj cov hauv qab no: kev soj ntsuam ib txwm tsis muaj qhov zoo tshaj plaws ntawm ntau lub npe. Tus kws tshawb fawb yuav zoo siv qhov tom kawg nyob rau hauv lub xub ntiag ntawm ob qho tib si ordinal thiab nominal dependent variable. Nyob rau tib lub sijhawm, cov txheej txheem kev faib tawm lawv tus kheej yuav luag tsis txawv ntawm ib leeg. Qhov no txhais tau hais tias kev soj ntsuam ib txwm yuav tsis ua rau muaj teeb meem.

kev xaiv xaiv

Cia peb xav txog ib rooj plaub yooj yim - binary regression. Piv txwv li, nyob rau hauv tus txheej txheem ntawm kev tshawb fawb kev lag luam, qhov kev thov rau cov kawm tiav ntawm ib lub tsev kawm ntawv hauv nroog tau raug soj ntsuam. Hauv daim ntawv nug, cov neeg teb tau nug cov lus nug, suav nrog:

  1. Koj puas ua haujlwm? (ql).
  2. Nyob rau xyoo kawm tiav (q 21).
  3. Qhov nruab nrab yog dab tsikawm tiav (aver).
  4. Gender (q22).

Logistic regression yuav ntsuas qhov cuam tshuam ntawm kev ywj pheej yam aver, q 21 thiab q 22 ntawm qhov sib txawv ql. Yooj yim muab tso, lub hom phiaj ntawm kev tshuaj xyuas yuav yog los txiav txim siab qhov yuav ua haujlwm ntawm cov neeg kawm tiav raws li cov ntaub ntawv hais txog thaj chaw, xyoo kawm tiav thiab GPA.

logistic sigmoid regression taw qhia
logistic sigmoid regression taw qhia

Logistic Regression

Txhawm rau teeb tsa qhov tsis siv binary regression, siv Analyze►Regression►Binary Logistic ntawv qhia. Nyob rau hauv Logistic Regression qhov rais, xaiv qhov nyob ntawm seb cov npe ntawm cov muaj nyob rau ntawm sab laug. yog ql. Qhov kev hloov pauv no yuav tsum tau muab tso rau hauv qhov chaw nyob. Tom qab ntawd, nws yog ib qho tsim nyog los qhia txog kev ywj pheej rau hauv cov phiaj xwm Covariates - q 21, q 22, aver. Tom qab ntawd koj yuav tsum xaiv seb yuav suav nrog lawv li cas hauv koj qhov kev txheeb xyuas. Yog hais tias tus naj npawb ntawm cov yam ntxwv ntawm tus kheej yog ntau tshaj 2, ces cov txheej txheem ntawm kev qhia ib txhij ntawm txhua qhov sib txawv, uas yog siv los ntawm lub neej ntawd, tab sis ib kauj ruam zuj zus. Txoj kev nrov tshaj plaws yog Rov Qab: LR. Siv lub pob Xaiv, koj tuaj yeem suav nrog hauv txoj kev tshawb no tsis yog txhua tus neeg teb, tab sis tsuas yog cov hom phiaj tshwj xeeb.

Define Categorical Variables

Cov khawm Categorical yuav tsum tau siv thaum ib qho ntawm cov kev hloov pauv ywj pheej nominal nrog ntau dua 2 pawg. Hauv qhov xwm txheej no, nyob rau hauv Txhais Categorical Variables qhov rais, tsuas yog qhov kev ntsuas no tau muab tso rau ntawm Categorical Covariates seem. Hauv qhov piv txwv no, tsis muaj qhov sib txawv li ntawd. Tom qab ntawd, nyob rau hauv cov npe drop-down Contrast nram qab noxaiv cov khoom Deviation thiab nias lub khawm Hloov. Raws li qhov tshwm sim, ntau qhov sib txawv nyob ntawm seb yuav tsim los ntawm txhua qhov nominal. Lawv tus lej sib raug rau cov naj npawb ntawm pawg thawj zaug.

Txuag Hloov Hloov Tshiab

Siv khawm Txuag hauv lub thawv loj ntawm txoj kev kawm, kev tsim cov kev txwv tshiab tau teeb tsa. Lawv yuav muaj cov ntsuas ntsuas hauv cov txheej txheem regression. Tshwj xeeb, koj tuaj yeem tsim cov kev hloov pauv uas txhais tau tias:

  1. Nyob rau ib pawg kev faib tawm tshwj xeeb (Groupmembership).
  2. Yuav ua li cas muab tus neeg teb rau txhua pab pawg kawm (Probabilities).

Thaum siv khawm Xaiv, tus kws tshawb fawb tsis tau txais cov kev xaiv tseem ceeb. Raws li, nws tuaj yeem tsis quav ntsej. Tom qab nias lub pob "OK", cov txiaj ntsig ntawm kev tshuaj ntsuam yuav tshwm rau hauv lub qhov rais loj.

logistic regression coefficient
logistic regression coefficient

Kev kuaj xyuas kom txaus thiab kev xa khoom rov qab

Xav txog Omnibus Testsof Model Coefficients lub rooj. Nws qhia txog cov txiaj ntsig ntawm kev txheeb xyuas qhov zoo ntawm qhov kwv yees ntawm tus qauv. Vim tias qhov kev xaiv ib kauj ruam dhau los tau teeb tsa, koj yuav tsum tau saib cov txiaj ntsig ntawm theem kawg (Step2). Qhov txiaj ntsig zoo yuav raug txiav txim siab yog tias pom qhov nce ntawm Chi-square qhov taw qhia thaum tsiv mus rau theem tom ntej ntawm qhov tseem ceeb (Sig. < 0.05). Qhov zoo ntawm tus qauv yog ntsuas nyob rau hauv Model kab. Yog tias tus nqi tsis zoo tau txais, tab sis nws tsis suav tias yog qhov tseem ceeb nrog tag nrho cov khoom siv siab ntawm tus qauv, qhov kawgtuaj yeem suav hais tias tsim nyog.

Tables

qauv Summary ua rau nws muaj peev xwm kwv yees tag nrho qhov sib txawv qhov ntsuas, uas tau piav qhia los ntawm tus qauv tsim (R Square Performance index). Nws raug nquahu kom siv tus nqi Nagelker. Lub Nagelkerke R Square parameter tuaj yeem suav tias yog qhov taw qhia zoo yog tias nws siab dua 0.50. Tom qab ntawd, cov txiaj ntsig ntawm kev faib tawm yog ntsuas, uas qhov ntsuas qhov tseeb ntawm kev koom nrog ib lossis lwm pawg hauv kev kawm tau muab piv nrog cov kwv yees raws li tus qauv regression. Rau qhov no, Lub Rooj Sib Tham yog siv. Nws kuj tso cai rau peb kos cov lus xaus txog qhov tseeb ntawm qhov sib txawv rau txhua pawg raws li kev txiav txim siab.

logistic regression qauv
logistic regression qauv

Cov lus hauv qab no muab lub sijhawm los tshawb pom qhov tseem ceeb ntawm cov xwm txheej ywj pheej nkag mus rau hauv kev tshuaj xyuas, nrog rau txhua qhov tsis yog tus qauv logistic regression coefficient. Raws li cov ntsuas no, nws muaj peev xwm kwv yees qhov sib koom ntawm txhua tus neeg teb hauv cov qauv mus rau ib pab pawg. Siv lub khawm Txuag, koj tuaj yeem nkag mus rau qhov hloov pauv tshiab. Lawv yuav muaj cov ntaub ntawv hais txog kev koom nrog hauv ib pawg kev faib (Predictedcategory) thiab qhov tshwm sim ntawm kev suav nrog hauv cov pab pawg no (Kev kwv yees qhov muaj feem ua tswv cuab). Tom qab txhaj "OK", cov txiaj ntsig suav yuav tshwm sim hauv lub qhov rai tseem ceeb ntawm Multinomial Logistic Regression.

Thawj lub rooj, uas muaj cov ntsuas tseem ceeb rau tus kws tshawb fawb, yog Cov Ntaub Ntawv Fitting. Ib theem siab ntawm qhov tseem ceeb ntawm kev txheeb cais yuav qhia tau tias muaj txiaj ntsig zoo thiabkev tsim nyog ntawm kev siv tus qauv hauv kev daws teeb meem. Lwm lub rooj tseem ceeb yog Pseudo R-Square. Nws tso cai rau koj los kwv yees qhov feem pua ntawm tag nrho qhov sib txawv ntawm qhov sib txawv, uas yog txiav txim siab los ntawm cov kev hloov pauv ywj pheej xaiv rau kev tshuaj xyuas. Raws li Daim Ntawv Xeem Zoo Li Cas, peb tuaj yeem txiav txim siab txog qhov tseem ceeb ntawm qhov kawg. Kev kwv yees Parameter qhia txog cov coefficient uas tsis yog tus qauv. Lawv yog siv nyob rau hauv kev tsim kho ntawm qhov sib npaug. Tsis tas li ntawd, rau txhua qhov sib xyaw ua ke ntawm qhov sib txawv, qhov tseem ceeb ntawm lawv qhov kev cuam tshuam rau qhov cuam tshuam tau raug txiav txim siab. Lub caij no, hauv kev tshawb fawb txog kev lag luam, nws feem ntau dhau los ua qhov tsim nyog los sib txawv cov neeg teb los ntawm qeb tsis yog tus kheej, tab sis yog ib feem ntawm pawg hom phiaj. Rau qhov no, cov lus Observedand Predicted Frequencies yog siv.

siv tswv yim

Kev txiav txim siab ntawm kev tshuaj xyuas yog dav siv hauv kev ua haujlwm ntawm cov tub luam. Xyoo 1991, qhov taw qhia logistic sigmoid regression tau tsim. Nws yog ib qho yooj yim-rau-siv thiab siv tau zoo rau kev kwv yees cov nqi yuav ua ntej lawv "overheat". Qhov taw qhia tau pom nyob rau hauv daim ntawv raws li ib qho channel tsim los ntawm ob kab sib luag. Lawv sib npaug ntawm qhov sib txawv. Qhov dav ntawm txoj kev hauv tsev yuav nyob ntawm lub sijhawm xwb. Qhov taw qhia yog siv thaum ua hauj lwm nrog yuav luag tag nrho cov cuab tam - los ntawm cov txiaj khub mus rau precious hlau.

logistic regression nyob rau hauv spss
logistic regression nyob rau hauv spss

Hauv kev xyaum, 2 lub tswv yim tseem ceeb rau kev siv cov cuab yeej tau tsim: rau kev tawm tsam thiabrau tig. Nyob rau hauv rooj plaub tom kawg, tus tub luam yuav tsom mus rau qhov kev hloov pauv ntawm tus nqi hloov pauv hauv cov channel. Raws li tus nqi nce mus txog qhov kev txhawb nqa lossis kev tawm tsam, thawj koom ruam tau muab tso rau ntawm qhov zoo li qhov kev txav mus los yuav pib mus rau qhov sib txawv. Yog tias tus nqi los ze rau ntawm ciam teb sab saud, koj tuaj yeem tshem tawm cov khoom vaj khoom tsev. Yog tias nws nyob ntawm qhov txwv qis, ces koj yuav tsum xav txog kev yuav khoom. Lub tswv yim breakout yog siv cov kev txiav txim. Lawv raug ntsia sab nraum qhov txwv ntawm qhov deb me me. Noj rau hauv tus account tias tus nqi hauv qee kis ua txhaum lawv rau lub sijhawm luv luv, koj yuav tsum ua si kom nyab xeeb thiab teeb tsa kev poob. Nyob rau tib lub sijhawm, tau kawg, tsis hais qhov kev xaiv zoo li cas, tus tub luam yuav tsum pom thiab ntsuas qhov xwm txheej uas tau tshwm sim ntawm kev ua lag luam kom zoo li ua tau.

Zoo kawg

Yog li, kev siv logistic regression tso cai rau koj kom sai thiab yooj yim faib cov neeg teb rau hauv pawg raws li qhov tsis muaj. Thaum txheeb xyuas, koj tuaj yeem siv txhua txoj kev tshwj xeeb. Hauv particular, multinomial regression yog universal. Txawm li cas los xij, cov kws tshaj lij pom zoo kom siv txhua txoj hauv kev tau piav qhia saum toj no ua ke. Qhov no yog vim lub fact tias nyob rau hauv cov ntaub ntawv no qhov zoo ntawm cov qauv yuav ho ntau dua. Qhov no, dhau los, yuav nthuav dav ntau yam ntawm nws daim ntawv thov.

Pom zoo: