Multicollinearity (Kahulugan, Mga Uri) | Nangungunang 3 Mga Halimbawa na may Paliwanag

Ano ang Multicollinearity?

Ang Multicollinearity ay isang hindi pangkaraniwang kababalaghan kung saan dalawa o higit pang mga variable sa isang modelo ng pagbabalik ay nakasalalay sa iba pang mga variable sa isang paraan na ang isang maaaring linear na hinulaang mula sa iba pa na may mataas na antas ng kawastuhan. Karaniwan itong ginagamit sa mga pag-aaral na obserbasyon at hindi gaanong popular sa mga pang-eksperimentong pag-aaral.

Mga uri ng Multicollinearity

Mayroong apat na uri ng Multicollinearity

  • #1 –Perpektong Multicollinearity - Mayroon ito kapag ang mga independiyenteng variable sa equation hulaan ang perpektong linear na relasyon.
  • # 2 - Mataas na Multicollinearity - Ito ay tumutukoy sa linear na ugnayan sa pagitan ng dalawa o higit pang mga independiyenteng variable na hindi perpektong naiugnay sa bawat isa.
  • # 3 - Structural Multicollinearity - Ito ay sanhi ng mismong mananaliksik sa pamamagitan ng pagpasok ng iba't ibang mga independiyenteng variable sa equation.
  • # 4 - Multicollineaarity batay sa data - Ito ay sanhi ng mga eksperimento na hindi maganda ang disenyo ng mananaliksik.

Mga Sanhi ng Multicollinearity

Mga Independent na variable, ang pagbabago sa mga parameter ng mga variable ay gumagawa ng kaunting pagbabago sa mga variable mayroong isang makabuluhang epekto sa resulta & Ang Mga Koleksyon ng Data ay tumutukoy sa sample ng Napiling populasyon na kinukuha.

Mga halimbawa ng Multicollinearity

Halimbawa # 1

Ipagpalagay natin na ang ABC Ltd isang KPO ay tinanggap ng isang kumpanya ng parmasyutiko upang magbigay ng mga serbisyo sa pagsasaliksik at pagsusuri sa istatistika sa mga sakit sa India. Para sa ABC ltd na ito ay pumili ng edad, bigat, propesyon, taas, at kalusugan bilang mga parameter ng prima facie.

  • Sa halimbawa sa itaas, mayroong isang sitwasyon na multicollinearity dahil ang mga independiyenteng variable na napili para sa pag-aaral ay direktang naiugnay sa mga resulta. samakatuwid maipapayo sa mananaliksik na ayusin muna ang mga variable bago simulan ang anumang proyekto dahil ang mga resulta ay direktang maaapektuhan dahil sa mga napiling variable dito.

Halimbawa # 2

Ipagpalagay natin na ang ABC Ltd ay hinirang ng Tata Motors upang maunawaan ang dami ng mga benta ng mga motor na tataas ay magiging mataas sa aling kategorya sa merkado.

  • Sa halimbawa sa itaas, una sa mga independiyenteng variable ay tatapusin batay sa kung saan ang pananaliksik ay kailangang makumpleto. maaari itong buwanang kita, edad. tatak, ang mababang klase. Nangangahulugan lamang ito na mapipili ang data na kung saan ay magkakasya sa lahat ng mga tab na ito upang malaman kung gaano karaming mga tao ang makakabili ng kotseng ito (tata nano) nang hindi man lang tumitingin sa anumang ibang kotse.

Halimbawa # 3

Ipagpalagay na ang ABC Ltd ay tinanggap upang magsumite ng isang ulat upang malaman kung gaano karaming mga tao sa ilalim ng 50 ang madaling kapitan ng atake sa puso. para dito, ang mga parameter ay edad, kasarian, kasaysayan ng medikal

  • Sa halimbawa sa itaas, mayroong multicollinearity na lumitaw sapagkat ang independiyenteng variable na "edad" ay kailangang mai-tweak sa edad na wala pang 50 para sa pag-anyaya ng mga aplikasyon mula sa publiko upang ang mga taong higit sa 50 na taong gulang ay awtomatikong nasala.

Mga kalamangan

Nasa ibaba ang ilan sa mga kalamangan

  • Linear na Relasyon sa pagitan ng mga Independent Variable sa equation.
  • Napaka kapaki-pakinabang sa mga modelo ng istatistika at mga ulat sa pagsasaliksik na inihanda ng mga firm na batay sa pananaliksik.
  • Direktang epekto sa nais na resulta.

Mga Dehado

Nasa ibaba ang ilan sa mga Disadvantage

  • Sa ilang mga sitwasyon, malulutas ang isyung ito sa pamamagitan ng pagkolekta ng mas maraming data sa mga variable.
  • Maling paggamit ng mga variable ng dummy ibig sabihin, maaaring kalimutan ng mananaliksik na gamitin ang mga variable ng dummy kahit kailan kinakailangan.
  • Pagpasok ng 2 pareho o magkaparehong mga variable sa equation tulad ng kg at lbs sa timbang.
  • Pagpasok ng isang variable sa equation na kung saan ay isang kumbinasyon ng 2.
  • Kumplikado upang maisagawa ang mga kalkulasyon dahil ito ang pamamaraan ng pang-istatistika at nangangailangan ng mga statistical calculator upang gawin ang pagpapatupad.

Konklusyon

Ang Multicollinearity ay isa sa pinakapaboritong mga tool sa istatistika na madalas na ginagamit sa pagsusuri sa pag-urong at pagtatasa ng istatistika para sa malalaking mga database at ang nais na output. Ang lahat ng mga pangunahing kumpanya ay may magkakahiwalay na departamento ng istatistika sa kanilang kumpanya upang magsagawa ng pagsusuri sa pag-urong ng istatistika tungkol sa mga produkto o tao upang makapagbigay ng isang madiskarteng pagtingin sa merkado sa pamamahala at tulungan din silang magbuo ng kanilang mga pangmatagalang diskarte na pinapanatili ang isipan na ito. Ang grapikong pagtatanghal ng pagsusuri ay nagbibigay sa mambabasa ng isang malinaw na larawan ng direktang ugnayan, kawastuhan, at pagganap.

  • Kung ang layunin ng mananaliksik ay maunawaan ang mga independiyenteng variable sa equation kung gayon ang multicollinearity ay magiging isang malaking problema sa kanya.
  • Kailangang gawin ng mananaliksik ang kinakailangang mga pagbabago sa mga variable sa yugto 0 mismo o kung hindi ay maaaring magkaroon ito ng napakalaking epekto sa mga resulta.
  • Ang Multicollinearity ay maaaring magawa sa pamamagitan ng pagsusuri sa ugnayan ng matrix.
  • Ang mga panukalang remedyo ay may mahalagang papel sa paglutas ng mga problema para sa multicollinearity.