Chi Square Test sa Excel | Paano gawin ang Chi Square Test na may Halimbawa

Chi-Square Test kasama ang Excel

Ang Chi-Square test sa excel ay ang pinakakaraniwang ginamit na non-parametric test na ginamit upang ihambing ang dalawa o higit pang mga variable para sa random na napiling data. Ito ay isang uri ng pagsubok na ginagamit upang malaman ang ugnayan sa pagitan ng dalawa o higit pang mga variable, ginagamit ito sa mga istatistika na kilala rin bilang Chi-Square P-value, sa excel wala kaming isang built in function ngunit maaari naming gamitin ang mga pormula upang maisagawa ang chi-square test sa excel sa pamamagitan ng paggamit ng formula sa matematika para sa Chi-Square Test.

Mga uri

  1. Chi-Square pagsubok para sa kabutihan ng fit
  2. Chi-Square pagsubok para sa kalayaan ng dalawang variable.

# 1 - Chi-Square test para sa kabutihan ng fit

Ginagamit ito upang maunawaan ang kalapitan ng isang sample na nababagay sa isang populasyon. Ang simbolo ng Chi-Square test ay (2). Ito ang kabuuan ng lahat ng (Naobserbahang bilang - Inaasahang bilang) 2 / Inaasahang bilang.

  • kung saan k-1 degree ng kalayaan o DF.
  • Kung saan Oi ay ang sinusunod na dalas, k ay kategorya, at Ei ang inaasahang dalas.

Tandaan: - Ang pagiging mabuti ng fit ng isang modelong pang-istatistika ay tumutukoy sa pag-unawa sa kung gaano kahusay na umaangkop ang sample na data sa isang hanay ng mga obserbasyon.

Gumagamit

  • Ang kredibilidad ng mga nangungutang batay sa kanilang mga pangkat ng edad at personal na pautang
  • Ang ugnayan sa pagitan ng pagganap ng mga salesman at natanggap na pagsasanay
  • Bumalik sa isang solong stock at sa mga stock ng isang sektor tulad ng parmasyutiko o pagbabangko
  • Kategoryang panonood at ang epekto ng isang kampanya sa TV.

# 2 - pagsubok sa Chi-Square para sa kalayaan ng dalawang variable

Ginagamit ito upang suriin kung ang mga variable ay nagsasarili sa isa't isa o hindi. Na may (r-1) (c-1) degree ng kalayaan

Kung saan Oi ay ang sinusunod na dalas, r ay bilang ng mga hilera, c ay ang bilang ng mga haligi, at Ei ang inaasahang dalas

Tandaan: - Ang dalawang mga random na variable ay tinatawag na independyente kung ang pamamahagi ng posibilidad ng isang variable ay hindi apektado ng isa pa.

Gumagamit

Ang pagsubok ng kalayaan ay angkop para sa mga sumusunod na sitwasyon:

  • Mayroong isang kategoryang variable.
  • Mayroong dalawang mga kategoryang variable, at kakailanganin mong matukoy ang ugnayan sa pagitan ng mga ito.
  • Mayroong mga cross-tabulation, at ang ugnayan sa pagitan ng dalawang kategoryang variable ay kailangang matagpuan.
  • Mayroong mga hindi nabibilang na variable (Halimbawa, mga sagot sa mga katanungan tulad ng, pinipili ba ng mga empleyado sa iba't ibang mga pangkat ng edad ang iba't ibang mga uri ng mga plano sa kalusugan?)

Paano Magagawa ang Chi-Square Test sa Excel? (na may Halimbawa)

Maaari mong i-download ang Template ng Chi Square Test Excel dito - Chi Square Test Excel Template

Nais ng manager ng isang restawran na makahanap ng ugnayan sa pagitan ng kasiyahan ng customer at ng suweldo ng mga taong naghihintay para sa mga mesa. Dito, ise-set up namin ang teorya upang subukan ang Chi-Square

  • Kumuha siya ng isang random na sample ng 100 mga customer na nagtatanong kung ang serbisyo ay mahusay, mabuti, o mahirap.
  • Pagkatapos ay ikinategorya niya ang sahod ng mga taong naghihintay bilang mababa, katamtaman, at mataas.
  • Ipagpalagay na ang antas ng kabuluhan ay 0.05. Dito, ang H0 at H1 ay nagpapahiwatig ng kalayaan at pag-asa ng kalidad ng serbisyo sa mga suweldo ng mga naghihintay na mesa.
  • H0 - Ang kalidad ng serbisyo ay hindi nakasalalay sa suweldo ng mga taong naghihintay para sa mga talahanayan.
  • H1 - Ang kalidad ng serbisyo ay nakasalalay sa suweldo ng mga taong naghihintay para sa mga talahanayan
  • Ang kanyang mga natuklasan ay ipinapakita sa talahanayan sa ibaba:

Sa ito, mayroon kaming 9 na mga puntos ng data na mayroon kaming 3 mga grupo bawat isa ay nakakakuha ng ibang mensahe tungkol sa suweldo at ang kinalabasan ay ibinibigay sa ibaba.

Ngayon ay bibilangin namin ang kabuuan ng lahat ng mga hilera at haligi. Gagawin namin ito sa tulong ng formula i.e. SUM. Sa Kabuuan ang Magaling sa kabuuang haligi na isinulat namin = SUM (B4: D4) at pagkatapos ay pindutin ang enter.

Ito ay magbibigay sa amin 26. Gagawa kami ng pareho sa lahat ng mga hilera at haligi.

Upang makalkula ang Degree of Freedom (DF) ginagamit namin (r-1) (c-1)

DF = (3-1)(3-1)=2*2=4

  • Mayroong 3 kategorya ng serbisyo at 3 kategorya ng Suweldo
  • Mayroon kaming 27 mga respondente na may Medium na suweldo (ilalim na hilera, gitna)
  • Mayroon kaming 51 mga respondente na may mahusay na serbisyo (huling haligi, gitna)

Ngayon kailangan nating kalkulahin ang Mga Inaasahang Dalas: -

Mga Inaasahang Dalas maaaring kalkulahin gamit ang isang formula: -

  • Upang makalkula ang para sa Napakahusay gagamitin namin ang pagpaparami ng kabuuan ng Mababa sa kabuuan ng Mahusay na hinati ni N.

Ipagpalagay na kailangan nating kalkulahin para sa ika-1 hilera at ika-1 haligi (= B7 * E4 / B9). Ibibigay nito ang inaasahang bilang ng mga customer na bumoto Napakahusay serbisyo para sa sahod ng mga taong naghihintay bilang mababa ibig sabihin 8.32.

  • E11=­­(32*26)/100 = 8.32, E12 = 7.02, E13 = 10.66
  • E21 = 16.32, E22 = 13.77, E23 = 20.91
  • E31 = 7.36, E32 = 6.21, E33 = 9.41

Katulad nito para sa lahat, kailangan nating gawin ang pareho at ang pormula ay inilalapat sa diagram sa ibaba.

Nakukuha namin ang talahanayan ng Inaasahang Dalas na ibinigay sa ibaba: -

Tandaan: - Ipagpalagay na ang antas ng kabuluhan ay 0.05. Dito, ang H0 at H1 ay nagpapahiwatig ng kalayaan at pag-asa ng kalidad ng serbisyo sa mga suweldo ng mga naghihintay na mesa.

Matapos kalkulahin ang Inaasahang Dalas ay makakalkula namin ang mga chi-square data point sa pamamagitan ng paggamit ng isang formula

Mga Puntong Chi-Square = (Naobserbahan-Inaasahan) ^ 2 / Inaasahan

Upang makalkula ang unang puntong isinulat namin = (B4-B14) ^ 2 / B14.

Kopyahin at idikit namin ang formula sa iba pang mga cell upang awtomatikong punan ang halaga.

Pagkatapos nito, kakalkulahin namin ang chi-halaga (Nakalkulang halaga) sa pamamagitan ng pagdaragdag ng lahat ng mga halagang ibinigay sa itaas ng talahanayan

Nakuha namin ang Chi-halaga bilang 18.65823.

Upang makalkula ang kritikal na halaga para dito gumagamit kami ng isang chi-square na kritikal na talahanayan ng halaga na maaari naming gamitin ang formula na ibinigay sa ibaba.

Naglalaman ang formula na ito ng 2 mga parameter CHISQ.INV.RT (posibilidad, antas ng kalayaan).

Ang posibilidad ay 0.05, ito ay isang makabuluhang halaga na makakatulong sa amin upang matukoy kung tatanggapin ang Null Hypothesis (H0) o hindi.

Ang kritikal na halaga ng chi-square ay 9.487729037.

Ngayon ay mahahanap natin ang halaga ng chi-square o (P halaga)= CHITEST (aktwal na_range, inaasahan_range)

Mula sa hanay = CHITEST (B4: D6, B14: D16).

Tulad ng nakita natin na ang halaga ng chi-test o P-halaga ay = 0,00091723.

Tulad ng nakita naming kinakalkula namin ang lahat ng mga halaga. Ang chi-square (Nakalkulang halaga) ang mga halaga ay makabuluhan lamang kung ang halaga nito ay pareho o higit pa sa kritikal na halaga 9.48, ibig sabihin kritikal na halaga (Nakatakdang halaga) dapat mas mataas kaysa sa 18.65 upang tanggapin ang Null Hypothesis (H0).

Pero dito Kinakalkula ang halaga >Nakatakdang halaga

X2 (Nakalkula)> X2 (Naka-tabulate)

18.65>9.48

Sa kasong ito, tatanggihan namin ang Null Hypothesis (H0) at Kahalili (H1) tatanggapin.

  • Maaari din naming gamitin ang P-Halaga upang mahulaan ang pareho ibig sabihin kung P-halaga <= α (makabuluhang halaga na 0.05), Ang null na teorya ay tatanggihan
  • Kung ang P-halaga> α, Huwag tanggihan ang null hipotesis.

Dito P-halaga (0.0009172)< α (0.05), tanggihan ang H0, tanggapin ang H1

Mula sa halimbawa sa itaas, napagpasyahan namin na ang kalidad ng Serbisyo ay nakasalalay sa suweldo ng mga taong naghihintay.

Bagay na dapat alalahanin

  • Isinasaalang-alang ang parisukat ng isang karaniwang normal na pagkakaiba-iba.
  • Sinusuri kung ang mga frequency na sinusunod sa iba't ibang mga kategorya ay magkakaiba-iba mula sa mga frequency na inaasahan sa ilalim ng isang tinukoy na hanay ng mga pagpapalagay.
  • Natutukoy kung gaano kahusay ang isang ipinapalagay na pamamahagi na akma sa data.
  • Gumagamit ng mga contingency table (sa mga pagsasaliksik sa merkado, ang mga talahanayan na ito ay tinatawag na mga cross-tab).
  • Sinusuportahan ang mga pagsukat sa antas ng nominal.