Pearson Correlation Coefficient (Formula, Halimbawa) | Kalkulahin ang Pearson R
Kahulugan ng Coefficient ng Pearson Correlation
Ang koepisyent ng ugnayan ng Pearson, na kilala rin bilang pagsubok sa istatistika ng Pearson R, ay sumusukat sa lakas sa pagitan ng iba't ibang mga variable at kanilang mga ugnayan. Kailan man isagawa ang anumang pagsusuri sa istatistika sa pagitan ng dalawang variable, kung gayon laging magandang ideya para sa taong gumagawa ng pagtatasa upang kalkulahin ang halaga ng coefficient ng ugnayan para sa pag-alam na kung gaano kalakas ang ugnayan sa pagitan ng dalawang variable.
Ang coefficient ng ugnayan ng Pearson ay nagbabalik ng isang halaga sa pagitan ng -1 at 1. Ang interpretasyon ng koepisyent ng ugnayan ay tulad ng sa ilalim ng:
- Kung ang koepisyent ng ugnayan ay -1, ito ay nagpapahiwatig ng isang malakas na negatibong relasyon. Nagpapahiwatig ito ng isang perpektong negatibong ugnayan sa pagitan ng mga variable.
- Kung ang coefficient ng ugnayan ay 0, hindi ito ipinapahiwatig na walang kaugnayan.
- Kung ang koepisyent ng ugnayan ay 1, ito ay nagpapahiwatig ng isang malakas na positibong relasyon. Nagpapahiwatig ito ng isang perpektong positibong ugnayan sa pagitan ng mga variable.
Ang isang mas mataas na ganap na halaga ng coefficient ng ugnayan ay nagpapahiwatig ng isang mas malakas na ugnayan sa pagitan ng mga variable. Samakatuwid, ang isang ugnayan ng koepisyent ng 0.78 ay nagpapahiwatig ng isang mas malakas na positibong ugnayan kumpara sa isang halaga ng sabihin na 0.36. Katulad nito, ang isang ugnayan ng koepisyent ng -0.87 ay nagpapahiwatig ng isang mas malakas na negatibong ugnayan kumpara sa isang coefficient ng ugnayan na sinasabi na -0.40.
Sa madaling salita, kung ang halaga ay nasa positibong saklaw, ipinapakita nito na ang ugnayan sa pagitan ng mga variable ay positibong naiugnay, at kapwa bumababa o tumaas nang magkasama. Sa kabilang banda, kung ang halaga ay nasa negatibong saklaw, ipinapakita nito na ang ugnayan sa pagitan ng mga variable ay naiugnay nang negatibo, at ang parehong mga halaga ay pupunta sa kabaligtaran na direksyon.
Pormula ng Coefficient ng Pearson Correlation
Ang pormula ng Korelasyon Koepisyent ng Pearson ay ang mga sumusunod,
Kung saan,
- r = Coefficient ng Pearson
- n = bilang ng mga pares ng stock
- ∑xy = kabuuan ng mga produkto ng mga ipinares na stock
- ∑x = kabuuan ng mga marka ng x
- ∑y = kabuuan ng mga marka ng y
- ∑x2 = kabuuan ng mga parisukat na x marka
- ∑y2 = kabuuan ng mga kuwadro na iskor
Paliwanag
Hakbang 1: Alamin ang bilang ng mga pares ng mga variable, na kung saan ay sinasabihan ng n. Ipagpalagay nating x ay binubuo ng 3 variable - 6, 8, 10. Ipagpalagay natin na ang y ay binubuo ng kaukulang 3 variable 12, 10, 20.
Hakbang 2: Ilista ang mga variable sa dalawang haligi.
Hakbang 3: Alamin ang produkto ng x at y sa ika-3 haligi.
Hakbang 4: Alamin ang kabuuan ng mga halaga ng lahat ng x variable at lahat ng variable ng y. Isulat ang mga resulta sa ilalim ng ika-1 at ika-2 haligi. Isulat ang kabuuan ng x * y sa ika-3 haligi.
Hakbang 5: Alamin ang x2 at y2 sa ika-4 at ika-5 haligi at ang kanilang kabuuan sa ilalim ng mga haligi.
Hakbang 6: Ipasok ang mga halagang nahanap sa itaas sa formula at lutasin ito.
r = 3 * 352-24 * 42 / √ (3 * 200-242) * (3 * 644-422)
= 0.7559
Halimbawa ng Pearson Correlation Coefficient R
Maaari mong i-download ang Template ng Excel na ito ng Pearson Correlation Coefficient - Ang Template ng Pearson Correlation Coefficient ExcelHalimbawa 1
Sa halimbawang ito sa tulong ng mga sumusunod na detalye sa talahanayan ng 6 na tao na may iba't ibang edad at magkakaibang timbang na ibinigay sa ibaba para sa pagkalkula ng halaga ng Pearson R
Solusyon:
Para sa Pagkalkula ng Pearson Correlation Coefficient, unang makakalkula namin ang mga sumusunod na halaga,
Narito ang kabuuang bilang ng mga tao ay 6 kaya, n = 6
Ngayon ang pagkalkula ng Pearson R ay ang mga sumusunod,
- r = (n (∑xy) - (∑x) (∑y)) / (√ [n ∑x2- (∑x) 2] [n ∑y2– (∑y) 2)
- r = (6 * (13937) - (202) (409)) / (√ [6 * 7280 - (202) 2] * [6 * 28365- (409) 2)
- r = (6 * (13937) - (202) * (409)) / (√ [6 * 7280 - (202) 2] * [6 * 28365- (409) 2)
- r = (83622- 82618) / (√ [43680 -40804] * [170190- 167281)
- r = 1004 / (√ [2876] * [2909)
- r = 1004 / (√ 8366284)
- r = 1004 / 2892.452938
- r = 0.35
Sa gayon ang halaga ng koepisyent ng ugnayan ng Pearson ay 0.35
Halimbawa # 2
Mayroong 2 stock - A at B. Ang kanilang mga presyo sa pagbabahagi sa mga partikular na araw ay ang mga sumusunod:
Alamin ang koepisyent ng ugnayan ng Pearson mula sa nabanggit na data.
Solusyon:
Una, makakalkula namin ang mga sumusunod na halaga.
Ang pagkalkula ng koepisyent na Pearson ay ang mga sumusunod,
- r = (5*1935-266*37)/((5*14298-(266)^2)*(5*283-(37)^2))^0.5
- = -0.9088
Samakatuwid ang koepisyent ng ugnayan ng Pearson sa pagitan ng dalawang mga stock ay -0.9088.
Mga kalamangan
- Nakatutulong ito sa pag-alam kung gaano kalakas ang ugnayan sa pagitan ng dalawang variable. Hindi lamang ang pagkakaroon o kawalan ng ugnayan sa pagitan ng dalawang variable ay ipinahiwatig gamit ang Pearson Correlation Coefficient ngunit tinutukoy din nito ang eksaktong lawak kung saan nauugnay ang mga variable na iyon.
- Gamit ang pamamaraang ito, maaaring matiyak ng isa ang direksyon ng ugnayan na nangangahulugang kung ang ugnayan sa pagitan ng dalawang variable ay negatibo o positibo.
Mga Dehado
- Ang Pearson Correlation Coefficient R ay hindi sapat upang sabihin ang pagkakaiba sa pagitan ng mga umaasa na variable at ang mga independiyenteng variable bilang ang coefficient ng Korelasyon sa pagitan ng mga variable ay simetriko. Halimbawa, kung ang isang tao ay sumusubok na malaman ang ugnayan sa pagitan ng mataas na stress at presyon ng dugo, maaaring makita ng isa ang mataas na halaga ng ugnayan na nagpapakita na ang mataas na stress ay sanhi ng presyon ng dugo. Ngayon kung ang variable ay pinalilipat kung gayon ang resulta, sa kasong iyon, magiging pareho din na nagpapakita na ang stress ay sanhi ng presyon ng dugo na walang katuturan. Sa gayon, dapat magkaroon ng kamalayan ang mananaliksik sa datos na ginagamit niya para sa pagsasagawa ng pagsusuri.
- Gamit ang pamamaraang ito, hindi makukuha ng isang tao ang impormasyon tungkol sa slope ng linya dahil isinasaad lamang nito kung mayroong anumang ugnayan sa pagitan ng dalawang variable na mayroon o hindi.
- Malamang na ang Pearson Correlation Coefficient ay maaaring maling bigyan ng kahulugan lalo na sa kaso ng homogenous data.
- Kung ihinahambing sa iba pang mga pamamaraan ng pagkalkula, ang pamamaraang ito ay tumatagal ng maraming oras para sa pagdating sa mga resulta.
Mahahalagang Punto
- Maaaring saklaw ang mga halaga mula sa halagang +1 hanggang sa halagang -1, kung saan ipinapahiwatig ng +1 ang perpektong positibong ugnayan sa pagitan ng mga variable na isinasaalang-alang, ang -1 ay nagpapahiwatig ng perpektong negatibong ugnayan sa pagitan ng mga variable na isinasaalang-alang, at isang 0 na halaga ang nagpapahiwatig na walang ugnayan umiiral sa pagitan ng mga variable na isinasaalang-alang.
- Ito ay malaya sa yunit ng pagsukat ng mga variable. Halimbawa, kung ang yunit ng pagsukat ng isang variable ay nasa mga taon habang ang yunit ng pagsukat ng pangalawang variable ay nasa kilo, kahit na pagkatapos, ang halaga ng koepisyent na ito ay hindi nagbabago.
- Ang koepisyent ng ugnayan sa pagitan ng mga variable ay simetriko na nangangahulugang ang halaga ng koepisyent ng ugnayan sa pagitan ng Y at X o X at Y, ay mananatiling pareho.
Konklusyon
Ang Pearson Correlation Coefficient ay ang uri ng coefficient ng ugnayan na kumakatawan sa ugnayan sa pagitan ng dalawang variable na sinusukat sa parehong agwat o parehong sukat ng ratio. Sinusukat nito ang lakas ng ugnayan sa pagitan ng dalawang tuluy-tuloy na variable.
Hindi lamang nito nakasaad ang pagkakaroon o kawalan ng ugnayan sa pagitan ng dalawang variable ngunit natutukoy din nito ang eksaktong lawak kung saan nauugnay ang mga variable na iyon. Ito ay malaya sa yunit ng pagsukat ng mga variable kung saan ang mga halaga ng koepisyent ng ugnayan ay maaaring saklaw mula sa halagang +1 hanggang sa halagang -1. Gayunpaman, hindi sapat upang sabihin ang pagkakaiba sa pagitan ng mga umaasa na variable at mga independiyenteng variable.