Outlier Formula | Hakbang sa Hakbang Pagkalkula ng Outlier (na may Halimbawa)

Ang Outlier formula ay nagbibigay ng isang graphic na tool upang makalkula ang data na matatagpuan sa labas ng ibinigay na hanay ng pamamahagi na maaaring panloob o panlabas na panig depende sa mga variable.

Ano ang Outlier Formula?

Ang isang outlier ay ang data point ng ibinigay na sample o ibinigay na pagmamasid o sa isang pamamahagi na nasa labas ng pangkalahatang pattern. Isang karaniwang panuntunang ginamit na nagsasabi na ang isang data point ay isasaalang-alang bilang isang outlier kung mayroon itong higit sa 1.5 IQR sa ibaba ng unang quartile o sa itaas ng ikatlong quartile.

Sinabi na magkakaiba, ang mga mababang tagalabas ay nakasalalay sa ibaba Q1-1.5 IQRand ang mga mataas na outlier ay magsisinungaling Q3 + 1.5IQR

Kailangang kalkulahin ng isa ang panggitna, mga quartile kasama ang IQR, Q1, at Q3.

Ang form ng outlier ay kinakatawan bilang mga sumusunod,

Ang Formula para sa Q1 = ¼ (n + 1) ika-termAng Formula para sa Q3 = ¾ (n + 1) na termAng Formula para sa Q2 = Q3 - Q1

Hakbang sa Hakbang Pagkalkula ng Outlier

Ang mga hakbang sa ibaba ay kailangang sundin upang makalkula ang Outlier.

  • Hakbang 1: Kalkulahin muna ang mga quartile ibig sabihin Q1, Q2 at interquartile
  • Hakbang 2: Kalkulahin ngayon ang halagang Q2 * 1.5
  • Hakbang 3: Ngayon ibawas ang halagang Q1 mula sa halagang kinakalkula sa Hakbang2
  • Hakbang 4: Dito Idagdag ang Q3 sa halagang nakalkula sa step2
  • Hakbang 5: Lumikha ng saklaw ng mga halagang kinakalkula sa Hakbang3 at Hakbang4
  • Hakbang 6: Ayusin ang data sa pataas na pagkakasunud-sunod
  • Hakbang 7: Suriin kung mayroong anumang mga halagang nasa ilalim o mas mataas kaysa sa saklaw na nilikha sa Hakbang5

Halimbawa

Isaalang-alang ang isang hanay ng data ng mga sumusunod na numero: 10, 2, 4, 7, 8, 5, 11, 3, 12. Kailangan mong kalkulahin ang lahat ng mga Outlier.

Solusyon:

Una, kailangan naming ayusin ang data sa pataas na pagkakasunud-sunod upang makahanap ng median na magiging Q2 para sa amin.

2, 3, 4, 5, 7, 8, 10, 11, 12

Ngayon dahil ang bilang ng mga obserbasyon ay kakaiba na kung saan ay 9, ang panggitna ay namamalagi sa isang ika-5 posisyon na 7 at pareho ay magiging Q2 para sa halimbawang ito.

Samakatuwid, ang pagkalkula ng Q1 ay ang mga sumusunod -

Q1 = ¼ (9 + 1)

= ¼ (10)

Q1 ay magiging -

Q1 = 2.5 term

Nangangahulugan ito na ang Q1 ay average ng ika-2 at ika-3 na posisyon ng mga obserbasyon na kung saan ay 3 & 4 dito at isang average ng pareho ay (3 + 4) / 2 = 3.5

Samakatuwid, ang pagkalkula ng Q3 ay ang mga sumusunod -

Q3 = ¾ (9 + 1)

= ¾ (10)

Ang Q3 ay magiging -

Q3 = 7.5 term

Nangangahulugan ito na ang Q3 ay average ng ika-7 at ika-8 na posisyon ng mga obserbasyon na kung saan ay 10 & 11 dito at isang average ng pareho ay (10 + 11) / 2 = 10.5

Ngayon, ang mga mababang tagalabas ay nakasalalay sa ibaba Q1-1.5IQR at ang mga mataas na outliers ay magsisinungaling Q3 + 1.5IQR

Kaya, ang mga halaga ay 3.5 - (1.5 * 7) = -7 at mas mataas na saklaw ay 10.5 + (1.5 * 7) = 110.25.

Dahil walang mga obserbasyon na namamalagi alinman sa itaas o mas mababa sa 110.25 at -7 wala kaming anumang mga lumalabas sa sample na ito.

Halimbawa ng Outlier Formula sa Excel (na may Template ng Excel)

Maaari mong i-download ang Outlier Formula Excel Template dito - Outlier Formula Excel Template

Ang mga klase sa malikhaing coaching ay isinasaalang-alang ang gantimpala sa mga mag-aaral na nasa nangungunang 25% Gayunpaman nais nilang iwasan ang anumang mga labas. Ang data ay para sa 25 mag-aaral. Gamitin ang Equlier equation upang matukoy kung mayroong isang outlier?

Solusyon:

Sa ibaba ay binibigyan ng data upang makalkula ang outlier

Ang bilang ng mga obserbasyon dito ay 25 at ang aming unang hakbang ay ang pag-convert sa itaas ng raw data sa pataas na pagkakasunud-sunod.

Median ay magiging -

Ang panggitna na halaga = ½ (n + 1)

= ½ = ½ (26)

= 13th term

Ang Q2 o panggitna ay 68.00

Alin ang 50% ng populasyon.

Q1 ay magiging -

Q1 = ¼ (n + 1) ika-term

= ¼ (25+1)

= ¼ (26)

= 6.5th term na katumbas ng ika-7 term

Ang Q1 ay 56.00 na nasa ibaba 25%

Ang Q3 ay magiging -

Panghuli, Q3 = ¾ (n + 1) ika-term

= ¾ (26)

= 19.50 term

Dito kailangang kunin ang average na kung saan ay ng ika-19 at ika-20 mga termino na 77 at 77 at ang average ng pareho ay (77 + 77) / 2 = 77.00

 Ang Q3 ay 77 na nangunguna sa 25%

Mababang hanay

Ngayon, ang mga mababang tagalabas ay nakasalalay sa ibaba Q1-1.5IQR at ang mga mataas na outliers ay magsisinungaling Q3 + 1.5IQR

Mataas na Saklaw -

Kaya, ang mga halaga ay 56 - (1.5 * 68) = -46 at mas mataas na saklaw ay 77 + (1.5 * 68) = 179.

Walang mga lumalabas.

Kaugnayan at Paggamit

Napakahalagang malaman ang pormula ng mga tagalabas dahil maaaring may data na mapalitan ng gayong halaga. Kumuha ng isang halimbawa ng mga obserbasyon 2, 4, 6, 101 at ngayon kung ang isang tao ay tumatagal ng isang average ng mga halagang ito ay magiging 28.25 ngunit 75% ng mga obserbasyon ay namamalagi sa ibaba 7 at samakatuwid ang isa ay magiging isang maling desisyon tungkol sa mga obserbasyon ng sample na ito.

Mapapansin dito na ang 101 ay malinaw na lumilitaw na balangkas at kung ito ay aalisin pagkatapos ang average ay magiging 4 na nagsasabi tungkol sa mga halaga o obserbasyon na nakasalalay sa loob ng saklaw na 4. Samakatuwid napakahalagang isagawa ang pagkalkula na ito upang maiwasan ang anumang nangungunang misusage na impormasyon ng data. Malawakang ginagamit ito ng mga estadistika sa buong mundo tuwing nagsasagawa sila ng anumang pagsasaliksik.