Pinakamababang Pag-urong sa Mga Kwadro - Paano Lumikha ng Linya ng Pinakamahusay na Pagkasyahin?

Ang pinakakaunting mga parisukat na Pagbabalik ng Paraan ng Kahulugan

Ang isang hindi bababa sa-parisukat na paraan ng pagbabalik ay isang uri ng pagsusuri sa pag-urong na nagtatatag ng ugnayan sa pagitan ng umaasa at independiyenteng variable kasama ang isang guhit na linya. Ang linyang ito ay tinukoy bilang "linya ng pinakamahusay na akma".

Ang Pagsusuri sa Pag-urong ay isang pamamaraang pang-istatistika sa tulong ng kung saan maaaring matantya o mahulaan ang hindi kilalang mga halaga ng isang variable mula sa mga kilalang halaga ng isa pang variable. Ang variable na ginamit upang mahulaan ang variable interest ay tinatawag na independent o paliwanag na variable at ang variable na hinuhulaan ay tinatawag na dependant o ipinaliwanag na variable.

Isaalang-alang natin ang dalawang variable x & y. Ang mga ito ay naka-plot sa isang graph na may mga halagang x sa x-axis na halaga ng y sa y-axis. Ang mga halagang ito ay kinakatawan ng mga tuldok sa ibaba ng graph. Ang isang tuwid na linya ay iginuhit sa pamamagitan ng mga tuldok - tinukoy bilang linya ng pinakamahusay na akma.

Ang layunin ng hindi bababa sa mga pag-urong ng parisukat ay upang matiyak na ang linya na iginuhit sa pamamagitan ng hanay ng mga halagang ibinigay na itinatag ang pinakamalapit na ugnayan sa pagitan ng mga halaga.

Pinakamaliit na Parisukat sa Pag-urong sa Formula

Ang linya ng pag-urong sa ilalim ng paraan ng Least Squares ay kinakalkula gamit ang sumusunod na pormula -

ŷ = a + bx

Kung saan,

  • ŷ = umaasa na variable
  • x = independiyenteng variable
  • a = y-maharang
  • b = slope ng linya

Ang slope ng linya b ay kinakalkula gamit ang sumusunod na formula -

O kaya naman

Y-intercept, ang 'a' ay kinakalkula gamit ang sumusunod na formula -

Linya ng Pinakamahusay na Pagkasyahin sa Least Square Regression

Ang linya ng pinakamahusay na magkasya ay isang tuwid na linya na iginuhit sa pamamagitan ng isang kalat ng mga puntos ng data na pinakamahusay na kumakatawan sa ugnayan sa pagitan nila.

Isaalang-alang natin ang sumusunod na grap kung saan ang isang hanay ng data ay naka-plot kasama ang x at y-axis. Ang mga puntong ito ng data ay kinakatawan gamit ang mga asul na tuldok. Tatlong linya ang iginuhit sa pamamagitan ng mga puntong ito - isang berde, pula at isang asul na linya. Ang berdeng linya ay dumadaan sa isang solong punto at ang pulang linya ay dumadaan sa tatlong mga puntos ng data. Gayunpaman, ang asul na linya ay dumadaan sa apat na mga puntos ng data at ang distansya sa pagitan ng mga natitirang puntos sa asul na linya ay minimal kumpara sa iba pang dalawang mga linya.

Sa graph sa itaas, ang asul na linya ay kumakatawan sa linya ng pinaka-akma dahil namamalagi ito sa lahat ng mga halaga at ang distansya sa pagitan ng mga puntos sa labas ng linya sa linya ay minimal (ibig sabihin, ang distansya sa pagitan ng mga labi sa linya ng pinakamahusay na akma - tinukoy din bilang mga kabuuan ng mga parisukat ng mga residual). Sa iba pang dalawang mga linya, ang orange at berde, ang distansya sa pagitan ng mga labi sa mga linya ay mas malaki kumpara sa asul na linya.

Ang pinakamaliit na mga parisukat na pamamaraan ay nagbibigay ng pinakamalapit na ugnayan sa pagitan ng mga umaasa at independiyenteng mga variable sa pamamagitan ng pagliit ng distansya sa pagitan ng mga labi at ang linya ng pinakamahusay na akma na ang kabuuan ng mga parisukat ng mga labi ay maliit sa ilalim ng pamamaraang ito. Samakatuwid ang term na "hindi bababa sa mga parisukat".

Mga halimbawa ng Least Squares Regression Line

Ilapat natin ang mga formula na ito sa tanong sa ibaba -

Maaari mong i-download ang Template ng Least Squares Regression Excel dito - Template ng Least Squares Regression Excel

Halimbawa # 1

Ang mga detalye na nauugnay sa karanasan ng mga technician sa isang kumpanya (sa isang bilang ng mga taon) at ang kanilang rating ng pagganap ay ibinibigay sa talahanayan sa ibaba. Gamit ang mga halagang ito, tantyahin ang rating ng pagganap para sa isang tekniko na may 20 taong karanasan.

Solusyon -

Upang kalkulahin ang pinakamaliit na mga parisukat ay kalkulahin namin ang Y-intercept (a) at slope ng isang linya (b) tulad ng sumusunod -

Ang slope ng Line (b)

  • b = 6727 - [(80 * 648) / 8] / 1018 - [(80) 2/8]
  • = 247/218
  • = 1.13

Y-intercept (a)

  • a = 648 - (1.13) (80) / 8
  • = 69.7

Ang linya ng pag-urong ay kinakalkula bilang mga sumusunod -

Ang pagpapalit ng 20 para sa halaga ng x sa formula,

  • ŷ = a + bx
  • ŷ = 69.7 + (1.13) (20)
  • ŷ = 92.3

Ang rating ng pagganap para sa isang tekniko na may 20 taong karanasan ay tinatayang magiging 92.3.

Halimbawa # 2

Pinakamababang Mga Parehong Pag-urong sa Equation Gamit ang Excel

Ang pinakamaliit na-parisukat na equation ng pagbabalik ay maaaring makalkula gamit ang excel ng mga sumusunod na hakbang -

  • Ipasok ang talahanayan ng data sa excel.

  • Magpasok ng isang nakakalat na grap gamit ang mga puntos ng data.

  • Magpasok ng isang linya ng takbo sa loob ng graph na nagsabog.

  • Sa ilalim ng mga pagpipilian sa trendline - piliin ang linear trendline at piliin ang equation ng pagpapakita sa tsart.

  • Ang pinakamaliit na mga parisukat na pagbabalik sa pag-urong para sa ibinigay na hanay ng data ng excel ay ipinapakita sa tsart.

Kaya, ang pinakamaliit na mga parisukat na pagbabalik sa pag-uuri para sa naibigay na hanay ng data ng excel ay kinakalkula. Gamit ang equation, maaaring magawa ang mga hula at pag-aaral ng trend. Nagbibigay din ang mga tool ng Excel para sa detalyadong pagkalkula ng pagbabalik.

Mga kalamangan

  • Ang pinakamaliit na parisukat na pamamaraan ng pag-aaral ng pagbabalik ay pinakaangkop para sa mga modelo ng hula at pagtatasa ng trend. Pinakamahusay itong ginagamit sa larangan ng ekonomiya, pananalapi, at mga stock market kung saan hinuhulaan ang halaga ng anumang variable sa hinaharap sa tulong ng mga mayroon nang variable at ang ugnayan sa pagitan ng pareho.
  • Ang pamamaraan na hindi bababa sa mga parisukat ay nagbibigay ng pinakamalapit na ugnayan sa pagitan ng mga variable. Ang pagkakaiba sa pagitan ng mga kabuuan ng mga parisukat ng mga residual sa linya ng pinakamahusay na magkasya ay minimal sa ilalim ng pamamaraang ito.
  • Ang mekanismo ng pagkalkula ay simple at madaling mailapat.

Mga Dehado

  • Ang pinakamaliit na mga parisukat na pamamaraan ay umaasa sa pagtataguyod ng pinakamalapit na ugnayan sa pagitan ng isang naibigay na hanay ng mga variable. Ang mekanismo ng pagkalkula ay sensitibo sa data at sa kaso ng anumang mga outliers (pambihirang data) na mga resulta ay maaaring may posibilidad na pangunahing makaapekto.
  • Ang ganitong uri ng pagkalkula ay pinakaangkop para sa mga linear na modelo. Para sa mga hindi linear na equation, higit na nakakapagod na mga mekanismo ng pagkalkula ang inilalapat.

Konklusyon

Ang pinakamaliit na parisukat na pamamaraan ay isa sa pinakatanyag na ginagamit na pamamaraan para sa mga modelo ng hula at pagtatasa ng trend. Kapag kinakalkula nang naaangkop, naghahatid ito ng pinakamahusay na mga resulta.