Իմացեք, թե ինչ պարզ գծային ռեգրեսիա է եւ ինչպես է այն գործում

Քանակական տվյալներ վերլուծելու հիմնական վիճակագրական մոտեցումը

Կոլիզ Բուրգ, լուսանկարիչ: © Հունիս 10, 2010 Stock.xchng

Գծային ռեգրեսիոն մոդելները օգտագործվում են երկու փոփոխականների կամ գործոնների միջեւ հարաբերությունները կանխատեսելու կամ կանխատեսելու համար: Գործող գործոնը, որը կանխատեսվում է (գործոնն է, որ լուծում է համարվում), կոչվում է կախված փոփոխական: Կախված փոփոխականի արժեքի կանխատեսման համար օգտագործվող գործոնները կոչվում են անկախ փոփոխականներ:

Լավ տվյալները միշտ չէ, որ պատմում են ամբողջական պատմությունը: Ռեպրեսիաների վերլուծությունը սովորաբար օգտագործվում է հետազոտության մեջ, քանի որ այն սահմանում է, որ փոխկապակցվածությունը փոփոխականների միջեւ գոյություն ունի:

Բայց հարաբերակցությունը նույնն է, ինչ պատճառաբանություն : Նույնիսկ գիծը պարզ գծային ռեգրեսիայի մեջ, որը համապատասխանում է տվյալների կետերին, կարող է չհամընկնել որեւէ հիմնավոր պատճառի եւ հետեւանքների մասին:

Պարզ գծային ռեգրեսիայի մեջ ամեն դիտարկումը բաղկացած է երկու արժեքից: Մեկ արժեքը կախված փոփոխականի համար է, իսկ մեկ արժեքը `անկախ փոփոխական:

Պարզ գծային ռեգրեսիայի մոդել

Պարզ գծային ռեգրեսիոն մոդելը ներկայացված է այսպես ` y = ( β 0 + β 1 + E

Ըստ մաթեմատիկական կոնվենցիայի, երկու գործոնները, որոնք ընդգրկված են պարզ գծային ռեգրեսիայի վերլուծության մեջ, նշանակված են x եւ y :

Հավասարումը, որը նկարագրում է, թե ինչպես է y- ը կապված x- ի հետ , հայտնի է որպես ռեգրեսիայի մոդել : Գծային ռեգրեսիայի մոդելը նաեւ պարունակում է սխալ տերմին, որը ներկայացված է Ե , կամ հունական epsilon նամակով: Սխալ տերմինը օգտագործվում է հաշվի համար փոփոխականության համար, որը չի կարող բացատրել x- ի եւ գծերի գծային հարաբերությունները :

Կա նաեւ պարամետրեր, որոնք ներկայացնում են ուսումնասիրվող բնակչությունը: Մոդելի այս պարամետրերը , որոնք ներկայացված են ( β 0+ β 1 x ):

Պարզ գծային ռեգրեսիայի մոդել

Պարզ գծային ռեգրեսիոն հավասարումը ներկայացված է այսպես. Ե ( y ) = ( β 0 + β 1 x ):

Պարզ գծային ռեգրեսիոն հավասարումը գրաֆիտ է որպես ուղիղ գծի:

( β 0 է ռեպրեսիաների գծի y խափանումն է:

β 1 լանջինն է:

E ( y ) y- ի նշանակալի կամ ակնկալվող արժեքն է x- ի որոշակի արժեքի համար:

Ռեգրեսիայի գիծը կարող է ցույց տալ դրական գծային հարաբերություն, բացասական գծային հարաբերություններ կամ ոչ մի կապ: Եթե ​​գրաֆիկական գիծը պարզ գծային ռեգրեսիայի մեջ հարթ է (ոչ sloped), ապա երկու փոփոխականների միջեւ հարաբերություն չկա: Եթե ​​ռեգրեսիայի գիծը վերեւում է գծի ստորին եզրով գրաֆիկի եզրագծում (առանցք), իսկ գծի վերին եզրը, դեպի վեր գրաֆիկական դաշտը, հեռավորությունը x միջանցքից (առանցքից) դրական գծային հարաբերություն կա . Եթե ​​ռեգրեսիայի գիծը անցնում է գծի վերին եզրին գրաֆիկի եզրափակիչում (առանցք), իսկ գծի ստորին վերջը `գրաֆի դաշտի ներքեւում, դեպի խտրականության (առանցքի) դեպի բացասական գծային հարաբերություն գոյություն ունի:

Հաշվարկված գծային ռեգրեսիայի հավասարություն

Եթե բնակչության պարամետրերը հայտնի էին, պարզ գծային ռեգրեսիոն հավասարումը (ստորեւ նշված) կարող է օգտագործվել y- ի միջին արժեքը x- ի հայտնի արժեքի համար:

Ε ( y ) = ( β 0 + β 1 x ):

Այնուամենայնիվ, գործնականում պարամետրային արժեքները հայտնի չեն, ուստի դրանք պետք է գնահատվեն `օգտագործելով բնակչության նմուշից ստացված տվյալները: Բնակչության պարամետրերը գնահատվում են ընտրանքային վիճակագրության միջոցով : Ընտրանքի վիճակագրությունը ներկայացված է b 0 + b- ով: 1. Երբ ընտրանքի վիճակագրությունը փոխարինվում է բնակչության պարամետրերի համար, ձեւավորվում է հաշվարկված ռեգրեսիոն հավասարումը:

Գնահատված ռեգրեսիոն հավասարումը ներկայացված է ստորեւ:

( ŷ ) = ( β 0 + β 1 x

( ŷ ) նշվում է գլխարկը :

Պարզեցված պարզ regression հավասարման գրաֆիկը կոչվում է գնահատված ռեգրեսիվ գիծ:

B 0- ը y միջանցք է:

Բ 1-ը լանջ է:

The ŷ ) գնահատված արժեքն է x- ի որոշակի արժեքի համար:

Կարեւոր Նշում. Ռեգրեսիայի վերլուծությունը չի օգտագործվում փոփոխականների միջեւ պատճառահետեւանքային հարաբերությունները մեկնաբանելու համար: Ռեգրեսի վերլուծությունը կարող է ցույց տալ, թե ինչպես են փոփոխականները կապված կամ թե որքանով են փոփոխականները միմյանց հետ կապված :

Այսպիսով, ռեգրեսիայի վերլուծությունը ձգտում է շոշափելի փոխհարաբերություններ հաստատել, որոնք պահանջում են ավելի լավ գիտելիքներ ունեցող հետազոտող:

Նաեւ հայտնի է որպես ` երկկողմանի ռեգրեսիա, ռեգրեսիայի վերլուծություն

Օրինակներ. Ամենափոքր քառակուսի մեթոդը նմուշի տվյալների օգտագործման վիճակագրական կարգ է ` գնահատված ռեգրեսիոն հավասարման արժեքը գտնելու համար: Ամենափոքր քառակուսի մեթոդը առաջարկեց Կառլ Ֆրիդրիխ Գաուսը, որը ծնվել է 1777 թվականին եւ մահացել է 1855 թվականին: Ամենափոքր քառակուսի մեթոդը լայնորեն կիրառվում է:

Աղբյուրները.

Անդերսոն, Դ.Ռ., Sweeney, DJ եւ Williams, TA (2003): Բիզնեսի եւ տնտեսության վիճակագրության հիմնական դրույթները (3-րդ հրատարակություն) Մեյսոն, Օհայո, Southwestern, Thompson Learning.

______. (2010): Բացատրված է. Ռեգրեսիայի վերլուծություն: MIT News- ը:

McIntyre, L. (1994): Օգտագործելով ծխախոտի տվյալները բազմակի ռեգրեսիայի ներածության համար: Վիճակագրության կրթության տեղեկագիր, 2 (1):

Mendenhall, W., եւ Sincich, T. (1992): Տեխնիկական գիտությունների եւ գիտությունների վիճակագրություն (3-րդ հրատարակություն), Նյու Յորք, NY: Dellen Publishing Co.

Պանկենկոն, D. 18.443 Դիմումների վիճակագրությունը, 2006 թ. Աշնանը, Բաժին 14, Պարզ գծային ռեգրեսիան: (Մասաչուսեթսի տեխնոլոգիական ինստիտուտ, MIT OpenCourseWare)