Վիճակագրական հեռավորություն

Վիճակագրությունում, հավանականությունների տեսությունում և ինֆորմացիայի տեսության մեջ վիճակագրական հեռավորությունը հաշվում է երկու վիճակագրական օբյեկտների միջև հեռավորությունը, որոնք կարող են լինել 2 պատահական փոփոխականներ կամ երկու վիճակագրական բաշխոււմներ կամ նմուշներ, կամ կարող է լինել 2 կետերի միջև հեռավորությունը կամ մեկ կետի և կետերի բազմության կամ ավելի լայն նմուշի միջև հեռավորությունը։

երկու նմուշների միջև հեռավորությունները կարող է ներկայացվել որպես երկու հավանականային բաշխումների միջև հեռավորության չափում, հետևաբար նրանք հավանականային չափերի միջև հիմնական չափերն են։ Երբ վիճակագրական հեռավորությունը չափում է երկու պատահական մեծությունների միջև տարբերությունը, այն կարող է ունենալ վիճակագրական կախվածություն[1], հետևաբար այս հեռավորությունը ուղղակիորեն կապված չեն պատահական չափերի միջև եղած հեռավորության չափին։ Երկու պատահական փոփոխականների միջև հեռավարության չափը կարող է կապված լինել իրենց միջև կախվածության աստիճանի, քան թե իրենց անհատական արժեքների։

Վիճակագրական հեռավորության չափերը հիմնականում մետրիկական չեն և նրանք կարիք չունեն լինելու համաչափ ։ Հեռավորության որոշ տեսակներ վերաբերում են վիճակագրական զուգամիտության։

ՏերմինաբանությունԽմբագրել

Շատ տերմիններ վերաբերում են հեռավորության հետ կապված տարբեր հասկացությունների. Նրանք հաճախ շփոթեցնող ձևի նման են և կարող են օգտագործվել անհամապատասխանաբար հեղինակների և ժամանակի ընթացքում, ազատորեն կամ ճշգրիտ տեխնիկական նշանակությամբ։ Ի հավելում հեռավորության, նմանօրինակ տերմիները՝ դեվիացիան, դիսկրեպացիան, դիսկրիմինացիան և զուգամիտությունը, ներառված են տերմինաբանության մեջ։ Ինֆորմացիոն տեսության տերմինները ներառում են խաչաձև էնտրոպիան, հարաբերրական էտրոպիան, դիսկրիմինացիոն ինֆորմացիան և ինֆորմացիայի հավաքագրումը։

Հեռավորությունը որպես մետրիկաԽմբագրել

ՄետրիկաԽմբագրել

A Մետրիկան X բազմության վրա ֆունկցիա , որը կոչվում է հեռավորության ֆունկցիա, կամ պարզապես հեռավորություն

d : X × XR+ (որտեղ R+ իրական թվերի ոչ բացասական բազմություն է). կամայական x, y, z -երը X,-ից այս ֆունկցիան բավարարում է հետևյալ հատկությունների։

  1. d(x, y) = 0  այն և միայն այն դեպքում, երբ   x = y     (անհատականության շեշտում )
  2. d(x, y) = d(y, x)     (համաչափություն)
  3. d(x, z) ≤ d(x, y) + d(y, z)     (սուբադիտիվություն / եռանկյունաչափական անհավասարություն).

Ընդհանրացված մետրիկաԽմբագրել

Շատ վիճակագրական հեռավորույթուններ մետրիկա չեն,որովհետև նրանք չեն բավարարում մետրիկայի մեկ կամ մի քանի հատկությունների։ Օրինակ պսեվդոմետրիկան խաղտում է դրական որոշյալությունը, քուասիմետրիկան խախտում է համաչափությունը (2)և կիսամետրիկան խախտում է եռանկյունաչափական անհավասարությունը (3)։ Այն վիճակագրական հեռավորությունները, որոնք բավարարում են (1)-ին և (2)-ին վերաբերում են զուգամիտության։

Many statistical distances are not metrics, because they lack one or more properties of proper metrics. For example, pseudometrics violate the "positive definiteness" (alternatively, "identity of indescernibles") property (1 & 2 above); quasimetrics violate the symmetry property (3); and semimetrics violate the triangle inequality (4). Statistical distances that satisfy (1) and (2) are referred to as divergences.

ՕրինակներԽմբագրել

Որոշ կարևոր վիճակագրական հեռավորությունները ներառում են հետևյալ հեռավորությունները.

Այլ մոտեցումներ

ԾանոթագրություններԽմբագրել

  1. Dodge, Y. (2003)—entry for distance

Արտաքին հղումներԽմբագրել