Цхи Скуаре (χ2) Статистичка дефиниција
Шта је статистика квадрата?Цхи квадрат ( χ 2 ) статистика је тест који мери како се очекивања упоређују са стварним посматраним подацима (или резултатима модела). Подаци који се користе у прорачуну хи-квадрат статистике морају бити случајни, сирови, међусобно искључиви, изведени из независних варијабли и прикупљени из довољно великог узорка. На пример, резултати бацања новчића 100 пута испуњавају ове критеријуме.
Цхи квадратни тестови се често користе у испитивању хипотеза.
Формула за квадрат Цхи је
χц2 = ∑ (Ои − Еи) 2Егде: ц = степени слободеО = посматрана вредност (е) Е = очекивана вредност (и) \ почетак {поравнање} & \ цхи ^ 2_ц = \ збир \ фрац {(О_и - Е_и) ^ 2} {Е_и} \\ & \ тектбф {где:} \\ & ц = \ текст {степени слободе} \\ & О = \ текст {проматрана вредност (и)} \\ & Е = \ текст {очекивана вредност (с) )} \\ \ крај {поравнано} χц2 = ∑Еи (Ои -Еи) 2 где је: ц = степен слободеО = посматрана вредност (и) Е = очекивана вредност (и)
Шта вам говори статистика о квадратурама?
Постоје две главне врсте четворних тестова: тест независности, који поставља питање односа, попут: "Постоји ли веза између пола и САТ резултата?"; и тест добре исправности, који поставља питање попут "Ако се новчић баци 100 пута, хоће ли доћи 50 пута и реповима 50 пута?"
За ове тестове користе се степени слободе да би се утврдило да ли се одређена нулта хипотеза може одбацити на основу укупног броја променљивих и узорака унутар експеримента.
На пример, када се узму у обзир студенти и избор предмета, вероватноћа узорка од 30 или 40 студената вероватно није довољно велика да би створила значајне податке. Добијање истих или сличних резултата студије коришћењем величине узорка од 400 или 500 студената је тачније.
У другом примеру, размислите о бацању новчића 100 пута. Очекивани резултат бацања правог новчића 100 пута је да ће се главе дићи 50 пута, а репови доћи 50 пута. Стварни резултат може бити да се главе дижу 45 пута, а репови 55 пута. Статистика квадратних цхи показује било какве разлике између очекиваних и стварних резултата.
Кључне Такеаваис
- Цхи квадрат (χ 2 ) статистика је тест који мери како се очекивања упоређују са стварним посматраним подацима.
- Постоје две главне врсте четворних тестова: тест независности података и тестови исправности прилагођености моделу.
- Ови тестови се могу користити за утврђивање да ли се одређена нулта хипотеза може одбацити у испитивању хипотеза.
Пример Цхи квадратног теста
Замислите да је извршена случајна анкета између 2.000 различитих гласача, и мушкараца и жена. Људи који су одговарали класификовани су по полу и по томе да ли су републикански, демократични или независни. Замислите мрежу са ступовима са натписом републиканска, демократска и независна, и два реда на којима су означени мушкарац и жена. Претпоставимо да су подаци од 2.000 испитаника следећи:
Републикански | Демократе | Независна | Укупно | |
Мушки | 400 | 300 | 100 | 800 |
Женско | 500 | 600 | 100 | 1200 |
Укупно | 900 | 900 | 200 | 2000 |
Први корак за израчунавање хи-квадрат статистике је проналазак очекиваних фреквенција. Они се израчунавају за сваку "ћелију" у мрежи. Будући да постоје две категорије рода и три категорије политичког становишта, постоји шест укупно очекиваних учесталости. Формула за очекивану фреквенцију је:
Е (р, ц) = н (р) × ц (р) нигде: р = ред у питањец = ступац у питањун = одговарајући укупни \ почетак {поравнање} & Е (р, ц) = \ фрац {н (р) \ тимес ц (р)} {н} \\ & \ тектбф {где:} \\ & р = \ текст {ред у питању} \\ & ц = \ текст {колона у питању} \\ & н = \ текст {одговара укупно } \\ \ крај {поравнано} Е (р, ц) = нн (р) × ц (р) где је: р = ред у питањец = ступац у питањун = одговарајући укупан број
У овом примјеру, очекиване фреквенције су:
- Е (1, 1) = (900 к 800) / 2, 000 = 360
- Е (1, 2) = (900 к 800) / 2, 000 = 360
- Е (1, 3) = (200 к 800) / 2, 000 = 80
- Е (2, 1) = (900 к 1, 200) / 2, 000 = 540
- Е (2, 2) = (900 к 1, 200) / 2, 000 = 540
- Е (2, 3) = (200 к 1, 200) / 2, 000 = 120
Даље, ове се вредности користе за израчунавање хи-квадрат статистике користећи следећу формулу:
Цхи-квадрат = ∑ [О (р, ц) -Е (р, ц)] 2Е (р, ц) где је: О (р, ц) = посматрани подаци за дати ред и ступац \ почети {поравнато} & \ тект {Цхи-скуаред} = \ сум \ фрац {[О (р, ц) - Е (р, ц)] ^ 2} {Е (р, ц)} \\ & \ тектбф {где:} \\ & О (р, ц) = \ текст {посматрани подаци за дати ред и ступац} \\ \ крај {поравнање} Цхи-квадрат = ∑Е (р, ц) [О (р, ц) -Е (р, ц)] 2 где: О (р, ц) = посматрани подаци за дати ред и ступац
У овом примјеру, израз за сваку посматрану вриједност је:
- О (1, 1) = (400 - 360) 2/360 = 4, 44
- О (1, 2) = (300 - 360) 2/360 = 10
- О (1, 3) = (100 - 80) 2/80 = 5
- О (2, 1) = (500 - 540) 2/540 = 2, 96
- О (2, 2) = (600 - 540) 2/540 = 6, 67
- 0 (2, 3) = (100 - 120) 2/120 = 3, 33
Статистика хи квадрат је тада једнака збиру ове вредности, или 32, 41. Затим можемо погледати табеларну статистичку таблицу цхи-ја да видимо, имајући у виду степене слободе у нашој постави, да ли је резултат статистички значајан или не.
Упоредите инвестиционе рачуне Име добављача Опис Откривање оглашивача × Понуде које се појављују у овој табели су од партнерстава од којих Инвестопедиа прима накнаду.