Ang mga istatistika ay matagal nang mahalagang bahagi ng buhay. Nahaharap ang mga tao sa lahat ng dako. Batay sa mga istatistika, ang mga konklusyon ay iginuhit tungkol sa kung saan at anong mga sakit ang karaniwan, kung ano ang higit na hinihiling sa isang partikular na rehiyon o sa isang tiyak na bahagi ng populasyon. Maging ang pagtatayo ng mga programang pampulitika ng mga kandidato para sa mga katawan ng gobyerno ay batay sa istatistikal na datos. Ginagamit din ang mga ito ng mga retail chain kapag bumibili ng mga produkto, at ginagabayan ang mga manufacturer ng data na ito sa kanilang mga panukala.
Ang mga istatistika ay gumaganap ng mahalagang papel sa buhay ng lipunan at nakakaapekto sa bawat indibidwal na miyembro nito, kahit sa maliliit na bagay. Halimbawa, kung ayon sa mga istatistika, mas gusto ng karamihan sa mga tao ang madilim na kulay sa mga damit sa isang partikular na lungsod o rehiyon, kung gayon ang paghahanap ng maliwanag na dilaw na kapote na may floral print sa mga lokal na saksakan ay magiging napakahirap. Ngunit kung ano ang daminagdaragdag ba ang mga data na ito upang magkaroon ng ganoong epekto? Halimbawa, ano ang "makabuluhang istatistika"? Ano nga ba ang ibig sabihin ng kahulugang ito?
Ano ito?
Ang mga istatistika bilang isang agham ay binubuo ng kumbinasyon ng iba't ibang dami at konsepto. Isa na rito ang konsepto ng "statistical significance". Ito ang pangalan ng halaga ng mga variable, ang posibilidad ng paglitaw ng iba pang mga indicator kung saan ay bale-wala.
Halimbawa, 9 sa 10 tao ang nagsusuot ng rubber shoes sa kanilang mga paa habang naglalakad sa umaga para sa mga mushroom sa kagubatan ng taglagas pagkatapos ng maulan na gabi. Ang posibilidad na sa isang punto 8 sa kanila ay nakasuot ng canvas moccasins ay bale-wala. Kaya, sa partikular na halimbawang ito, ang numero 9 ay tinatawag na “statistical significance.”
Ayon, kung bubuuin pa natin ang ibinigay na praktikal na halimbawa, ang mga tindahan ng sapatos ay bumibili ng rubber boots sa pagtatapos ng summer season sa mas maraming dami kaysa sa iba pang panahon ng taon. Kaya, ang laki ng istatistikal na halaga ay may epekto sa ordinaryong buhay.
Siyempre, sa mga kumplikadong kalkulasyon, sabihin, kapag hinuhulaan ang pagkalat ng mga virus, isang malaking bilang ng mga variable ang isinasaalang-alang. Ngunit ang pinakadiwa ng pagtukoy ng makabuluhang indicator ng istatistikal na data ay magkatulad, anuman ang pagiging kumplikado ng mga kalkulasyon at ang bilang ng mga variable na halaga.
Paano ito kinakalkula?
Ginamit kapag kinakalkula ang halaga ng indicator ng "statistical significance" ng equation. Iyon ay, maaari itong maitalo na sa kasong ito ang lahat ay napagpasyahan ng matematika. Ang pinakasimpleng opsyon sa pagkalkula ay isang hanay ng mga mathematical operations, kung saan ang mga sumusunod na parameter ay kasangkot:
- dalawang uri ng mga resultang nakuha mula sa mga survey o pag-aaral ng layunin ng data, gaya ng halaga ng mga binili, na tinutukoy ng a at b;
- tagapahiwatig ng laki ng sample para sa parehong pangkat – n;
- halaga ng pinagsamang bahagi ng sample - p;
- karaniwang error - SE.
Ang susunod na hakbang ay upang matukoy ang kabuuang marka ng pagsusulit - t, ang halaga nito ay inihambing sa bilang na 1.96. Ang 1.96 ay ang average na halaga, na nagbibigay ng saklaw na 95%, ayon sa t-distribution function ng Mag-aaral.
Ang tanong ay madalas na lumitaw kung ano ang pagkakaiba sa pagitan ng mga halaga ng n at p. Ang nuance na ito ay madaling linawin sa isang halimbawa. Sabihin nating kinakalkula ang istatistikal na kahalagahan ng katapatan sa anumang produkto o tatak ng kalalakihan at kababaihan.
Sa kasong ito, ang mga titik ay susundan ng sumusunod:
- n - bilang ng mga respondent;
- p - bilang ng nasiyahan sa produkto.
Ang bilang ng mga nakapanayam na kababaihan sa kasong ito ay itatalaga bilang n1. Alinsunod dito, ang mga lalaki - n2. Ang parehong halaga ay magkakaroon ng mga numerong "1" at "2" ng simbolong p.
Ang paghahambing ng marka ng pagsusulit sa average ng mga spreadsheet ng Mag-aaral ay nagiging tinatawag na "statistical significance".
Ano ang ibig sabihin ng pag-verify?
Ang mga resulta ng anumang mathematical na pagkalkula ay palaging masusuri, ito ay itinuturo sa mga bata sa elementarya. Ito ay lohikal na ipagpalagayna dahil natutukoy ang mga istatistika gamit ang hanay ng mga kalkulasyon, susuriin ang mga ito.
Gayunpaman, ang pagsubok para sa istatistikal na kahalagahan ay hindi lamang matematika. Ang mga istatistika ay tumatalakay sa isang malaking bilang ng mga variable at iba't ibang mga probabilidad, na malayo mula sa palaging katanggap-tanggap sa pagkalkula. Iyon ay, kung babalik tayo sa halimbawa ng mga sapatos na goma sa simula ng artikulo, kung gayon ang lohikal na pagtatayo ng data ng istatistika na maaasahan ng mga mamimili ng mga kalakal para sa mga tindahan ay maaaring magambala ng tuyo at mainit na panahon, na hindi karaniwan para sa taglagas.. Bilang resulta ng hindi pangkaraniwang bagay na ito, ang bilang ng mga tao na bibili ng rubber boots ay bababa at ang mga outlet ay magdaranas ng pagkalugi. Siyempre, hindi mahuhulaan ng isang mathematical formula ang isang anomalya sa panahon. Ang sandaling ito ay tinatawag na “pagkakamali”.
Iyon lang ang posibilidad ng mga naturang error at isinasaalang-alang ang pagsusuri sa antas ng nakalkulang kahalagahan. Isinasaalang-alang nito ang parehong mga kalkuladong indicator at tinatanggap na antas ng kahalagahan, gayundin ang mga dami na karaniwang tinatawag na hypotheses.
Ano ang antas ng kahalagahan?
Ang konsepto ng "antas" ay kasama sa pangunahing pamantayan para sa istatistikal na kahalagahan. Ginagamit ito sa mga inilapat at praktikal na istatistika. Isa itong uri ng halaga na isinasaalang-alang ang posibilidad ng mga posibleng paglihis o pagkakamali.
Ang antas ay batay sa pagkakakilanlan ng mga pagkakaiba sa mga yari na sample, nagbibigay-daan ito sa iyong itatag ang kanilang kahalagahan o, sa kabaligtaran, randomness. Ang konseptong ito ay hindi lamang mga digital na kahulugan, kundi pati na rin ang kanilang mga kakaibang interpretasyon. Nagpapaliwanag silakung paano mo kailangang maunawaan ang halaga, at ang antas mismo ay tinutukoy sa pamamagitan ng paghahambing ng resulta sa average na index, ipinapakita nito ang antas ng pagiging maaasahan ng mga pagkakaiba.
Kaya, maaari nating isipin ang konsepto ng isang antas nang simple - ito ay isang tagapagpahiwatig ng isang katanggap-tanggap, malamang na pagkakamali o pagkakamali sa mga konklusyong nakuha mula sa nakuhang istatistikal na data.
Anong mga antas ng kahalagahan ang ginagamit?
Ang istatistikal na kahalagahan ng error probability coefficient sa pagsasanay ay nakabatay sa tatlong pangunahing antas.
Ang unang antas ay ang threshold kung saan ang halaga ay 5%. Iyon ay, ang posibilidad ng pagkakamali ay hindi lalampas sa antas ng kahalagahan na 5%. Nangangahulugan ito na ang kumpiyansa sa impeccability at infallibility ng mga konklusyong ginawa batay sa istatistikal na data ng pananaliksik ay 95%.
Ang pangalawang antas ay ang 1% na threshold. Alinsunod dito, ang figure na ito ay nangangahulugan na ang isang tao ay maaaring magabayan ng data na nakuha sa panahon ng mga istatistikal na pagkalkula na may 99% kumpiyansa.
Ikatlong antas - 0.1%. Sa halagang ito, ang posibilidad ng isang error ay katumbas ng isang fraction ng isang porsyento, iyon ay, ang mga error ay halos inaalis.
Ano ang hypothesis sa mga istatistika?
Ang mga error bilang isang konsepto ay nahahati sa dalawang bahagi, tungkol sa pagtanggap o pagtanggi sa null hypothesis. Ang hypothesis ay isang konsepto sa likod kung saan, ayon sa kahulugan, isang set ng mga resulta ng survey, iba pang data o mga pahayag ay nakatago. Ibig sabihin, isang paglalarawan ng probability distribution ng isang bagay na nauugnay sa paksa ng statistical accounting.
May dalawang hypotheses sa mga simpleng kalkulasyon - zero at alternatibo. Ang pagkakaiba sa pagitan ng mga ito ay ang null hypothesis ay batay sa ideya na walang mga pangunahing pagkakaiba sa pagitan ng mga sample na kasangkot sa pagtukoy ng istatistikal na kahalagahan, at ang kahalili ay ganap na kabaligtaran dito. Ibig sabihin, ang alternatibong hypothesis ay batay sa pagkakaroon ng makabuluhang pagkakaiba sa mga sample na ito.
Ano ang mga pagkakamali?
Ang mga error bilang isang konsepto sa mga istatistika ay nasa direktang proporsyon sa pagtanggap ng ito o ang hypothesis na iyon bilang totoo. Maaaring hatiin ang mga ito sa dalawang direksyon o uri:
- ang unang uri ay dahil sa pagtanggap ng null hypothesis, na naging mali;
- segundo - sanhi ng pagsunod sa alternatibo.
Ang unang uri ng error ay tinatawag na false positive at medyo karaniwan sa lahat ng lugar kung saan ginagamit ang mga istatistika. Alinsunod dito, ang error ng pangalawang uri ay tinatawag na false negative.
Bakit kailangan natin ng regression sa mga istatistika?
Ang istatistikal na kahalagahan ng regression ay na sa tulong nito ay posible na maitaguyod kung gaano kalaki ang modelo ng iba't ibang dependency na kinakalkula batay sa data na tumutugma sa katotohanan; nagbibigay-daan sa iyong tukuyin ang kasapatan o kakulangan ng mga salik para sa accounting at mga konklusyon.
Ang halaga ng regression ay tinutukoy sa pamamagitan ng paghahambing ng mga resulta sa data na nakalista sa mga talahanayan ng Fisher. O gamit ang pagsusuri ng pagkakaiba. Ang mga tagapagpahiwatig ng pagbabalik ay mahalaga kapagkumplikadong istatistikal na pag-aaral at kalkulasyon na kinasasangkutan ng malaking bilang ng mga variable, random na data at posibleng pagbabago.