Централна гранична теорема (CLT): Какво представлява и как работи

CLT е статистическо допускане, че при достатъчно голям размер на извадката от популация с ограничено ниво на дисперсия, средната стойност на всички променливи, взети в извадка от една и съща популация, ще бъде приблизително равна на средната за цялата популация. Съгласно теоремата за централната граница, средната стойност на извадка от данни ще се доближава до средната стойност на цялата въпросна съвкупност с увеличаване на размера на извадката, независимо от действителното разпределение на данните. Нека да разгледаме какво представлява централната гранична теорема, за какво служи и нейните ключови компоненти. 

Какво представлява централната гранична теорема (CLT)

В теорията на вероятностите, централната гранична теорема (CLT) гласи, че разпределението на променливата на извадката се доближава до нормално разпределение (т.е. "камбанообразна крива"), когато размерът на извадката се увеличава, като се приеме, че всички извадки са идентични по размер и независимо от действителната форма на разпределението на населението. С други думи, CLT е статистическо предположение, че при достатъчно голям размер на извадката от популация с крайно ниво на дисперсия, средната стойност на всички променливи, взети от една и съща популация, ще бъде приблизително равна на средната за цялата популация. Освен това, тези проби се доближават до нормално разпределение и техните дисперсии са приблизително равни на дисперсията на съвкупността с увеличаване на размера на извадката, съгласно закона за големите числа. Въпреки че тази концепция е разработена за първи път от Абрахам дьо Моавър през 1733 г., тя не е формализирана до 1920 г., когато известният унгарски математик Джордж Поля я нарича централна гранична теорема.

формули

Формула на централната гранична теорема. Източник: Inchcalculator.com.

За какво е централната гранична теорема (CLT)?

Съгласно теоремата за централната граница, средната стойност на извадка от данни ще се доближава до средната стойност на цялата въпросна съвкупност с увеличаване на размера на извадката, независимо от действителното разпределение на данните. С други думи, данните са точни, независимо дали разпределението е нормално или анормално. Като общо правило, размер на извадката между 30 и 50 се счита за достатъчен, за да бъде изпълнен CLT, което означава, че разпределението на средните стойности на извадката е сравнително нормално. Следователно, колкото повече проби се вземат, толкова повече резултатите ще приличат на нормално разпределение. Обърнете внимание обаче, че централната гранична теорема все още ще бъде приближена в много случаи за много по-малки размери на извадката, като n=8 on=5.3

графики

Илюстрация на централната гранична теорема за изкривена популация от стойности. Източник: ResearchGate

Ключови компоненти на централната гранична теорема

Централната гранична теорема се състои от няколко ключови характеристики. Тези характеристики до голяма степен се въртят около извадките, размера на извадката и съвкупността от данни.

  1. Пробовземането е последователно. Това означава, че някои примерни единици са общи с примерни единици, избрани в предишни случаи.
  2. Извадката е произволна. Всички проби трябва да бъдат избрани на случаен принцип, така че да имат еднакъв статистически шанс да бъдат избрани.
  3. Пробите трябва да са независими. Изборите или резултатите от една проба не трябва да оказват влияние върху бъдещите проби или резултатите от други проби.
  4. Пробите трябва да бъдат ограничени. Често се казва, че пробата не трябва да надвишава 10% от популацията, ако вземането на проби се извършва без замяна. Като цяло по-големите размери на популацията оправдават използването на по-големи размери на извадката.
  5. Размерът на извадката се увеличава. Централната гранична теорема става релевантна, когато се избират повече проби.

Оставете вашия коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *

*

*

  1. Отговорен за данните: Мигел Анхел Гатон
  2. Предназначение на данните: Контрол на СПАМ, управление на коментари.
  3. Легитимация: Вашето съгласие
  4. Съобщаване на данните: Данните няма да бъдат съобщени на трети страни, освен по законово задължение.
  5. Съхранение на данни: База данни, хоствана от Occentus Networks (ЕС)
  6. Права: По всяко време можете да ограничите, възстановите и изтриете информацията си.