Описательной или дескриптивной статистикой называется раздел статистики, занимающаяся описанием и систематизацией выборочных данных. Выборка — это набор значений некоторой переменной по результатам наблюдений (размер ежегодной инфляции или доходность какой акции).

Распределением вероятности такой переменной называется совокупность значений, которые она принимает, и вероятность каждого из этих значений. Если мы берем некоторую выборку, то совокупность результатов наблюдений и частоты каждого из этих значений частотной выборке.

Уровень инфляции

Рассмотрим выборку годовых инфляций 5,2%, 4,6%, 3,5%, 2,9%, 4,2%, 5,7%, 25,3%, 12,6%, 7,4%, 4,6%

Мерами центральной тенденции есть такие измерители, которые сводят всю совокупность данных к одному числу. Примером является арифметическое среднее или просто среднее — сумма выборочных значений, деленная на их количество. В нашем случае оно равно 7,6%. Смысл его прост: за 10 лет инфляция была разной, но в среднем она составляла 7,6%. В нашем случае все наблюдения имеют равную вероятность. Если они были бы разными, то среднее рассчитывалось бы сумма произведений каждого значения на его вероятность.

Арифметическое среднее чувствителен к нетипичным значений. В нашей избиратели одного года инфляция составила 25,3%, значительно больше, чем обычно. Если убрать этот год, то сразу среднее упадет до 5,63%. Следовательно, при наличии нетипично больших положительных или отрицательных значений среднее сдвигается в их сторону. Выборка при наличии таких значений называется асимметричной (skewed).

Арифметическое среднее не показывают изменение стоимости во времени. Так, если вы имели 100 гривен на начало первого года с приведенной инфляционной выборки, то эквивалентная сумма на конец десятого года составляла бы 204 гривны 58 копеек. Но если вы возьмете ставку сложного процента 7,6% годовых и положите 100 гривен на такой срок, то эта сумма возрастет до 208 гривен 3 копеек. Разница возникает вследствие того, что формула сложного процента содержит произведение, а не сумму ежегодных значений. Мера, рассчитывается по произведением, а не по сумме, называется геометрическим средним. В нашем случае мы умножаем выражения единица плюс значение инфляции, потом добываем корень степени, что соответствует количеству измерений, и с этого вычитаем единицу. Для нашей выборки геометрическое среднее минус один составляет 7,42%. Если положить 100 гривен на 10 лет именно под такой процент, мы получим 204 гривны 58 копеек.

Медианой называется такое значение, что половина выборки меньше его, а половина — больше. Для того, чтобы ее подсчитать, отсортируем нашу выборку по возрастанию значений: 2,9%, 3,5%, 4,2%, 4,6%, 4,6%, 5,2%, 5,7%, 7 4%, 12,6%, 25,3%. Если в выборке было бы нечетное количество значений, медиана равна бы значению посередине нее. Поскольку у нас 10 значений, то середина находится между 4,6% и 5,2%, следовательно, медиана равна среднему из этих значений, то есть 4,9%. В отличие от среднего, медиана не является чувствительной к нетипичным значений — если мы отбросим значение 25,3%, то медиана выборки, останется, равно 4,6%.

Модой называется значение, которое является наиболее вероятным, то есть чаще других встречается в выборке. В нашем случае, значение 4,6% встречается дважды, значит, оно и будет модой.