Название реферата: Введение с статистику
Раздел: Статистика
Скачано с сайта: www.newreferat.com
Дата размещения: 05.01.2011

Введение с статистику

Введение

Стояла задача провести статистический анализ и сравнить положение двух фирм на рынке. Для этого было произведено статистическое наблюдение.

Статистическое наблюдение – это начальная стадия экономико-статистического исследования, которая представляет собой научно-организованную работу по получению первичных данных о явлениях и процессах общественной жизни с помощью оценки и регистрации признаков изучаемой совокупности.

Для этого взяли данные (цены акций на торгах и объем торгов) двух фирм и занесли их в таблицу.

Сводка статистических данных – вторая стадия статистического исследования; систематизация единичных фактов, позволяющая перейти к обобщающим показателям, относящаяся ко всей изучаемой совокупности, осуществить анализ и прогнозирование изучаемых явлений и процессов.

Статистическая таблица – это способ рационального изложения и обобщения данных о социально-экономических явлениях при помощи цифр, расположенных в определенном порядке. Таблица имеет подлежащее – характеризует объект исследования, в нем дается перечень единиц совокупности либо групп исследуемого объекта по каким-либо существенным признакам, и сказуемое – система показателей, которая характеризует объект исследования.

Группировка – распределение единиц изучаемого объекта на однородные типичные группы по существенным для них признакам.

Интервал – значение варьирующего признака, лежащий в определенных границах. Может быть закрытым и открытым.

Ряд распределения – это упорядоченное распределение единиц совокупности по определенному варьирующему признаку.

Вариационный ряд распределения – ряд по количественному признаку.

Интервальный ряд распределения – отражает непрерывную вариацию признака.

Формула Стерджесса: i = R/n R = xmax - xmin n = 1+3,322lgN

i – размер интервала

R – размах вариации

x – варьирующий признак

n – количество групп

N – количество наблюдений

И с помощью этой формулы был посчитан размер интервала и сделан интервальный ряд распределения.

Далее статистические данные представили графическим методом.

Графиками в статистике называют условные изображения числовых величин и их соотношение в виде различных графических образов, точек, линий, плоских фигур и т.д.

Линейные диаграммы широко применяются для характеристики изменения явлений во времени, пространстве или для характеристики связи между явлениями.

Для изображения интервальных рядов используется гистограмма распределения – столбиковая диаграмма, ширина которой равна интервалу в интервальном ряду.

Соединяя середины вершин столбиков гистограммы, получим полигон распределения.

В ряде случаев для изображения вариационных рядов используется кумулятивная кривая (кумулята). Для ее построения, значения варьирующего признака откладывается на оси абсцисс, а на оси ординат помещаются накопленные итоги частот. Если отложить наоборот, то график будет называться огива.

Средний показатель – средняя величина – обобщенная количественная характеристика признаков статистической совокупности в конкретных условиях места и времени.

Из средних величин наиболее часто встречаются:

- средняя арифметическая простая:`c = Sci / n

(расчет по несгруппированным данным)

- средняя арифметическая взвешенная: `c = Sci fi / Sfi

ci - отдельные значения признака, варианты

fi - веса каждого варианта

Рассчитываем по вариационному ряду и по интервальному ряду распределения среднюю взвешенную величину.

Различие индивидуальных значений признака внутри изучаемой совокупности в статистике называется вариацией признака. Она возникает в результате того, что его индивидуальные значения складываются под совокупным влиянием разнообразных факторов, которые по-разному сочетаются в каждом отдельном случае.

Размах вариации – это разность между максимальным и минимальным значениями признака.

Дисперсия – это средняя величина квадратов отклонений от среднего.

Среднее квадратическое отклонение – обобщающая характеристика размеров вариации признаков совокупности, выражается в тех же единицах, что и сам признак.

s2 = S(ci -`c)2 / n

Для сравнения вариации в разных совокупностях рассчитывается относительный показатель вариации, именуемый коэффициентом вариации, представляющий собой процентное отношение среднего квадратического отклонения к средней арифметической:

V = s /`c *100%

Совокупность считается однородной, если коэффициент вариации не превышает 33%.

Наряду с рассмотренными в качестве характеристик вариационного ряда распределения, рассчитываются структурные средние.

Мода [Мо] – значение изучаемого признака, повторяющееся с наибольшей частотой.

Медиана [Me] – значение признака, приходящееся на середину ранжированной, т.е. упорядоченной совокупности.

fMo - fMo-1

Mo = x0 + i (fMo – fMo-1) + (fMo – fMo+1)

x0 – нижняя граница модального интервала

i – величина интервала

fМо – частота (встречаемость) модального интервала

fМо-1 – частота, предшествующая модальному интервалу

fMo+1 – частота последующего модального интервала

½S fi – SMe-1

Me = x0 + i fMe

x0 – нижняя граница медианного интервала

i – величина интервала

SMe-1 – накопленная частота интервала, предшествующая медианному

1/2S fi – половина суммы все накопленных частот

fMe – частота медианного интервала

Одной из целей изучения статистических вариационных рядов является выявление закономерности распределения и определение ее характера.

Закономерности распределения выражают свойства явления, а так же общие условия, влияющие на формирование вариации признака.

При сравнительном изучении симметрии нескольких распределений с разными единицами измерения вычисляют относительный показатель асимметрии.

As = m3 / s3 As = (`x – Mo) / s As = S(xi -`x)3 / s3

Асимметрия характеризует «скошенность» распределения. Когда длинная часть распределения лежит справа от центра, тогда m3 будет положительным, так как взвешенная сумма кубов больших положительных отклонений превысит сумму кубов отрицательных отклонений, в противном случае – отрицательным.

Эксцесс характеризует «крутость», т.е. островершинность или плосковершинность распределения. Для нормального закона Es = 0. Более островершинные – положительный эксцесс, Более плосковершинный – отрицательный эксцесс. Это количество вариант, лежащих в интервале равном ½ среднеквадратического отклонения в ту или иную сторону от величины средней в общем количестве вариант данного ряда.

Предположили, что имеющиеся две фирмы связаны.

При исследовании социально-экономических явлений часто приходится иметь дело со взаимосвязанными показателями.

Регрессия – односторонняя статистическая зависимость.

Функциональная связь – это вид причинной зависимости, при которой определенному значению факторного признака соответствует одно или несколько точно заданных значений результативного признака.

Стохастическая связь – это вид причинной зависимости, проявляющейся не в каждом отдельном случае, а в общем, в среднем, при большом числе наблюдений.

Корреляция – взаимное влияние статистических факторов – стохастическая зависимость между случайными величинами не имеющую строгого функционального характера, при котором изменение одной из случайных величин приводит к изменению другой.

Корреляционный анализ имеет своей задачей количественное определение тесноты связей между двумя признаками при парной связи и между несколькими факторами при многофакторной связи.

Коэффициент корреляции представляет количественную характеристику тесноты связи между признаками. Дает возможность определить полезность факторных признаков, в случае если строится уравнение регрессии.

Регрессионный анализ заключается в определении аналитического выражения связи, в которой изменение одной величины, называемой зависимой или результативным признаком, обусловлена влиянием одной или нескольких независимых величин или факторов; а множество всех прочих факторов, также оказываемые влияние на зависимую величину, принимаются за постоянные и средние значения.

Корреляционно-регрессионный анализ как общее понятие включает в себя измерение тесноты, направление связи и установление аналитического выражения формы связи.

Рядом динамики называется временная последовательность значений статистических показателей.

Основной тенденцией изменения ряда динамики называется тренд – долговременная компонента ряда динамики, она характеризует основную тенденцию его развития.

Наиболее эффективным способом выявления основной тенденции развития является аналитическое выравнивание.

Методы анализа основных тенденций:

1. Сглаживание или механическое выравнивание

2. Выравнивание с применением кривой, проведенной между конкретным уравнением таким образом, чтобы она отображала тенденцию, присущую ряду.

Рассчитываем и строим линии тренда для двух фирм.

Метод скользящей средней.

При выявлении тенденции развития этим методом по-особому укрупняются интервалы времени: вместо каждого уровня данного ряда берутся средние из уровней рядом стоящих лет.

Полученная средняя охватывает группу из некоторого числа уровней: трех, пяти, семи и т. д., в середине которой находится взятый. Вместо каждого такого уровня берется средняя, в которой сглаживаются случайные отклонения. Эта средняя будет скользящей, поскольку период осреднения все время меняется: из него вычитается один член и прибавляется следующий.

В данных, полученных методом скользящих средних, устраняется часть колебаний уровней динамического ряда и их величины становятся более плавными по сравнению с фактическими уровнями.

При применении метода скользящей средней большое значение имеет выбор периода или интервала скольжения. Он должен соответствовать периоду колебаний в данном динамическом ряду.

Заключение

Было произведено статистическое исследование двух фирм, создан интервальный ряд распределения, данные представили в виде графиков (гистограмма, полигон, кумулята, огива). Эти графики получились похожими.

Подсчитан средний показатель, т.е. средняя взвешенная величина и среднее квадратическое отклонение. Для цен закрытия совокупность получилась однородной, а для объемов торгов неоднородной.

Произвели расчеты моды и медианы, а также нашли относительный показатель асимметрии и проверили эксцесс с помощью «правила трех сигм». После предположения о взаимосвязи двух фирм, посчитали коэффициент регрессии и корреляции, как и должно быть, они получились одинаковых знаков.

Построили линию тренда по старым и новым ценам. Построили скользящее среднее. Совпадение получилось качественным, а не количественным.