Название реферата: Введение с статистику
Раздел: Статистика
Скачано с сайта: www.newreferat.com
Дата размещения: 05.01.2011
Введение с статистику
Введение
Стояла задача провести статистический анализ и сравнить положение двух фирм на рынке. Для этого было произведено статистическое наблюдение.
Статистическое наблюдение – это начальная стадия экономико-статистического исследования, которая представляет собой научно-организованную работу по получению первичных данных о явлениях и процессах общественной жизни с помощью оценки и регистрации признаков изучаемой совокупности.
Для этого взяли данные (цены акций на торгах и объем торгов) двух фирм и занесли их в таблицу.
Сводка статистических данных – вторая стадия статистического исследования; систематизация единичных фактов, позволяющая перейти к обобщающим показателям, относящаяся ко всей изучаемой совокупности, осуществить анализ и прогнозирование изучаемых явлений и процессов.
Статистическая таблица – это способ рационального изложения и обобщения данных о социально-экономических явлениях при помощи цифр, расположенных в определенном порядке. Таблица имеет подлежащее – характеризует объект исследования, в нем дается перечень единиц совокупности либо групп исследуемого объекта по каким-либо существенным признакам, и сказуемое – система показателей, которая характеризует объект исследования.
Группировка – распределение единиц изучаемого объекта на однородные типичные группы по существенным для них признакам.
Интервал – значение варьирующего признака, лежащий в определенных границах. Может быть закрытым и открытым.
Ряд распределения – это упорядоченное распределение единиц совокупности по определенному варьирующему признаку.
Вариационный ряд распределения – ряд по количественному признаку.
Интервальный ряд распределения – отражает непрерывную вариацию признака.
Формула Стерджесса: i = R/n R = xmax - xmin n = 1+3,322lgN
i – размер интервала
R – размах вариации
x – варьирующий признак
n – количество групп
N – количество наблюдений
И с помощью этой формулы был посчитан размер интервала и сделан интервальный ряд распределения.
Далее статистические данные представили графическим методом.
Графиками в статистике называют условные изображения числовых величин и их соотношение в виде различных графических образов, точек, линий, плоских фигур и т.д.
Линейные диаграммы широко применяются для характеристики изменения явлений во времени, пространстве или для характеристики связи между явлениями.
Для изображения интервальных рядов используется гистограмма распределения – столбиковая диаграмма, ширина которой равна интервалу в интервальном ряду.
Соединяя середины вершин столбиков гистограммы, получим полигон распределения.
В ряде случаев для изображения вариационных рядов используется кумулятивная кривая (кумулята). Для ее построения, значения варьирующего признака откладывается на оси абсцисс, а на оси ординат помещаются накопленные итоги частот. Если отложить наоборот, то график будет называться огива.
Средний показатель – средняя величина – обобщенная количественная характеристика признаков статистической совокупности в конкретных условиях места и времени.
Из средних величин наиболее часто встречаются:
- средняя арифметическая простая:`c = Sci / n
(расчет по несгруппированным данным)
- средняя арифметическая взвешенная: `c = Sci fi / Sfi
ci - отдельные значения признака, варианты
fi - веса каждого варианта
Рассчитываем по вариационному ряду и по интервальному ряду распределения среднюю взвешенную величину.
Различие индивидуальных значений признака внутри изучаемой совокупности в статистике называется вариацией признака. Она возникает в результате того, что его индивидуальные значения складываются под совокупным влиянием разнообразных факторов, которые по-разному сочетаются в каждом отдельном случае.
Размах вариации – это разность между максимальным и минимальным значениями признака.
Дисперсия – это средняя величина квадратов отклонений от среднего.
Среднее квадратическое отклонение – обобщающая характеристика размеров вариации признаков совокупности, выражается в тех же единицах, что и сам признак.
s2 = S(ci -`c)2 / n
Для сравнения вариации в разных совокупностях рассчитывается относительный показатель вариации, именуемый коэффициентом вариации, представляющий собой процентное отношение среднего квадратического отклонения к средней арифметической:
V = s /`c *100%
Совокупность считается однородной, если коэффициент вариации не превышает 33%.
Наряду с рассмотренными в качестве характеристик вариационного ряда распределения, рассчитываются структурные средние.
Мода [Мо] – значение изучаемого признака, повторяющееся с наибольшей частотой.
Медиана [Me] – значение признака, приходящееся на середину ранжированной, т.е. упорядоченной совокупности.
fMo - fMo-1
Mo = x0 + i (fMo – fMo-1) + (fMo – fMo+1)
x0 – нижняя граница модального интервала
i – величина интервала
fМо – частота (встречаемость) модального интервала
fМо-1 – частота, предшествующая модальному интервалу
fMo+1 – частота последующего модального интервала
½S fi – SMe-1
Me = x0 + i fMe
x0 – нижняя граница медианного интервала
i – величина интервала
SMe-1 – накопленная частота интервала, предшествующая медианному
1/2S fi – половина суммы все накопленных частот
fMe – частота медианного интервала
Одной из целей изучения статистических вариационных рядов является выявление закономерности распределения и определение ее характера.
Закономерности распределения выражают свойства явления, а так же общие условия, влияющие на формирование вариации признака.
При сравнительном изучении симметрии нескольких распределений с разными единицами измерения вычисляют относительный показатель асимметрии.
As = m3 / s3 As = (`x – Mo) / s As = S(xi -`x)3 / s3
Асимметрия характеризует «скошенность» распределения. Когда длинная часть распределения лежит справа от центра, тогда m3 будет положительным, так как взвешенная сумма кубов больших положительных отклонений превысит сумму кубов отрицательных отклонений, в противном случае – отрицательным.
Эксцесс характеризует «крутость», т.е. островершинность или плосковершинность распределения. Для нормального закона Es = 0. Более островершинные – положительный эксцесс, Более плосковершинный – отрицательный эксцесс. Это количество вариант, лежащих в интервале равном ½ среднеквадратического отклонения в ту или иную сторону от величины средней в общем количестве вариант данного ряда.
Предположили, что имеющиеся две фирмы связаны.
При исследовании социально-экономических явлений часто приходится иметь дело со взаимосвязанными показателями.
Регрессия – односторонняя статистическая зависимость.
Функциональная связь – это вид причинной зависимости, при которой определенному значению факторного признака соответствует одно или несколько точно заданных значений результативного признака.
Стохастическая связь – это вид причинной зависимости, проявляющейся не в каждом отдельном случае, а в общем, в среднем, при большом числе наблюдений.
Корреляция – взаимное влияние статистических факторов – стохастическая зависимость между случайными величинами не имеющую строгого функционального характера, при котором изменение одной из случайных величин приводит к изменению другой.
Корреляционный анализ имеет своей задачей количественное определение тесноты связей между двумя признаками при парной связи и между несколькими факторами при многофакторной связи.
Коэффициент корреляции представляет количественную характеристику тесноты связи между признаками. Дает возможность определить полезность факторных признаков, в случае если строится уравнение регрессии.
Регрессионный анализ заключается в определении аналитического выражения связи, в которой изменение одной величины, называемой зависимой или результативным признаком, обусловлена влиянием одной или нескольких независимых величин или факторов; а множество всех прочих факторов, также оказываемые влияние на зависимую величину, принимаются за постоянные и средние значения.
Корреляционно-регрессионный анализ как общее понятие включает в себя измерение тесноты, направление связи и установление аналитического выражения формы связи.
Рядом динамики называется временная последовательность значений статистических показателей.
Основной тенденцией изменения ряда динамики называется тренд – долговременная компонента ряда динамики, она характеризует основную тенденцию его развития.
Наиболее эффективным способом выявления основной тенденции развития является аналитическое выравнивание.
Методы анализа основных тенденций:
1. Сглаживание или механическое выравнивание
2. Выравнивание с применением кривой, проведенной между конкретным уравнением таким образом, чтобы она отображала тенденцию, присущую ряду.
Рассчитываем и строим линии тренда для двух фирм.
Метод скользящей средней.
При выявлении тенденции развития этим методом по-особому укрупняются интервалы времени: вместо каждого уровня данного ряда берутся средние из уровней рядом стоящих лет.
Полученная средняя охватывает группу из некоторого числа уровней: трех, пяти, семи и т. д., в середине которой находится взятый. Вместо каждого такого уровня берется средняя, в которой сглаживаются случайные отклонения. Эта средняя будет скользящей, поскольку период осреднения все время меняется: из него вычитается один член и прибавляется следующий.
В данных, полученных методом скользящих средних, устраняется часть колебаний уровней динамического ряда и их величины становятся более плавными по сравнению с фактическими уровнями.
При применении метода скользящей средней большое значение имеет выбор периода или интервала скольжения. Он должен соответствовать периоду колебаний в данном динамическом ряду.
Заключение
Было произведено статистическое исследование двух фирм, создан интервальный ряд распределения, данные представили в виде графиков (гистограмма, полигон, кумулята, огива). Эти графики получились похожими.
Подсчитан средний показатель, т.е. средняя взвешенная величина и среднее квадратическое отклонение. Для цен закрытия совокупность получилась однородной, а для объемов торгов неоднородной.
Произвели расчеты моды и медианы, а также нашли относительный показатель асимметрии и проверили эксцесс с помощью «правила трех сигм». После предположения о взаимосвязи двух фирм, посчитали коэффициент регрессии и корреляции, как и должно быть, они получились одинаковых знаков.
Построили линию тренда по старым и новым ценам. Построили скользящее среднее. Совпадение получилось качественным, а не количественным.