Календарь
Октябрь
Пн   2 9 16 23 30
Вт   3 10 17 24 31
Ср   4 11 18 25  
Чт   5 12 19 26  
Пт   6 13 20 27  
Сб   7 14 21 28  
Вс 1 8 15 22 29  

Статистико-маркетинговое исследование



Скачать: Статистико-маркетинговое исследование

Содержание реферата

Введение

1 Организационн0-экономическая сущность

2 Исходные данные

3 Определение емкости рынка по йогурту в районе № 40

4 Определение емкости рынка по йогурту в районе № 35

   4.1 Выявление зависимости потребления йогурта от описательных признаков

   4.2 Выявление зависимости потребления йогурта от количественных признаков

   4.3 Перенесение среднего потребления на район № 35

5 Расчет доли потребителей с доходом до 1000 руб./мес. В районе № 40

6 Проверка гипотезы о нормальном законе распределения показателя «среднемесячный доход» в районе № 40

Заключение

Введение

Статистика – наука многогранная и необъятная, в том смысле, что невозможно охватить то, что охватила она. Статистика подразделяется на 3 главных направления: общая теория статистики, экономическая статистика и социальная статистика, которые в свою очередь дробятся на отраслевые. В этом обширном списке нашлось место и маркетингу.

Одним из методов статистики является статистическое наблюдение, в которое входит выборочное. Оно, представляет собой один из наиболее широко применяемых видов несплошного наблюдения. Однако наблюдение организовано таким образом, что эта часть отобранных единиц в уменьшенном масштабе репрезентирует всю совокупность.

В последние годы выборочные обследования стали широко применяться в работе органов государственной статистики. Крупные и средние предприятия охватываются сплошным наблюдением за их деятельностью, а наблюдение за деятельностью малых предприятий производится с помощью выборочных обследований.

Применение выборочного наблюдения взамен сплошного дает возможность лучше организовать наблюдение, обеспечивает быстроту проведения наблюдения, приводит к экономии средств и затрат труда на получение и обработку информации. Объективную гарантию репрезентативности полученной выборочной совокупности дает применение соответствующих научно обоснованных способов отбора подлежащих обследованию единиц. В процессе формирования выборочной совокупности должен быть обеспечен строго объективный подход к отбору единиц. Нарушение этого принципа, когда наблюдению подвергаются единицы, отобранные на основании субъективного мнения исследователя, приводит к тому, что результаты такого наблюдения относятся не ко всей генеральной совокупности, а только к той ее части, которая была подвергнута наблюдению.

В сравнении с другими видами несплошных наблюдений преимущество выборочного наблюдения заключается в том, что по результатам этого наблюдения можно оценить искомые параметры генеральной совокупности. Между характеристиками выборочной совокупности и искомыми характеристиками (параметрами) генеральной совокупности, как правило, существует некоторое расхождение, которое называют ошибкой. Общая величина возможной ошибки выборочной характеристики слагается из ошибок двоякого рода: ошибки регистрации и ошибки репрезентативности. Но даже в сумме они не превосходят ошибок регистрации сплошного наблюдения, поэтому выборочное наблюдение более обосновано.

1 Организационн0-экономическая сущность задачи

Смысл задачи состоит в том, чтобы подготовить почву для сбыта продукции (йогурта); узнать, сколько нужно поставить в данный район, и вообще целесообразно ли это делать, т.е. провести маркетинговые исследования в районах. Одна из проблем состоит в том, что в одном из районов не известно потребление данной продукции. Также необходимо определить долю потребителей с определенным доходом (в моем случае до 1000 рублей в месяц) и проверить гипотезу о нормальном распределении дохода среди потребителей района № 40.

2 Исходные данные

Исходные данные для решения задачи помешены в приложении I.

3 Определение емкости рынка по йогурту в районе № 40

Емкость рынка – это то количество продукта (изделия), которое потребители готовы потребить. Чтобы найти емкость рынка в районе, надо найти среднее потребление в районе по выборочной совокупности, перенести ее на генеральную с учетом ошибки и, перемножив среднюю и количество населения в районе, получить емкость рынка по данной продукции.

Вычислим среднее потребление йогурта в первом районе, как взвешенную (вес – количество человек):

Таблица 3.1

Потребление йогурта, кг

Количество человек

0,1

35

0,2

21

0,4

22

0,8

21

0,9

11

Итого

110

Дисперсия по выборочной совокупности:

Так как выборочное наблюдение велось бесповторным методом (каждая отобранная единица не возвращалась обратно, и вероятность попадания отдельных единиц в выборку все время изменялась), то средняя квадратическая ошибка средней рассчитывается с корректировкой на бесповторность, т.е.

,

где s2 – дисперсия признака по генеральной совокупности;

N – объем генеральной совокупности;

n – объем выборочной совокупности.

Так как у нас выборочная совокупность достаточно большая (>100), то в формуле мы можем заменить генеральную дисперсию (s2) на выборочную (S2).

Возьмем коэффициент доверия t =1,96 (доверительная вероятность F=0,95). Тогда предельная ошибка

Среднее потребление йогурта в первом районе будет находится в интервалах:

0,3927-0,0568 £m£ 0,3927+0,0568

0,3359 £m£ 0,4495

Если каждый из каждую границу доверительного интервала среднего потребления умножить на количество человек в районе, то получим границы доверительного интервала емкости рынка по данной продукции (в кг):

33590 £Е£ 44950

4 Определение емкости рынка по йогурту в районе № 35

Для того, чтобы узнать емкость рынка в районе № 35, необходимо перенести среднее потребление из района № 40 в район № 35 и найти в последнем ошибку средней в соответствии с теми признаками, которые оказывают влияние на потребление.

4.1 Выявление зависимости потребления йогурта от описательных признаков

Построим для каждого описательного признака корреляционную таблицу, которая уже при общем знакомстве может дать возможность выдвинуть предположение о наличии или отсутствии связи, а также ее направление.

Построение корреляционной таблицы начнем с группировки значений факторного и результативного признаков. Так как факторный и результативный признаки представлены всего пятью вариантами повторяющихся значений, то достаточно просто выписать эти значения.

Для получения обобщающего показателя, характеризующего тесноту связи между качественными признаками и позволяющего сравнить проявление связи в разных совокупностях, исчисляют коэффициент Пирсона (C) или Чупрова (K):

где j2 – показатель средней квадратической сопряженности, определяемый путем вычитания единицы из суммы отношений квадратов частот каждой клетки корреляционной таблицы к произведению частот соответствующего столбца и строки:

k1 и k2 – число групп по каждому из признаков.

Величина этих коэффициентов колеблется в пределах от 0 до 1, но для того, чтобы принять связь за существенную, необходимо, чтобы С, К > 0,3.

Таблица 4.1

Распределение потребителей по полу и потреблению йогуртов

Группы
 потребителей по полу

Группы потребителей по потреблению йогуртов, кг/мес.

Итого

0,1

0,2

0,4

0,8

Более 0,8

А

1

2

3

4

5

6

ж

17

8

10

9

10

54

м

18

13

12

12

1

56

Итого

35

21

22

21

11

110

 

Þ связь между потреблением йогурта и полом несущественная.

Таблица 4.2

Распределение потребителей по роду занятий и потреблению йогуртов

Группы потребителей по роду занятий

Группы потребителей по потреблению йогуртов, кг/мес.

Итого

0,1

0,2

0,4

0,8

Более 0,8

А

1

2

3

4

5

6

Учащийся

1

1

1

3

Студент

2

1

3

Служащий

11

5

14

7

1

38

Рабочий

13

8

5

7

5

38

Предприниматель

8

6

2

7

5

28

Итого

35

21

22

21

11

110

 

Þ можно сделать вывод о том, что связь между потреблением йогурта и родом занятий существенна.

Таблица 4.3

Распределение потребителей по образованию и потреблению йогуртов

Группы потребителей по образованию

Группы потребителей по потреблению йогуртов, кг/мес.

Итого

0,1

0,2

0,4

0,8

Более 0,8

А

1

2

3

4

5

6

Нет

1

1

1

3

Среднее

5

7

3

1

1

17

Средн. спец

15

7

9

6

3

40

Н/высшее

5

3

5

1

14

Высшее

9

3

9

9

6

36

Итого

35

21

22

21

11

110

 

Þ можно сделать вывод, что связь между образованием потребителя и его потреблением йогурта существенна.

4.2 Выявление зависимости потребления йогурта от количественных признаков

Для предварительного выявления наличия связи и раскрытия ее характера можно применить графический метод. Используя данные об индивидуальных значениях признака-фактора и соответствующих ему значениях результативного признака, можно построить в прямоугольных координатах точечный график («поле корреляции»).

Построим также для каждого количественного признака корреляционную таблицу. Для факторного признака необходимо определить величину интервала. Для этого воспользуемся формулой Стерджесса:

Для доли питания:

Таблица 4.4

Распределение потребителей по доле питания и потреблению йогуртов

Группы потребителей по доле питания, %

Группы потребителей по потреблению йогуртов, кг/мес.

Итого

0,1

0,2

0,4

0,8

Более 0,8

А

1

2

3

4

5

6

Менее 42

2

6

1

3

2

14

42–44

7

1

2

4

2

16

44–46

6

1

8

3

1

19

46–48

7

2

2

3

1

15

48–50

4

3

2

3

1

13

50–52

2

4

1

4

11

52–54

7

1

4

1

13

Более 54

3

2

1

3

9

Итого

35

21

22

21

11

110

В отличии от предыдущей таблицы в следующих взяты интервалы 10, 1000 и 5 для более простой трактовки данных.

Таблица 4.5

Распределение потребителей по возрасту и потреблению йогуртов

Группы потребителей по возрасту, лет

Группы потребителей по потреблению йогуртов, кг/мес.

Итого

0,1

0,2

0,4

0,8

Более 0,8

А

1

2

3

4

5

6

Менее 20

3

3

2

1

2

11

20–30

14

10

7

10

5

46

30–40

12

3

5

12

3

35

40–50

2

5

2

1

10

50–60

3

1

4

Более 60

1

1

2

4

Итого

35

21

22

21

11

110

Таблица 4.6

Распределение потребителей по доходу и потреблению йогуртов

Группы потребителей по доходу, руб.

Группы потребителей по потреблению йогуртов, кг/мес.

Итого

0,1

0,2

0,4

0,8

Более 0,8

А

1

2

3

4

5

6

Менее 1000

15

5

9

29

1000–2000

9

8

9

13

5

44

2000–3000

6

2

3

2

3

16

3000–4000

1

3

3

3

10

4000–5000

3

1

2

6

Более 5000

1

2

1

1

5

Итого

35

21

22

21

11

110

Таблица 4.7

Распределение потребителей по доле ЖКХ и потреблению йогуртов

Группы потребителей по доле ЖКХ, %

Группы потребителей по потреблению йогуртов, кг/мес.

Итого

0,1

0,2

0,4

0,8

Более 0,8

А

1

2

3

4

5

6

Менее 5

18

14

9

17

9

67

5–10

9

5

9

4

2

29

10–15

5

2

4

11

15–20

1

1

Более 20

2

2

Итого

35

21

22

21

11

110

Из рисунков и таблиц можно сделать вывод о том, что потребление не связано линейной зависимостью с каким-либо количественным признаком. Поэтому оценить связь между этими признаками можно лишь с помощью эмпирического корреляционного отношения h:

.

Расчет корреляционного отношения для дохода:

Таблица 4.8

Потребление

Кол-во человек

Средний доход

0,1

35

1665,80

1949360,00

0,2

21

2141,00

1201549,44

0,4

22

1482,64

3865359,39

0,8

21

2389,95

5004147,69

0,9

11

2102,45

442884,71

Итого

110

1901,80

12463301,23

Средний доход по группе:

Межгрупповая дисперсия:

Общая дисперсия:

Корреляционное отношение:

Расчет корреляционного отношения для возраста:

Таблица 4.9

Потребление

Кол-во человек

Средний возраст

0,1

35

32,06

43,97

0,2

21

29,14

67,55

0,4

22

30,50

4,19

0,8

21

33,48

135,47

0,9

11

26,82

186,55

Итого

110

30,94

437,72

Средний доход по группе:

Межгрупповая дисперсия:

Общая дисперсия:

Корреляционное отношение:

Расчет корреляционного отношения для доли питания ( в отличии от возраста и дохода средняя и общая дисперсия взвешиваются доходом, т.к. доли – это вторичный признак):

Таблица 4.10

Потребление

Кол-во человек

Средняя доля питания

0,1

35

46,56

12,90

0,2

21

47,88

10,62

0,4

22

46,99

0,74

0,8

21

47,61

4,04

0,9

11

46,63

3,27

Итого

110

47,17

31,57

qj- вес – доход,  fj вес – количество человек:

Средний доход по группе: 

Межгрупповая дисперсия:

Общая дисперсия: 

Корреляционное отношение:

Расчет корреляционного отношения для доли ЖКХ:

Таблица 4.11

Потребление

Кол-во человек

Средняя доля ЖКХ

0,1

35

3,64

3,88

0,2

21

2,96

2,59

0,4

22

4,10

13,79

0,8

21

2,81

5,17

0,9

11

3,11

0,43

Итого

110

3,31

25,85

qj- вес – доход,  fj вес – количество человек:

Средний доход по группе: 

Межгрупповая дисперсия:

Общая дисперсия: 

Корреляционное отношение:

Для существенности связи факторного и результативного признаков надо чтобы выполнялось следующее условие: h³ 0,5. В моем же случае ни одно корреляционное отношение не превышает даже 0,3, следовательно, связи несущественны.

Если какая-либо связь была бы существенной, то надо было бы построить уравнение регрессии, а перед этим определить тип зависимости (например, y~ =a+bx – линейная зависимость). Для точного определения параметров a иb уравнения регрессии используется метод наименьших квадратов. При применении метода наименьших квадратов для нахождения такой функции, которая наилучшим образом соответствует эмпирическим данным, считается, что сумма квадратов отклонений эмпирических точек теоретической линии регрессии должна быть величиной минимальной.

Критерий метода наименьших квадратов можно записать таким образом:

.

Поскольку не все фактические значения результативного признака лежат на линии регрессии, более справедливо для записи уравнения корреляционной зависимости воспользоваться формулой у = а + + е, где е отражает случайную составляющую вариации результативного признака. Для всей совокупности наблюдаемое значений рассчитывается средняя квадратическая ошибка уравнения регрессии Se, которая представляет собой среднее квадратическое отклонение фактических значений уi, относительно значений, рассчитанных по уравнению регрессии , т.е.

,

где Se - средняя квадратическая ошибка уравнения регрессии;

уi- фактические значения результативного признака, полученные по данным наблюдения;

 - значения результативного признака, рассчитанные по уравнению корреляционной связи и полученные подстановкой значений факторного признака хi в уравнение регрессии y = а+bх;

 т - число параметров в уравнении регрессии.

В данной формуле сумма квадратов отклонений уi от y~i, делится на число степеней свободы (п-т),  поскольку мы связали себя m степенями свободы в оценке теоретических значений результативного признака по уравнению регрессии с т параметрами. В случае линейного уравнения регрессии m=2.

Чем меньше рассеяние эмпирических точек вокруг прямой, тем меньше средняя квадратическая ошибка уравнения. Таким образом, величина Se служит показателем значимости и полезности прямой, выражающей соотношение между двумя признаками.

Средняя квадратическая ошибка уравнения дает возможность в каждом отдельном случае с определенной вероятностью указать, что величина результативного признака окажется в определенном интервале относительно значения, вычисленного по уравнению связи.

Определим доверительные границы для результативного признака, т.е. те границы, в пределах которых с заданной доверительной вероятностью будет находиться теоретическое значение у. Поскольку параметры уравнения регрессии определяются по выборочным данным, являясь функцией наблюденных значений, оценки параметров a и b содержат некоторую погрешность. Дисперсия значения зависимой переменной, определяемой по уравнению линейной зависимости, будет складываться из дисперсии параметра а и дисперсии параметра b.

Зная дисперсию показателя y~ и задаваясь уравнением доверительной вероятности, можно определить доверительные границы результативного признака при  значении факторного признака x0 следующим образом:

где ta – определяется в соответствии с уровнем значимости по t-распределению Стьюдента.

Величина множителя  будет вычисляться для каждого значения x0.С удалением значения факторного признака от своего среднего арифметического значения величина CX0 будет возрастать.

Поскольку параметры уравнения регрессии определяются по выборочным данным, являясь функцией наблюденных значений, оценки параметров а и b содержат некоторую погрешность. Поэтому, как и во всех случаях оценки параметров генеральной совокупности по выборочным данным, возникает задача проверки гипотезы о величине коэффициента регрессии.

4.3 Перенесение среднего потребления на район № 35

Построим сложную группировку по признакам, у которых связь с потреблением существенна (род занятий и образование) (табл.  4.12). Найдем среднее потребление в каждой группе и перенесем его в соответствующую группу во второй район. Коэффициент доверия в группе надо находить по таблице Стьюдента, так как каждая группа представляет собой малую выборку. После этого необходимо найти предельную ошибку в каждой группе потребителей

Dxj= tjSx,

где Sx – средняя ошибкасредней из первого района, t=1,96

и рассчитать предельную ошибку средней для всего района в целом (как взвешенную среднюю, у которой вес – количество человек в группе):

.

Тогда среднее потребление во втором районе находится в интервале:

0,3927-0,0698£m£ 0,3927+0,0698;

0,3229 £m£ 0,4625.

Если каждый из каждую границу доверительного интервала среднего потребления умножить на количество человек в районе (100000 чел.), то получим границы доверительного интервала емкости рынка по данной продукции (в кг):

32290 £ Е£ 46250

5 Расчет доли потребителей с доходом до 1000 руб./мес. В районе № 40

Доля потребителей с доходом до 1000 руб./мес в районе №40:

Доверительные пределы генеральной доли выглядят так:

.

Величина доверительного интервала для генеральной доли зависит от величины предельной ошибки выборки Dp. Чем больше величина предельной ошибки выборки, тем больше величина доверительного интервала и тем, следовательно, ниже точность оценки.

Поскольку величина предельной ошибки выборки равна tm, точность оценки параметров генеральной совокупности будет зависеть от принятого уровня доверительной вероятности и от величины стандартной ошибки выборки.

Средняя ошибка доли для бесповторной выборки:

 (или 4,2 %)

С вероятностью F =0,95можем утверждать, что предельная ошибка доли потребителей с доходом до 1000 руб./мес. в первом районе не превысит 0,0823 (Dр = 1,96Sp)  и доля этих потребителей в генеральной совокупности будет находиться в интервале: 0,1817 £p£ 0,3463.

6 Проверка гипотезы о нормальном законе распределения показателя «среднемесячный доход» в районе № 40

Степень расхождения теоретических и эмпирических частот оценивается с помощью особых показателей – критериев согласия, с помощью которых проверяется гипотеза о законе распределения. Критерии согласия основаны на использовании различных мер расстояний между анализируемым эмпирическим распределением и функцией распределения признака в генеральной совокупности.

Одним из наиболее часто употребляемых критериев согласия является критерий «хи-квадрат» (c2), предложенный К. Пирсоном,

где fj и f`j соответственно частоты эмпирического и теоретического распределений в j-том интервале.

Чем больше разность между наблюдаемыми и теоретическими частотами, тем больше величина критерия Пирсона. Чтобы отличить существенные значения c2 от значений, которые могут возникнуть в результате случайностей выборки, рассчитанное значение критерия сравнивается с табличным значением c2табл при соответствующем числе степеней свободы и заданном уровне значимости. Уровень значимости выбираем таким образом, что Р (c2расч.>c2табл.)= a (величина a принимается равный 0,05 или 0,01).

Определив значение критерия Пирсона по данным конкретной выборки, можно встретиться с такими вариантами:

1) c2расч.>c2табл. , т.е. c2 попадает в критическую область. Это означает, что расхождение между эмпирическими и теоретическими частотами существенно и его нельзя объяснить случайными колебаниями выборочных данных. В таком случае гипотеза о близости эмпирического распределения к нормальному отвергается.

2) c2расч.£c2табл. , т.е. рассчитанный критерий не превышает максимально возможную величину расхождений эмпирических и теоретических частот, которая может возникнуть в силу случайных колебаний выборочных данных. В этом случае гипотеза о близости эмпирического распределения к нормальному не отвергается.

Табличное значение критерия Пирсона определяется при фиксированном уровне значимости и соответствующем числе степеней свободы.

Число степеней свободы равно k-l-1, где l – число условий, которые предполагаются выполненными при вычислении теоретических частот, k –число групп.

Так как при вычислении теоретических частот нормального распределения в качестве оценок генеральной средней и дисперсии используются соответствующие выборочные характеристики, то для проверки гипотезы о нормальности распределения число степеней свободы равно (k-3).

При расчете критерия Пирсона нужно соблюдать следующие условия:

1) число наблюдений должно быть достаточно велико, во всяком случае 50;

2) 2) если теоретические частоты в некоторых интервалах меньше 5, то такие интервалы объединяют так, чтобы частоты были более 5.

Расчеты по вычислению c2 приведены в таблицах 6.1 и 6.2.

Таблица 6.1

Доход

fj

Менее 960

605

26

15730

44639038,34

-1,00847

0,2399

14

960-1670

1315

34

44710

12252243,06

-0,46202

0,3586

22

1670-2380

2025

23

46575

276784,07

0,08443

0,3975

24

2380-3090

2735

9

24615

6047172,81

0,63087

0,3270

20

3090-3800

3445

6

20670

14039892,54

1,17732

0,1995

12

3800-4510

4155

4

16620

20065024,36

1,72377

0,0903

6

4510-5220

4865

4

19460

34802920,36

2,27022

0,0303

2

Более 5220

5575

4

22300

53573616,36

2,81667

0,0076

0

Итого

110

210680

185696691,90

где x’j – середина интервала;

fjколичество человек в группе;

t – нормативное отклонение;

f(t) – нормированная функция,

f’ – теоретическая чистота.

Средний доход: ;

СКО:;

Объединив интервалы 6-8, получаем следующие данные:

Таблица 6.2

Номер интервала

Эмпирические
частоты

Теоретические
частоты

1

26

14

9,300

2

35

22

7,189

3

23

24

0,034

4

9

20

5,774

5

6

12

2,993

6

12

8

2,000

Итого

27,284

Критерий Пирсона (фактический): 

Критерий Пирсона (табличный):  (d.f.= 6-3 =3).

Так как  , то не подтверждается гипотеза о нормальном распределении показателя «среднемесячный доход потребителя» в районе № 40.

Заключение

При определении емкости рынка было выявлено, что средняя ошибка средней выборочного наблюдения во втором районе несколько больше, чем во втором. Ошибки репрезентативности могут быть систематическими и случайными. Систематические ошибки могут возникать в связи с особенностями принятой системы отбора и обработки данных наблюдений или в связи с нарушением установленных правил отбора. Возникновение случайных ошибок репрезентативности объясняется недостаточно равномерным представлением в выборочной совокупности различных категорий единиц генеральной совокупности, в силу чего распределение отобранной совокупности единиц не вполне точно воспроизводит распределение единиц генеральной совокупности.

Величина случайной ошибки репрезентативности зависит:

1) от принятого способа формирования выборочной совокупности. Выбор последнего связан с решением вопросов о единице отбора, способе отбора единиц, способе размещения всего объема отбираемых единиц по различным группам генеральной совокупности;

2) от объема выборки;

3) от степени колеблемости изучаемого признака в генеральной совокупности.

Верхний и нижний пределы доверительного интервала емкости рынка сильно различаются, поэтому конкретно нельзя сказать о том, сколько может поглотить этот рынок.

При проверки гипотезы о нормальном распределении показателя «среднемесячный доход потребителя» в районе № 40 обнаружено, что гипотеза не подтверждается, ряд обладает правосторонней симметрией и, что потребителей с небольшим доходом гораздо больше, чем потребителей с высокими заработками.



  © Реферат плюс


Поиск

  © REFERATPLUS.RU  

Яндекс.Метрика