Какие параметры характеризуют гистограмму ресурсов тест

6 причин, по которым вам следовало бы отказаться от гистограмм

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Гистограммам не чужды систематические ошибки. Дело в том, что они достаточно условны и могут привести к неправильным выводам о данных. Если вы хотите визуализировать переменную, лучше выбрать другой график.

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Независимо от того, находитесь ли вы на встрече с высшим руководящим составом или со специалистами по обработке данных, в одном вы можете быть уверены: в какой-то момент появится гистограмма.

И нетрудно догадаться почему. Гистограммы весьма интуитивно наглядны: любой поймет их с первого взгляда. Более того, они объективно представляют реальность, не так ли? А вот и нет.

Гистограмма может ввести в заблуждение и привести к ошибочным выводам — ​​даже на простейшем наборе данных!

В этой статье мы на примерах рассмотрим 6 причин, почему, когда дело доходит до визуализации данных, гистограммы точно не является лучшим выбором:

Они слишком сильно зависят от количества интервалов.

Они слишком сильно зависят от максимума и минимума переменной.

Они не дают возможности заметить значимые значения переменной.

Они не позволяют отличить непрерывные переменные от дискретных.

Они делают сравнение распределений сложным.

Их построение затруднено, если в памяти находятся не все данные.

«Ладно, я понял: гистограммы не идеальны. Но есть ли у меня выбор?» Конечно есть!

В конце статьи я порекомендую другой график, называемый CDP, который минует эти недостатки.

Итак, что же не так с гистограммой?

1. Она слишком сильно зависит от количества интервалов.

Чтобы построить гистограмму, вы должны сначала определить количество интервалов, также называемых корзинами (bins). Для этого существует множество различных практических методов (вы можете ознакомиться с их обзором на этой странице). Но насколько критичен этот выбор? Давайте возьмем реальные данные и посмотрим, как меняется гистограмма в зависимости от количества интервалов.

Переменная представляет собой максимальную частоту сердечных сокращений (ударов в минуту), полученную у 303 людей во время некоторой физической активности (данные взяты из набора данных UCI по сердечным заболеваниям: источник).

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тестКак изменяется гистограмма при изменении количества интервалов. [Рисунок автора]

Глядя на верхний левый график (который мы получим по умолчанию в Python и R), у нас сложится впечатление хорошего распределения с одним пиком (модой). Однако если бы мы рассмотрели бы другие варианты гистограммы, мы получили бы совершенно другую картину. Разные гистограммы одних и тех же данных могут привести к противоречивым выводам.

2. Она слишком сильно зависит от максимума и минимума переменной.

Даже после того, как количество интервалов установлено, интервалы зависят от положения минимума и максимума переменной. Достаточно, чтобы один из них немного изменился, и все интервалы также изменятся. Другими словами, гистограммы не являются надежными.

Например, давайте попробуем изменить максимум переменной, не меняя количество интервалов.

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тестКак меняется гистограмма при изменении максимального значения. [Рисунок автора]

Отличается только одно значение, а весь график получается другим. Это нежелательное свойство, потому что нас интересует общее распределение: одно значение не должно так влиять на график!

3. Не дает возможности заметить значимые значения переменной.

Если в общем, то когда переменная содержит некоторые часто повторяющиеся значения, нам конечно нужно об этом знать. Однако гистограммы этому препятствуют, поскольку они основаны на интервалах, а интервалы «скрывают» отдельные значения.

Классическим примером является случай, когда отсутствующим значениям массово присваивается 0. В качестве примера давайте рассмотрим набор данных переменной, состоящий из 10 тысяч значений, 26% из которых — нули.

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тестТе же данные, разная ширина интервала. На левом графике невозможно обнаружить высокую концентрацию нулей. [Рисунок автора]

График слева — это то, что вы получаете по умолчанию в Python. Глядя на него, вы не заметите скопление нулей, и вы даже можете подумать, что эта переменная имеет «плавную» динамику.

График справа получен путем сужения интервалов и дает более четкое представление о реальности. Но дело в том, что как бы вы ни сужали интервалы, вы никогда не будете уверены, содержит ли первый интервал только 0 или какие-то другие значения.

4. Не позволяет отличить непрерывные переменные от дискретных.

Зачастую мы бы хотели знать, является ли числовая переменная непрерывной или дискретной. По гистограмме это практически невозможно сказать.

Возьмем переменную «Возраст» (Age). Вы можете получить Возраст = 49 лет (когда возраст округлен) или Возраст = 49,828884325804246 лет (когда возраст рассчитывается как количество дней с момента рождения, деленное на 365,25). Первая — дискретная переменная, вторая — непрерывная.

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тестСлева непрерывная переменная. Справа дискретная переменная. Однако на верхних графиках они выглядят одинаково. [Рисунок автора]

Тот, что слева, непрерывен, а тот, что справа, дискретен. Однако на верхних графиках (по умолчанию в Python) вы не увидите никакой разницы между ними: они выглядят совершенно одинаково.

5. Сложно сравнивать распределения.

Часто бывает необходимо сравнить одну и ту же переменную в разных кластерах. Например, в отношении данных UCI о сердечных заболеваниях, приведенных выше, мы можем сравнить:

все население (для справки)

люди моложе 50 страдающие сердечными заболеваниями

люди моложе 50 НЕ страдающие сердечными заболеваниями

люди старше 60 лет страдающие сердечными заболеваниями

люди старше 60 и НЕ страдающие сердечными заболеваниями.

Вот что мы получили бы в итоге:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тестСравнение гистограмм. [Рисунок автора]

Гистограммы основаны на областях, и, когда мы пытаемся провести сравнение, области в конечном итоге перекрываются, что делает эту задачу практически невыполнимой.

6. Сложно построить, если в памяти находятся не все данные.

Если все ваши данные находятся в Excel, R или Python, построить гистограмму легко: в Excel вам просто нужно кликнуть по иконке гистограммы, в R — выполнить команду hist(x), а в Python — plt.hist(х).

Но предположим, что ваши данные хранятся в базе данных. Вы же не хотите выгружать все данные только для того, чтобы построить гистограмму, верно? По сути, все, что вам нужно, это таблица, содержащая для каждого интервала крайние значения и количество наблюдений. Примерно такая:

| INTERVAL_LEFT | INTERVAL_RIGHT | COUNT |

| 75.0 | 87.0 | 31 |

| 87.0 | 99.0 | 52 |

| 99.0 | 111.0 | 76 |

Но получить ее с помощью SQL-запроса не так просто, как кажется. Например, в Google Big Query код будет выглядеть так:

Немного громоздко, не правда ли?

Альтернатива: график кумулятивного распределения.

График кумулятивного распределения — это график квантилей переменной. Другими словами, каждая точка CDP показывает:

по оси x: исходное значение переменной (как в гистограмме);

по оси y: сколько наблюдений имеют такое же или меньшее значение.

Давайте посмотрим на пример с переменной — максимальной частотой пульса.

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тестГрафик кумулятивного распределения максимальной частоты сердечных сокращений. [Рисунок автора]

Возьмем точку с координатами x = 140 и y = 90 (30%). По горизонтальной оси вы видите значение переменной: 140 ударов сердца в минуту. По вертикальной оси вы видите количество наблюдений, у которых частота сердцебиение равна или ниже 140 (в данном случае 90 человек, что означает 30% выборки). Следовательно, у 30% нашей выборки максимальная частота сердцебиения составляет 140 или менее ударов в минуту.

Какой смысл в графике, показывающем, сколько наблюдений «равно или ниже» заданного уровня? Почему не просто «равно»? Потому что в противном случае результат зависел бы от отдельных значений переменной. И это не сработает, потому что каждое значение имеет очень мало наблюдений (обычно только одно, если переменная непрерывна). Напротив, CDP полагаются на квантили, которые более стабильны, выразительны и легко читаются.

Вдобавок CDP намного полезнее. Если задуматься, вам часто приходится отвечать на такие вопросы, как «у скольких из них от 140 до 160?» Или «у скольких из них больше 180?». Имея перед глазами CDP, вы можете дать немедленный ответ. С гистограммой это было бы невозможно.

CDP решает все проблемы, которые мы видели выше. Фактически, по сравнению с гистограммой:

1. Не требует пользовательского выбора. Для одного набора данных, существует только один возможный CDP.

2. Не страдает от выпадающих значений. Экстремальные значения не влияют на CDP, поскольку квантили не меняются.

3. Позволяет определять значимые значения. Если существует концентрация точек данных на каком-то конкретном значении, это сразу видно, поскольку будет вертикальный сегмент, соответствующий значению.

4. Позволяет с первого взгляда распознать дискретную переменную. Если существует только конкретный набор возможных значений (т.е. переменная дискретна), это сразу видно, поскольку кривая примет форму лестницы.

5. Упрощает сравнение распределений. На одном графике легко сравнить два или более распределения, поскольку это просто кривые, а не области. Кроме того, ось y всегда находится в диапазоне от 0 до 100%, что делает сравнение еще более простым. Для сравнения, это пример, который мы видели выше:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тестСравнение распределений в CDP. [Рисунок автора]

6. Его легко построить, даже если у вас нет всех данных в памяти. Все, что вам нужно, это квантили, которые можно легко получить с помощью SQL:

Как построить график кумулятивного распределения в Excel, R, Python

В R это делается в одну строчку:

Спасибо за внимание! Надеюсь, эта статья оказалась для вас полезной.

Я ценю отзывы и конструктивную критику. Если вы хотите поговорить об этой статье или других связанных темах, вы можете написать мне в Linkedin.

Перевод материала подготовлен в рамках онлайн-курса «Machine Learning. Basic«. Всех заинтересованных приглашаем на день открытых дверей курса, где можно будет узнать все подробности об обучении и пообщаться с преподавателем.

Источник

Какие параметры характеризуют гистограмму ресурсов тест

Реструктуризация капитала 1-318 Ресурсная гистограмма 2-253 Ресурсное календарное планирование [c.409]

На рис. 7.7 показана ресурсная гистограмма для проекта строительства гаража после ее выравнивания в соответствии с планом при ограничен- [c.125]

Ранее в графических отчетах пытались использовать графопостроители, матричные или иные принтеры, которые не были предназначены для печати диаграмм или графиков. Графические эффекты имитировались путем печати подходящих буквенно-цифровых знаков в блоках и шаблонах. Скорость печати могла быть высокой, и результаты были приемлемыми для диаграмм и ресурсных гистограмм. Большинство программ все еще [c.135]

Дизайн и функциональные возможности доступных отчетов во многом зависят от выбранного программного обеспечения, но большинство систем поддерживают диаграммы, графики сетевых моделей, ресурсные гистограммы, кривые затрат и более продвинутые приложения, такие, как вероятностные графики. [c.138]

В строительном проекте в дополнительную информацию войдут ресурсные гистограммы, отображения потока наличности, а также расписания заказов и поставок. [c.77]

План управления кадрами часто включает ресурсные гистограммы, как показано на рис. 9.3. [c.104]

Эта гистограмма рассчитывалась, чтобы обеспечить сглаживание структуры ресурсного использования, не превышающего ограничения доступных ресурсов. Наблюдаются и ограничения, исходящие из логики сетевой модели. Планируемое окончание проекта в результате этого процесса, просчитанного в данном случае вручную, откладывается до 25 июня. Подобные планы могут быть также просчитаны с помощью регулируемых гистограмм, но с этой работой вполне справятся все хорошие программные продукты по управлению проектами, хотя они могут и не добиться оптимального уровня. [c.126]

Сравните эту гистограмму с гистограммой, показанной на рис. 7.6. Может быть достигнута та же небольшая продолжительность проекта, но благодаря ресурсному планированию график сглажен по потребностям в ресурсах. Такой план известен как план с ограничениями по времени. [c.127]

На рис. 5.3.3. представлен список работ от А до 3, который будет использоваться для иллюстрации концепции календарного плана ресурсов. Для данного проекта существует два типа ресурсов аналитики и программисты. На рис. 5.3.3.а) приведены графики Ганта и гистограмма ресурсов для обоих типов ресурсов с использованием календарного плана, построенного по ранним началам работ. Это приводит к достаточно широкому разнообразию ресурсных уровней. Если есть только один аналитик, он будет перегружен работой в первые два месяца реализации проекта. Один человек может ра- [c.245]

Ресурсные гистограммы I ПРИ назначении базовых или теку-и сглаживание ресурсов щих плановь х Дат необходимо учить,- [c.245]

Источник

Тотальное управление качеством

Что такое гистограмма?

Частотность событий указывается по вертикальной оси, а группа данных, или классы, указываются по горизонтальной оси. Чтобы провести оценку гистограммы, мы должны знать центральную тенденцию, а также рассеивание данных.

Высота служащих для составления гистограммы

Служащийвысота (дюйм)Служащийвысота (дюйм)Служащийвысота
(дюйм)
ТК64СТ69ШП68
ВШ63РМ71РС72
ТК66СТ73ШП75
ВШ73РМ62РС76
ТК60СТ70ШП69
ВШ67РМ65РС70
ТК68СТ72ШП72
ВШ70РМ63РС70
ТК65СТ73ШП76
ВШ61РМ74РС73
ТК66СТ70ШП65
ВШ76РМ66РС69

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Не всегда легко просмотреть измеренные данные и определить образцы или проанализировать то, что нам сообщают эти данные. Гистограмма может предоставить информацию о степени разнородности данных и указать образец распределения. Рисуя кривую линию по верхушкам полосок гистограммы, мы можем получить общую картину.

Рассеивание данных может привести к большому разнообразию гистограмм, в зависимости от того процесса или объекта, по которому вы собрали данные. Далее предлагаются некоторые типичные виды гистограмм.

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тестКакие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест
Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тестКакие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Как построить гистограмму?

Чтобы построить гистограмму, нарисуйте горизонтальную и вертикальную оси. Горизонтальная ось (Х) отображает интервалы; вертикальная ось (Y), отображает частоты. Нарисуйте полоску, представляющую собой частотность данных в каждом классе. Полоски должны соприкасаться друг с другом.

Начните с неорганизованного набора, по крайней мере, 30 данных

64, 63, 66, 73, 60, 67, 68, 70, 65, 61, 66, 76, 69, 71, 73, 62, 70, 65, 72, 63, 73, 74, 70, 66, 68, 72, 75, 76, 69, 70, 72, 70, 76, 73, 65, 69

Расставьте цифры в нисходящем или в восходящем порядке.

60, 61, 62, 63, 63, 64, 65, 65, 65, 66, 66, 66, 67, 68, 68, 69, 69, 69, 70, 70,
70, 70, 70, 71, 72, 72, 72, 73, 73, 73, 73, 74, 75, 76, 76, 76

Каждая цифра является единицей данных. Подсчитайте количество данных.

N=76-60=16Класс (К) используется для подсчета количества полос. Он равен квадратному корню от N.

Ширина класса (H) используется для подсчет аширины полос. Она подсчитывается делением диапазона на класс.

Чтобы начать построение гистограммы, установите начальную точку для первого класса. Она подсчитывается вычитанием из минимальной единицы данных одного измерения, поделенного на 2.

Единица измерения (М)
М =1

Теперь, когда установлено ограничение для первого класса, постройте таблицу частотности с тремя колонками.

Опознава-
тельный ярлык

Чтобы заполнить первую колонку, прибавьте к начальной точке класса ширину класса (H)

Чтобы заполнить вторую колонку, вернитесь к первоначальному набору данных. Присвойте опознавательный ярлык тем данным, которые попадают в границы каждого класса. Введите общую частотность в третью колонку.

Опознава-
тельный
ярлык

Когда использовать гистограмму?

Гистограмму можно использовать в этапе «Текущая ситуация» в главе «Изложение УК», когда мы хотим получить точную картину рассеивания или распространения данных.

© Интернет-проект «Корпоративный менеджмент», 1998–2021

Источник

Гистограммы ресурсов

В то время как гистограммы остаются видимыми в нижней части экрана, можно продолжать работу с диаграммой Гантта, а именно перемещаться по расписанию, осуществлять выбор из меню и заполнять формы. Чтобы отразить проделанные изменения в расписании на гистограммах, необходимо произвести перерасчет расписания.

Комбинация клавиш [Alt / F8] позволяет отобразить на экране гистограммы для первых пяти ресурсов, назначенных текущей задаче. Ресурс-гистограммы для других ресурсов вызываются с помощью команды “Расписание / Ресурсы / Гистограмма”, которая позволяет указать имена нужных ресурсов (рис. 7.12).

Удаление гистограммы с экрана и возврат к диаграмме Гантта осуществляется по команде “Представление / Гантта” из главного меню или с помощью комбинации клавиш [Ctrl / F8]. Горизонтальная пунктирная линия, проходящая через гистограмму, соответствует для момента времени максимально допустимому объему назначений в графике доступности. Белым цветом изображаются фрагменты гистограммы, для которых общий объем назначений ресурса не превышает показателя, записанного в графике доступности. Черный цвет обозначает интервал перегрузки ресурса, появление которого связано с его назначением слишком большому числу задач одновременно. Контрастными цветами выделены фрагменты столбцов гистограммы, соответствующие объемам назначений ресурса текущей задаче, и интервалы недоступности ресурса по его индивидуальному календарю.

В левой части гистограммы находятся данные, которые изменяются как при вертикальном перемещении курсора от задачи к задаче, так и при его горизонтальном перемещении вдоль временной оси.

Для того, чтобы ресурс-гистограммы можно было отобразить на экране, необходимо включить в формат представления область временной диаграммы.

Чтобы вывести на экран ресурс-гистограмму необходимо:

нажать клавишу [F10] для ввода формы. В нижней части экрана появляются гистограммы. Курсор переходит в диаграмму Гантта, с которой можно продолжать работу.

Когда на экране появляются ресурс-гистограммы, для работы с ними используются следующие функциональные клавиши и их комбинации:

нажатие клавиши [F8] позволяет выбрать форму “Ресурсы для гистограмм” и дополнить либо изменить список ресурсов, для которых на экране выводятся диаграммы загрузки;

нажатие клавиши [Tab] осуществляет переход в область временной диаграммы. На гистограммах отображается объем назначений ресурса, соответствующий текущей дате. Эта величина изменяется при перемещении курсора вдоль временной оси. Отчет о ресурсах (рис. 12.7) выводит на печать список ресурсов и затрат,

демонстрируя для каждого пункта списка до 12 полей данных, таких, как тип затрат и почасовая стоимость. Все данные берутся из форм “Ресурсы / Затраты”. На вид отчета о ресурсах влияет отбор (как исключающий, так и выделяющий).

Создание отчета о ресурсах осуществляется с помощью команды “Отчет о ресурсах”, при этом надо заполнить форму “Определение параметров отчета”, на основании которой определяются столбцы данных. Обязательно следует включить в отчет столбец, идентифицирующий ресурсы, например “Ресурсы / Затраты”. После ввода указанной формы заполняется форма “Установка параметров задачи”.

Контроль за ходом работ по реализации проектов с использованием Time Line

Руководителям разных уровней для решения задач управления требуются различные данные о расписании. Предусмотренная в TIME LINE возможность составления отчетов позволяет создать именно такой тип документа, который нужен для конкретной цели. Базовыми являются 14 типов текстовых отчетов, которые представляют различную информацию о ресурсах и задачах. На базе основных отчетов можно составить практически неограниченное количество различных отчетов.

Из 14 типов 7 имеют табличную форму, их печать осуществляется с помощью команды главного меню “Отчет / Табличный”, а из подменю команды выбирается конкретный тип отчета

ТАБЛИЧНЫЙ: Задачи, Ресурсы, Назначение, Календарный, Доступность ресурсов, Стоимость ресурсов, Изменения назначений, Выход

Другие типы отчетов представлены непосредственно в меню команды “Отчет”.

ОТЧЕТ: Табличный, Гантта, Детальный, Краткий, Перекрестный, Ресурс-гистограммы, Сетевой, Иерархический, Форма, Выход

Создание отчета производится с помощью команды “Отчет / Задачи”, после чего заполняется форма “Установка параметров печати”

Отчет о ресурсах (рис. 12.7) выводит на печать список ресурсов и затрат, демонстрируя для каждого пункта списка до 12 полей данных, таких, как тип затрат и почасовая стоимость. Все данные берутся из форм “Ресурсы / Затраты”. На вид отчета о ресурсах влияет отбор (как исключающий, так и выделяющий).

Создание отчета о ресурсах осуществляется с помощью команды “Отчет о ресурсах”, при этом надо заполнить форму “Определение параметров отчета”, на основании которой определяются столбцы данных. Обязательно следует включить в отчет столбец, идентифицирующий ресурсы, например “Ресурсы / Затраты”. После ввода указанной формы заполняется форма “Установка параметров задачи”.

Источник

Какие параметры характеризуют гистограмму ресурсов тест

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Гистограммы помогают наглядно представить некоторые статистики выборки, а также визуально оценить закон распределения. Так как последний зачастую представляет наибольший интерес, визуальной оценке некоторых наиболее часто встречающихся распределений мы и уделим внимание в этой статье.

Для построения гистограмм воспользуемся генератором случайных чисел в программе Minitab. Подробное руководство и урок на одном листе уже опубликованы на нашем сайте, поэтому на самой процедуре получения чисел мы детально останавливаться не будем. Для каждого случая, за исключением отдельных примеров, будем генерировать по 1000 значений. Там, где это возможно, будем оставлять значения параметров по умолчанию. А там, где программа не предлагает таких значений, будем стараться разобрать на примере, какие величины мы могли бы внести.

Статья получилась довольно длинной, поэтому для удобства навигации добавлено содержание. Каждому рассмотренному распределению соответствует отдельный самодостаточный раздел. Это значит, что нет необходимости читать все подряд, но можно обратиться к нужному разделу, чтобы найти информацию об интересующем распределении. Ну а если такой информации не нашлось, обязательно оставьте отзыв в комментариях под публикацией.

Содержание:

Нормальное распределение (Normal distribution) или распределение Гаусса

Начнем, разумеется, с нормального закона распределения. Из всех распределений в проектах шести сигм чаще всего приходится иметь дело именно с ним. Нормальному распределению может подчиняться практически любая переменная, на которую не влияют специальные факторы (например, связывающие или ограничивающие).

В силу того, что на любой процесс влияет огромное количество различных факторов, его результат никогда не принимает одно и тоже значение, но распределяется вокруг некоторого значения – математического ожидания или среднего арифметического значения, если говорить о выборке. Следовательно, генерируя случайный набор чисел, подчиняющихся нормальному закону распределения, программа попросит нас задать среднее значение – Mean, а также Standard deviation – стандартное отклонение или меру рассеивания наблюдений вокруг математического ожидания:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Если построить гистограмму нормального распределения, то говорят, что она напоминает перевернутый колокол:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Примечательно, что какие бы величины параметров (математическое ожидание и стандартное отклонение) мы не задали, форма гистограммы от этого не поменяется. Чего не скажешь о следующем испытуемом.

Распределении Chi-square или χ 2 (хи-квадрат)

Попробуйте сгенерировать 2 набора данных, указав разное количество степеней свободы (Degrees of freedom) – k: 1 и 5, к примеру.

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Гистограммы частично перекроют друг друга, однако на графике отчетливо видно, что с увеличением числа степеней свободы пик смещается вправо. А если задать число степеней свободы 30 или выше, то гистограмма начнет напоминать нормальное распределение.

Практикам шести сигм довольно часто приходится иметь дело с распределением хи-квадрат. В частности, оно используется в тестах гипотез. Например, для оценки того, насколько хорошо выборка может быть описана распределением Пуассона (Stat \ Basic Statistics \ Goodness-of-Fit Test for Poisson), сопряженности номинальных данных (Stat \ Tables \ Chi-Square Test for Association) и т.д.

Больше о тестировании гипотез в среде Minitab вы можете в Карте выбора теста гипотез.

Распределение Фишера или Снедекора (F-distribution)

Движемся дальше – распределение Фишера или Снедекора (F), форма которого также будет зависеть от двух параметров: числителя и знаменателя числа степеней свободы – Numerator degrees of freedom и Denominator degrees of freedom соответственно.

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Гистограммы для полученных таким образом числовых рядов будут выглядеть следующим образом:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Распределение Стьюдента (t-distribution)

Распределение Стьюдента (t) также часто применяется в статистическом анализе, к примеру, для построения доверительных интервалов, в тестах гипотез и т.д. T-критерий – частый “участник” проектов шести сигм.

Внешне гистограмма распределения Стьюдента может напоминать нормальное распределение: она также симметрична и также напоминает перевернутый колокол. Например, гистограмма распределения Стьюдента с числом степеней свободы 50 может иметь следующий вид:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Немного “упитаннее” и чуть короче хвосты, а в остальном полностью напоминает нормальное распределение.

Равномерное распределение (Uniform distribution)

На всех гистограммах выше был ярко выраженный пик. Но бывает и так, что на гистограмме присутствует большое количество пиков или вовсе нет выраженного пика. Иными словами, гистограмма представляет собой “плато”. Такие гистограммы встречаются довольно редко в проектах шести сигм и зачастую свидетельствуют о наличии специальных факторов вариации. Если каждый интервал гистограммы содержит примерно равное количество значений, то такая гистограмма называется однородной или гистограммой равномерного распределения (Uniform):

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Для того, чтобы программа сгенерировала такой набор данных, нужно задать всего 2 параметра: начальную (Lower endpoint) и конечную точки (Upper endpoint). В примере выше это 0 и 20 соответственно.

Распределение Бернулли (Bernoulli distribution)

Распределение Бернулли (Bernoulli distribution) – распределение наблюдений, значения которых могут принимать лишь 2 взаимоисключающих значения: 0 или 1, успех или неудача, качественный или некачественный продукт и т.д.

При генерации чисел, программа просит задать лишь один параметр – вероятность события (Event probability), значение от 0 до 1 (от 0 до 100%):

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Вероятность того, что событие не произойдет, соответственно, равно разнице между 1 и вероятностью того, что событие произойдёт. Гистограмма такого распределения, ожидаемо, ничем нас тоже не удивит – 2 колонки, отражающее, сколько раз событие произошло и сколько раз событие не произошло:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Биномиальное распределение (Binomial distribution)

Биномиальное распределение (Binomial distribution) – также частый “участник” проектов шести сигм. Оно описывает вероятность события в серии независимых экспериментов. Например, сколько раз может выпасть число 6, если вы кинете игральную кость 10 раз? Ну или сколько бракованных изделий вы найдете, если возьмете 10 образцов из очень большой партии изделий?

Параметры распределения: количество экспериментов (Number of trials) и вероятность события (Event probability).

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

А вот и ответ на наши вопросы в графическом виде:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Выходит, что вероятнее всего найти 1 дефектное изделие в выборке или выкинуть шестерку 1 раз.

Геометрическое распределение (Geometric distribution)

Геометрическое распределение (Geometric distribution) – еще одно распределение, описывающее вероятность события, с тем лишь отличием, что мы получаем количество опытов до первого “успеха”. Иными словами, скольким автомобилям в конце линии нужно заглянуть под капот, чтобы найти брак?

Minitab попросит нас задать лишь вероятность – значение от 0 до 1 (от 0 до 100%). Но не спешите нажимать Ok. На сей раз при генерации чисел в диалоговом окне доступна кнопка Options. Давайте нажмем ее и посмотрим, какие возможности нам предлагает программа:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Итак, мы можем выбрать Model the total number of trials (смоделировать количество экспериментов до первого события) или Model only the number of non-events (смоделировать количество “неудач” до первого “успеха”).

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Что мы видим на диаграмме? При заданной вероятности (0,1) почти 200 раз из 1000 мы нашли брак, заглянув под капот первого, второго или третьего авто. Если же проверить 10 машин, то общее значение повышается до 720 из 1000. Иными словами, вероятность вырастет до 72%.

Понятно, что до 100% можно добраться, лишь контролируя все автомобили в конце конвейера. Что, по сути, и делается на всех автомобильных заводах. Однако график показывает нам, что за 50 переваливает лишь 5 наблюдений. Это означает, что проведя контроль 49 авто, мы найдем брак с вероятностью 99,5%.

Отрицательное биномиальное распределение (Negative binomial) или распределение Паскаля

Данное распределение моделирует количество экспериментов до получения требуемого количества событий. Проводя параллель с задачей, которую мы разбирали выше, можно сформулировать вопрос так: сколько капотов необходимо открыть, чтобы найти определенное количество бракованных машин.

В отличие от предыдущего распределения – геометрического, – мы ищем количество опытов не до первого события, а до заданного числа событий. Если задать вероятность (Event probability) 0,1 и число требуемых событий (Number of events needed) 1, то получим такую же гистограмму, что и выше. Она покажет, что до первого брака нам нужно взять выборку в 49-50 авто. Но задав (Number of events needed), например, 5, получим совсем другую картину:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Чтобы найти 5 бракованных авто, придется заглянуть под сотню капотов. 117, если быть точным и придерживаться уровня 99,5%.

Говорят: “В каждой шутке есть доля правды”. Вот и из этого шутливого примера с капотами можно сделать 2 вывода:

Гипергеометрическое распределение (Hypergeometric distribution)

Также, как и предыдущее, гипергеометрическое распределение описывает количество событий в серии экспериментов, с тем лишь отличием, что генеральная совокупность ограничена. Можно с уверенностью сказать, что это – любимое распределение сотрудника отдела качества, так как дает ответ на вопрос: какую выборку взять из партии, чтобы найти в ней дефект.

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Гистограмма, которую мы получим, покажется нам весьма знакомой:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Если вы промотаете выше, то заметите что это брат-близнец гистограммы биномиального распределения. Так и есть, и в этом нет ничего странного. Распределения очень похожи, и даже примеры, которые мы с вами рассматриваем, одни и те же: партия, выборка, брак…

Это сделано не для того, чтобы вас запутать, а скорее наоборот – показать практическое применение рассматриваемых распределений. Обычно, когда вы берете образец для контроля качества, вы же не возвращаете его, чтобы потом опять выбрать случайным образом следующий образец из целой партии. Следовательно, если вы не нашли дефекта на первом образце, то вероятность нахождения дефекта на втором образце возрастает. Для описания этого подходит гипергеометрическое распределение.

Учебник по статистике или Википедия вам так и скажет: “Моделирует количество удачных выборок без возвращения из конечной совокупности”. Вот только когда вы имеете дело с большими партиями, как например партия в 1000 изделий, оба распределения могут быть с одинаковым успехом применены.

Поэтому, рассматривая биномиальное распределение, мы говорили об “очень большой партии”, а рассматривая гипергеометрическое, просто о партии и о том, что условиться генерировать 1000 значений было не самым удачным решением.

Кстати, возвращаясь к полученной гистограмме гипергеометрического распределения, можно с грустью констатировать, что если выборка в ходе приемочного контроля качества равна 20, наши поставщики могут спать спокойно, а производство – готовиться к новым вызовам.

Дискретное распределение (Discrete distribution)

Следующее распределение в списке – это дискретное (Discrete distribution). Тут следует сделать оговорку, так как это меню в списке Minitab-а предлагает нам сгенерировать некий числовой ряд с заданными величинами и вероятностями их появления в этом ряду. Это не отдельный вид распределения, а лишь общее название для распределений со счетным числом значений. Под эту категорию подпадают уже рассмотренные выше распределения: Бернулли, биномиальное, гипергеометрическое и другие.

Что нам потребуется, чтобы сгенерировать такое распределение? Нам потребуется таблица с данными и вероятностями появления этих данных. Например, для игральной кости это может выглядеть так:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

У кубика 6 сторон с числами от 1 до 6. Вероятность выпадения какого-либо из них 1/6 или 0,16667:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Гистограмма для этого набора данных и такого распределения нас не удивит – она будет напоминать гистограмму равномерного распределения:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Задай вы другие величины, их количество и вероятности, гистограмма приняла бы совершенно другой вид, напоминая любое другое распределение или их смесь.

Целочисленное распределение (Integer distribution)

Опять начнем с оговорки, что это не совсем распределение – скорее, синтетический способ генерирования чисел, который предлагает нам Minitab для понимания важных теорий и практик статистического анализа.

Параметры распределения, которые нам потребуется задать: минимальное и максимальное значения. Меню, как вы заметили, очень напоминает то, как мы моделировали данные для равномерного распределения. С тем лишь отличием, что в результате мы получим только целые числа. При равномерном распределении мы могли получить целые и дробные числа.

Разделом выше мы задали величины от 1 до 6 и равные вероятности для них. Для целочисленного распределения будет достаточно задать минимальное значение (Minimum value) равным 1 и максимальное (Maximum value) – равным 6:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Гистограмма, ожидаемо, будет напоминать гистограмму равномерного распределения, а также тот график, что мы получили для дискретного распределения:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Распределение Пуассона (Poisson distribution)

Еще один частый участник проектов шести сигм – распределение Пуассона. С его помощью можно моделировать очень много процессов: количество обращений в банк за день, количество запасов для покрытия еженедельного спроса, количество инцидентов на производстве или смертей в больнице… Сложно переоценить спектр применения и важность этого распределения.

Для моделирования данных программа попросит задать всего один параметр 1 – среднее значение (Mean). Давайте представим, что магазин электротоваров продает в среднем 5 пылесосов в день:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Полученная гистограмма даст возможность понять, к примеру, сколько пылесосов должно быть на складе, чтобы удовлетворить спрос с вероятностью 95%:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Чтобы не считать вручную, можно прибегнуть к анализу, который был рассмотрен в заметке Диаграмма распределения вероятностей (Probability Distribution Plot). Ну а продавай вы пылесосы десятками, можно было бы смело обратиться к нормальному распределению – с увеличением среднего распределение Пуассона все больше начинает напоминать нормальное распределение.

Бета-распределение (Beta distribution)

Данное распределение встречается реже в практике шести сигм, однако с его помощью, теоретически, можно моделировать любую случайную величину, значение которой ограничено определенным интервалом. Т.е. если стоит задача понять, когда на сайте появится новый читатель, какой срок согласования документов или любые другие SLA и т.д., то понадобится именно бета-распределение.

Для моделирования данных потребуется задать два параметра: α (альфа или First shape parameter) и β (бета или Second shape parameter). Гистограмма распределения будет зависеть от величины заданных параметров. Для понимания предлагаю сгенерировать наборы данных со следующими параметрами:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

В результате получим 5 абсолютно различных гистограмм от параболической и равномерной до одновершинной симметричной и ассиметричной:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Глядя на эти графики, представьте, что α – это новый посетитель сайта SixSigmaOnline.ru, а β – пользователь Facebook. С какой вероятностью еще один человек оторвется от пролистывания темы и возьмется за голову шесть сигм?

Распределение Коши (Cauchy distribution)

Также известно как распределение Лоренца и Брейта-Вигнера. Вы наверняка встречались с этим распределением, проходя курс физики, но в проектах шести сигм это – не частый гость. Мне вот с ходу и не приходит на память проект, в котором я имел бы дело с этим распределением. Тем не менее, в списке Minitab-а это распределение есть – значит, наше дело нехитрое: генерируем данные и строим гистограмму.

У этого распределения нет математического ожидания и дисперсии, но есть коэффициент сдвига (Location) и коэффициент масштаба (Scale). Нам нет необходимости разбираться в статистике до малейших подробностей, поэтому можем условно представить, что коэффициент сдвига, даже если не представляет математическое ожидание, отражает положение пика гистограммы. А коэффициент масштаба – даже если не говорит о дисперсии – отражает размах. Также нет необходимости менять значения по умолчанию:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

По сравнению с нормальным распределением, у гистограммы распределения Коши более длинные “хвосты” и острая вершина. К примеру, на графике ниже очень широкая шкала по оси X и заметна асимметрия вследствие того, что некоторые наблюдения значительно удалены от пика. Эксцесс (Kurtosis) – мера островершинности – равен 211 (у нормального распределения эксцесс близок к 0):

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Экспоненциальное распределение (Exponential distribution)

Это непрерывное распределение моделирует время между двумя последовательными появлениями одного и того же события. Например, время между появлениями двух покупателей в магазине, метеоритов в небе, автобусов на остановке и даже период полураспада радиоактивных частиц будет случайной величиной с экспоненциальным распределением.

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Параметры оставляем без изменений:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Гамма-распределение (Gamma distribution)

Двухпараметрическое семейство абсолютно непрерывных распределений. Они применяются в различных отраслях экономики и техники, теории и практике испытаний надежности. В частности, гамма-распределению могут быть подчинены такие величины, как общий срок службы изделия, время наработки до k-го отказа (k = 1, 2, …, и т.д.). Также, это распределение используется в логистике для описания спроса в моделях управления запасами.

Параметры распределения могут называться по-разному. В Minitab это Shape parameter и Scale parameter. Чтобы оценить их влияние на распределение, сгенерируем 4 набора данных:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Также Minitab предлагает установить нижнюю границу распределения – Threshold, – но работает это так же, как и в случае с экспоненциальным распределением. Поэтому дополнительно рассматривать влияние его значения м не будем.

Судя по полученным гистограммам:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Распределение Лапласа (Laplace distribution)

Распределение Лапласа не часто встречается в проектах шести сигм, однако широко применимо в биологии, экономике и финансах. Для получения данных потребуется установить два параметра: Location (коэффициент сдвига) и Scale (коэффициент масштаба). Оставим значения по умолчанию:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Гистограмма распределения весьма напоминает нормальное распределение, только с более острой вершиной:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Распределения экстремумов (Extreme Value Distribution)

В этом разделе мы рассмотрим 2 распределения: распределение минимального значения (Smallest extreme value distribution) и распределение максимального значения (Largest extreme value distribution). Еще к этому семейству относится распределение Вейбулла, но его мы рассмотрим отдельно.

Как следует из названия, эти распределения помогут нам понять экстремумы: минимум и максимум. Отсюда и область применения: там, где предвидеть экстремумы очень важно. А это – анализ надежности критических процессов, финансовых рисков, страхование… Например, распределение минимального значения (Smallest extreme value distribution) может нам помочь понять при какой минимальной температуре система откажет? А распределение максимального значения (Largest extreme value distribution) – наивысшие страховые потери.

Сгенерируем данные для Smallest extreme value distribution, оставив значения параметров Location (коэффициент сдвига – отвечает положению пика) и Scale (коэффициент масштаба – отвечает дисперсии наблюдений) по умолчанию. Затем повторим тот же алгоритм для Largest extreme value distribution, оставив значения параметров по умолчанию:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Гистограммы, соответствующие распределениям:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Логистическое распределение (Logistic distribution)

Логистическая функция распределения по форме похожа на функцию нормального распределения. Её главное предназначение – моделирование данных бинарного типа. Используется, например, в медико-биологических исследованиях для анализа эффекта различных лекарств, ядов и т.д. От нормального распределения логистическое отличается длинными “хвостами” – данными, находящимися в крайних, отдалённых от центра, позициях.

Сгенерируем данные, оставив значения параметров Location (коэффициент сдвига – отвечает положению пика) и Scale (коэффициент масштаба – отвечает дисперсии наблюдений) по умолчанию:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Гистограмма логистического распределения:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Лог-логистическое распределение (Log-logistic distribution)

Лог-логистическое распределение, в отличие от логистического, является трехпараметрическим. Оно полностью повторяет логистическое распределение, однако благодаря третьему параметру – Threshold или нижней границе распределения – позволяет моделировать только часть логистического распределения – данные больше 0.

Сгенерируем данные, оставив значения параметров по умолчанию:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Гистограмма лог-логистического распределения:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Логнормальное распределение (Lognormal distribution)

Частным случаем нормального распределения является логнормальное распределение. Оно является непрерывным унимодальным распределением и имеет положительную асимметрию. Этому распределению с заданной степенью приближения подчиняется, например, размер фракций гравия или града. Аналогичные примеры: длительность часто повторяемого события (время выполнения операции на конвейере) или размер зарплат футболистов одного клуба. Как правило, значительно большее количество игроков имеет среднюю зарплату, но есть игроки-звезды мирового класса, которые зарабатывают значительно выше других игроков (правый хвост гистограммы).

Сгенерируем данные, оставив значения параметров по умолчанию, и построим гистограмму логнормального распределения:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Распределение Симпсона или треугольное распределение (Triangular distribution)

Довольно интересное распределение, которое не часто встретишь в проектах шести сигм. Его можно получить “синтетически”, как мы это сделаем ниже, задав начальную точку (Lower endpoint), моду (Mode), и конечную точку (Upper endpoint):

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

В таком случае этот упрощенный закон поможет нам помочь понять распределение при отсутствии или ограниченном количестве данных. Например, у нас может не быть достаточных данных для оценки стоимости постройки нового здания. Но мы можем оценить минимум, максимум и наиболее вероятное значение. И раз у нас недостаточно данных, чтобы сформулировать гипотезу об ином распределении, построим гистограмму треугольного распределения:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Мы также можем получить треугольное распределение путем сложения или вычитания двух переменных, подчиняющихся равномерному закону распределения. На отдельном листе я сгенерировал 2 колонки по 1000 наблюдений, подчиняющихся равномерному распределению:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Затем, используя функцию Calc \ Calculator, создал еще одну колонку, значения в которой являются результатом вычитания первой и второй колонок:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Гистограмма полученных таким образом наблюдений также будет напоминать треугольное распределение:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Это свойство позволяет применять треугольное распределение для моделирования сложных законов распределения. К примеру, так можно представить некоторые природные явления, бизнес-процессы, аудио размывание (audio blur)…

Распределение Вейбулла (Weibull distribution)

Распределение Вейбулла может быть применимо для моделирования широкого спектра задач. Однако в проектах шести сигм, это неизменный участник анализов надежности и определения времени до отказа.

Чтобы получить данные, задайте следующие параметры:

Кстати, иногда говорят о распределении Вейбулла как о двухпараметрическом, а иногда – как о трех. Как вы видите выше, нам требуется задать 3 параметра. Т.е. распределение на самом деле трехпараметрическое. В то же время, задав Threshold равным 0, получаем двухпараметрическое распределение.

Давайте снова сгенерируем несколько наборов данных, чтобы оценить влияние параметров на форму гистограммы:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Многомерное нормальное распределение (Multivariate normal distribution)

Вы могли заметить, что двигаясь по списку доступных в меню Minitab распределений, мы упустили многомерное нормальное распределение. Это было сделано умышленно, так как и с данными, и с графиком нам придется повозиться. Но не стоит переживать. В этом распределении нет ничего сложного.

По сути, мы уже разобрали его частный случай – одномерное нормальное распределение. Просто мы не говорили, что оно одномерное. Многомерное можно представить как результат, зависимый от двух переменных, подчиняющихся нормальному закону распределения.

Давайте сгенерируем две колонки по 1000 наблюдений, удовлетворяющих нормальному закону распределения. Параметры – среднее и стандартное отклонение – в данном случае не имеют значения, хотя мы можем представить, что в одной колонке у нас будет температура (180°C), а в другой давление (760мм рт. ст.).

В меню Graph выберите Marginal Plots и в появившемся окне кликните на иконку With Histograms:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

В следующем окне задайте колонки С1 и С2 в качестве переменных X и Y:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Нажав Ok, получим следующий результат:

Какие параметры характеризуют гистограмму ресурсов тест. Смотреть фото Какие параметры характеризуют гистограмму ресурсов тест. Смотреть картинку Какие параметры характеризуют гистограмму ресурсов тест. Картинка про Какие параметры характеризуют гистограмму ресурсов тест. Фото Какие параметры характеризуют гистограмму ресурсов тест

Каждая точка на графике соответствует результату, который мы получим при определенной величине температуры и давления: где-то пирожки недопекутся, а где-то пригорят.

В проектах шести сигм многомерное нормальное распределение используется крайне редко. Однако некоторые методики анализа (факторный анализ, MANOVA) основываются на предположении, что данные подчиняются многомерному нормальному распределению.

Вот далеко не полный перечень типов существующих распределений и соответствующих им гистограмм. Внешнее отличие построенной вами гистограммы от перевернутого колокола еще совсем не означает, что данные собраны неправильно или что процесс нестабилен. Однако это всегда заставляет исследователя задуматься и постараться найти объяснение такому результату.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *