Эти процессы протекают неоднозначно. Поэтому применение одинаковых подходов, средств, технологий дает в каждом конкретном случае различные результаты в зависимости от субъективных факторов, от обстоятельств, которые нельзя контролировать и которые влияют на протекание процесса.
Умаров Сергей Закирджанович
Проф. кафедры военной фармации Военно–медицинской академии им. С.М. Кирова (Санкт–Петербург), д.фарм.н.
Неоднозначность протекания процесса порождается наличием присущего ему случайного. Но это не означает отсутствия общих закономерностей в рассматриваемых бизнес-процессах. Например, низкий уровень продаж в отдельно взятой аптеке является случайным событием, но в аптеке, возглавляемой грамотным и инициативным специалистом, такое событие встречается существенно реже, чем у того, кто редко или формально повышает свой профессиональный уровень. Эта устойчивость появления тех или других случайных событий уже является закономерностью.
В любых бизнес–ситуациях для выявления закономерностей используется метод обобщения, суть которого заключается в использовании одного или нескольких отобранных данных для характеристики конкретного бизнес–процесса. Это позволяет абстрагироваться от рассмотрения каждого конкретного случая, а рассматривать процесс в целом. Для этого достаточно весь набор данных охарактеризовать с помощью одного или нескольких обобщающих показателей, которые отражают наиболее фундаментальные свойства данных. Так, для процессов, которые хорошо описываются одним набором (так называемый одномерный набор) данных достаточно таких обобщающих показателей, как среднее, медиана и мода. Следует заметить, что в фармацевтической практике при помощи одномерного набора данных можно охарактеризовать динамику товарооборота и запасов, поток клиентов и др.
Среднее, медиана и мода — это различные способы выбора единственного показателя, который лучше всего описывает все данные конкретного бизнес-процесса. Такой показатель, представленный одним числовым значением, носит название типического значения или же мерой центральной тенденции.
Среднее, как типическое значение количественных данных, достаточно широко используется в повседневной практике. Этому способствуют простота его вычисления и доступность понимания сущности показателя. Действительно, для вычисления среднего достаточно сложить все значения одномерного набора данных, а сумму разделить на количество данных в наборе (количество элементарных единиц). Формула расчета среднего значения имеет следующий вид:
Где n — общее число данных в наборе, — непосредственно сами значения данных. Греческая прописная буква сигма Σ указывает на необходимость сложить все значения, которые записаны за ней, заменяя при этом на соответствующие им числовые значения. Символ для записи среднего Х произносится как «икс с чертой». Поскольку при вычислении среднего данные суммируются, то из этого следует, что среднее нельзя вычислить для номинальных и порядковых данных (нельзя складывать номера аптек, табельные номера сотрудников и проч.). Среднее значение можно интерпретировать как равномерное распределение суммы всех значений между элементарными единицами. Другими словами, если каждое значение данных заменить средним, то общая сумма не изменится. Предположим 10 человек совершили различные покупки на общую сумму 5000 руб., однако, если бы все покупки были одинаковые, тогда величина чека была бы равна среднему 5000 руб./10 = 500 руб.
Этот простой пример позволяет сделать важный вывод, что не стоит рассматривать величину чека, которая была получена исходя из среднего, в качестве индикатора типичного чека. Поскольку среднее значение сохраняет неизменной сумму при равномерном распределении значений, оно наиболее эффективно в качестве обобщающего показателя при отсутствии экстремальных значений (отклонений), когда набор данных представляет собой более-менее однородную группу с элементами случайности.
Одним из вариантов среднего является взвешенное среднее (используется также термин средневзвешенное). Как следует из названия, взвешенное среднее позволяет учесть при вычислении различную важность (значимость) или «вес» каждого элемента данных, в том случае, когда их нельзя принять как равноценные. "Вес" каждого обычно представляет собой положительные числа, сумма которых равна единице. Его можно определить расчетным путем или воспользоваться субъективным методом (руководствуясь личным мнением, либо мнением эксперта). Для получения взвешенного среднего каждый элемент данных умножают на присвоенный ему вес и суммируют полученные значения. Соответствующая формула имеет следующий вид:
Где ω1, ω2, ωn — соответствующие веса, сумма которых равна 1.
Рассмотрим небольшой пример, демонстрирующий различия в определении среднего и взвешенного среднего. Предположим, имеются данные о величине чека десяти различных покупок в аптеке (графа 1, табл. 1). В этой же графе в предпоследней строке указана суммарная стоимость всех покупок (1000 руб.) и рассчитана величина средней стоимости покупки (100 руб.). Расчет весомости каждого чека (графа 3) проводился путем деления значения конкретного чека на сумму всех чеков, составивших выборку. 4-я графа иллюстрирует порядок расчета взвешенного среднего аптечных чеков.
Как видно из данных, представленных в табл. 1, взвешенное среднее отличается от среднего. Это стало возможным по причине того, что суммарное значение весов для чеков №7–10 составляет практически половину (0,11 + 0,11 + 0,11 + 0,13 = 046), что, несомненно, и отразилось на результате. На практике среднее взвешенное лучше использовать в ситуациях, когда часть рассматриваемых данных более важна для принятия решения, а следовательно, должна вносить больший вклад в значение взвешенного среднего.
Следующим рассматриваемым типическим показателем является медиана. Медиана — это значение, которое расположено посередине ранжированного ряда данных. В этом случае половина данных в выборке будет меньше медианного значения, а другая половина – больше. Таким образом, медиана располагается в центре данных, характеризуя тем самым всю рассматриваемую выборку. С учетом всех возможных особых случаев медиана для выборки любого размера определяется следующим образом.
1. Данные, входящие в выборку располагаются в порядке возрастания или убывания (это не принципиально).
2. Определяется значение данных, находящихся в центре полученного ряда. В этом случае возможны два варианта:
а) если число данных, входящих в выборку (n) нечетное, то медианой будет среднее значение ряда данных, которое имеет номер (1 + n)/2. Отсчет можно вести с любого конца упорядоченного ряда. Например, имеется ряд из пяти покупок, каждая из которых включала следующие количества приобретенных единиц товара — 5 уп., 7 уп., 4 уп., 8 уп., 10 уп. В этом случае: медиана (5, 7, 4, 8, 10) = медиана (4, 5, 7, 8, 10) = 7.
Следует отметить, что медиана, равная 7, — это третье значение в упорядоченном списке, что полностью соответствует вышеприведенной формуле, поскольку (1 + n)/2 = (1 + 5)/2 = 3;
б) если же n — четное число, то в данном случае медиана будет представлена в виде среднего двух значений, расположенных в середине ряда. Возьмем предыдущий пример и увеличим его на одну покупку, равную 12 уп. В этом случае исходный ряд будет выглядеть 12 уп., 5 уп., 7 уп., 4 уп., 8 уп., 10 уп. , а медиана (12, 5, 7, 4, 8, 10) = медиана (4, 5, 7, 8, 10, 12) = (7 + 8)/2 = 7,5.
Данная ситуация ни в коей мере не противоречит формуле, согласно которой имеем (1 + n)/2 = (1 + 6)/2 = 3,5, что говорит о необходимости пройти в упорядоченном ряду половину пути между третьей и четвертой позициями, усреднив оба значения.
Весьма примечательным с практической точки зрения свойством медианы является возможность ее использования в случае порядковых данных. Предположим, что необходимо определить средний уровень профессиональной подготовки сотрудников аптеки. Обозначим следующие категории профессиональной подготовки в порядке возрастания как "НСФ" — незаконченное среднее фармацевтическое образование, "СФ" — законченное среднее фармацевтическое образование, "НВФ" — незаконченное высшее фармацевтическое образование, "ВФ" — законченное высшее фармацевтическое образование. Алгоритм определения медианы для порядковых данных аналогичен вышеизложенному в пунктах "а" и "б". Тогда для ряда, состоящего из семи работников аптеки, исходные данные будут выглядеть следующим образом:
Сотрудник
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
Образование
|
НВФ
|
ВФ
|
ВФ
|
НСФ
|
СФ
|
СФ
|
СФ
|
Медиана (НВФ, ВФ, ВФ, НСФ, СФ, СФ, СФ) =
Медиана (НСФ, СФ, СФ, СФ, НВФ, ВФ, ВФ) = СФ
В данном случае согласно формуле (1 + n)/2 = (1 + 7)/2 = 4 средний образовательный уровень соответствует "СФ" — законченному среднему образованию, т.к. именно значение занимает четвертую позицию как от начала, так и от конца упорядоченного ряда данных.
В том случае если число сотрудников (n) представлено четным числом, тогда в качестве медианы будут выбраны два значения, расположенных в середине упорядоченного ряда.
Сотрудник
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
Образование
|
НВФ
|
ВФ
|
ВФ
|
НСФ
|
СФ
|
СФ
|
СФ
|
ВФ
|
Медиана (НВФ, ВФ, ВФ, НСФ, СФ, СФ, СФ, ВФ) =
Медиана (НСФ, СФ, СФ, СФ, НВФ, ВФ, ВФ, ВФ) = СФ и НВФ
Если бы в середине упорядоченного ряда оказались два одинаковых значения, то это значение и являлось бы медианой. Если два значения в центре ряда представлены разными категориями (что соответствует условиям настоящего примера), то обе эти категории (среднее фармацевтическое и незаконченное высшее) и будут медианой. Это лучшее, что можно сделать в данной ситуации, т.к. для порядковых данных невозможно вычислить среднее двух значений.
Медиана обладает некоторым отличающим ее от среднего свойством, которое предлагается рассмотреть на следующем примере. Допустим, имеется ранжированный ряд условных цен на некоторый лекарственный препарат в нескольких аптеках. При этом в ряду имеются выделяющиеся данные (аптека "И" — 450 руб.).
Аптека
|
А
|
Б
|
В
|
Г
|
Д
|
Е
|
Ж
|
З
|
И
|
Цена
|
100
|
110
|
115
|
125
|
140
|
145
|
145
|
150
|
450
|
В этом случае среднее значение цены = (100 + 110 + 115 + 125 + 140 + 145 + 145 + 150 + 450)/9 = 164,4. Медиана цены = 140, т.к. число членов ряда нечетное. Для большей наглядности на рис. 1 отображено положение среднего (квадрат) и медианы (треугольник) в ряду данных. Этот пример демонстрирует, что при наличии данных, которые резко выделяются или заметно отличаются друг от друга, медиана является более устойчивой оценкой, чем среднее значение.
Что же касается моды (МО), то она представляет наиболее часто встречающаяся в ряду распределения значение. Мода — это единственная характеристика, которую можно определить для любого типа данных (номинальных, порядковых и количественных). Моду найти достаточно просто. На рис. 1, наряду с медианой и средним условных аптечных цен визуально определяется и мода, равная 145, т.к. представлена двумя повторяющимися значениями, в то время как остальные цены фиксировались по одному разу. Однако на практике, когда количество данных может быть значительно больше, целесообразно использовать функцию "МОДА" хорошо известного табличного процессора Excel, который мгновенно выдает искомое значение, обведенное овалом на рис. 2.
Возможности применения моды при наличии только номинальных данных иллюстрирует следующий пример. Предположим, необходимо определить моду аптечного ассортимента конкретной аптеки. Для этого достаточно составить перечень наименований товаров, реализованных за интересующий период времени, а затем после консолидации (группировки) одноименных товаров определить моду, позволяющую выделить предметы, пользующиеся повышенным спросом. В качестве исходных данных были взяты 50 реальных чеков, на основе которых был сформирован исходный перечень товаров, фрагмент которого представлен в табл. 2.
Как видно данные в табл. 2 достаточно просты и, можно сказать, "безобидны" с точки зрения коммерческой тайны, т.к. не содержат, кроме наименования товаров, ни сведений о ценах, объемах продаж и прочей информации конфиденциального характера. Тем не менее, использование моды в качестве типической характеристики позволяет получить ценную информацию о потребительских предпочтениях. На рис. 3 достаточно отчетливо представлены первые шесть элементов столбиковой диаграммы, которые по частоте спроса превосходят остальные торговые позиции и потому имеют полное право выступать в качестве моды.
В заключение попробуем разобраться, какой из типических показателей (среднее, медиана, мода) следует использовать в конкретных обстоятельствах. Конкретный выбор того или иного показателя определяется двумя причинами. Первая – что из показателей можно вычислить, вторая какой показатель более информативен. Моду можно вычислить для любого одномерного набора данных (хотя для количественных данных проблемой будет некоторая неопределенность). Среднее можно вычислить только для количественных данных (чисел), медиану — для всех типов данных, кроме номинальных (неупорядоченных данных). В общем виде рекомендации по выбору конкретного типического показателя представлены в табл. 3.
Так, в случае количественных данных можно вычислить все три характеристики. Однако следует принимать во внимание, что среднее для количественных данных рекомендуется использовать в том случае, когда исходные данные распределены нормально (по крайней мере приблизительно), а также когда среднее необходимо для прогнозирования неких суммарных показателей (объемов продаж, общего числа посетителей и др.).
Медиана служит хорошей характеристикой при ассиметричном распределении данных, т.к. даже при наличии "выбросов" данных, медиана более устойчива к воздействию отклоняющихся данных. Применять медиану можно и для порядковых данных, хотя в зависимости от характера решаемой задачи можно использовать моду.
Моду незаменима при анализе номинальных данных, т.к. в данной ситуации невозможно применить ни среднее, ни медиану.