Так, например, просто показатель объема товарооборота (дохода, чистой прибыли и др.) значит меньше, чем то, как этот результат соотносится с аналогичными показателями ваших коллег. Самый распространенный способ оценить свое относительное положение — это использовать процентили.
Умаров Сергей Закирджанович
Проф. кафедры военной фармации Военно–медицинской академии им. С.М. Кирова (Санкт–Петербург), д.фарм.н.
Процентиль — это характеристика набора данных, которые выражают ранги элементов не в виде чисел от 1 до n в виде процентов, а в виде процентов от 0 до 100%. Таким образом, наименьшему значению соответствует нулевой процентиль, наибольшему — 100%-ный процентиль, медиане — 50%-ный процентиль и т.д. Процентили можно рассматривать как показатели, разбивающие наборы количественных и порядковых данных на определенные части.
Существенным моментом является тот факт, что процентиль представляет собой элемент данных, имеющий определенный ранг, но выражен в тех же единицах, что и набор данных. Например, 60-й процентиль объема товарооборота может быть равен 380 000 руб. (измерен не в процентах, а в руб., как и остальные элементы набора данных). Если этот 60-й процентиль, равный 380 000 руб., характеризует деятельность определенной аптеки, то это означает, что около 60% других аптек имеют показатели ниже 380 000 руб., а у 40% остальных это показатель выше. Процентили могут быть использованы в двух случаях:
- чтобы показать значение элемента в заданном процентильном ранге (например, "10-й процентиль равен 156 000 руб.");
- чтобы показать процентильный ранг значения данного элемента в наборе данных (например, "Эффективность продаж аптеки N составляет 2 960 000 руб. соответствует 55-му процентилю").
Процентили могут служить в качестве универсальных базовых бизнес–характеристик. Чтобы оценить сущность того или иного бизнес–процесса достаточно нескольких значений процентилей. Так, 50-й процентиль — это уже знакомая медиана, поскольку 50-й процентиль находится посередине между наибольшим и наименьшим значением ряда. Интерес представляют экстремумы — соответственно максимальное и минимальное значение или другими словами 100-й и 0-й процентили. Дополняют набор базовых характеристик квартили, определяемые как 25-й и 75-й процентили. Квартили — это значения ранжированного ряда, которые находятся на расстоянии одной четвертой на пути от наименьшего и наибольшего значений. Соотношения медианы, квартилей и процентилей представлены на рис. 1.
Таким образом, пять базовых показателей включают наименьшее значение, нижний квартиль, медиану, верхний квартиль и наибольшее значение (табл. 1).
Табл. 1 Перечень базовых показателей положений в бизнес-аналитике
№
|
Наименование показателя
|
Содержание показателя
|
1.
|
Наименьшее (минимальное) значение
|
0-й процентиль
|
2.
|
Нижний квартиль
|
25-й процентиль на четверть расстояния от наименьшего значения
|
3.
|
Медиана
|
50-й процентиль, середина
|
4.
|
Верхний квартиль
|
75-й процентиль на три четверти расстояния от наименьшего значения или на четверть расстояния от наибольшего значения
|
5.
|
Наибольшее (максимальное) значение
|
100-й процентиль
|
В совокупности перечисленные характеристики дают достаточно ясное представление об особенностях бизнес–данных. Два экстремума характеризуют размах (диапазон) данных, медиана показывает центр, два квартиля определяют границы расположенной в центре половины данных, а положение медианы относительно квартилей дает приблизительное представление о наличии или отсутствии асимметрии.
Попробуем использовать рассмотренные базовые характеристики на небольшом практическом примере. В качестве исходных данных были использованы статистические материалы "Фармацевтический рынок России: Рейтинг аптечных сетей по итогам 1 квартала 2015 года", DSM Group (http://www.dsm.ru/about/news/120/). В частности, были использованы данные о количестве точек продаж ряда аптечных сетей (табл. 2).
Табл. 2 Характеристика аптечных сетей по количеству точек продаж (I кв. 2015 г.)
№
|
Наименование аптечной сети
|
Количество точек продаж
|
1.
|
Ригла
|
1233
|
2.
|
А.в.е (вкл. 36,6 и Старый лекарь)
|
783
|
3.
|
Имплозия
|
1350
|
4.
|
А5
|
1039
|
5.
|
Доктор Столетов (вкл. Озерки)
|
316
|
6.
|
Радуга (вкл. Первая помощь)
|
875
|
7.
|
Фармаимпекс
|
550
|
8.
|
Фармленд
|
490
|
9.
|
Планета здоровья
|
619
|
10.
|
Классика
|
192
|
11.
|
Самсон Фарма
|
42
|
12.
|
Вита
|
452
|
13.
|
Фармакор
|
246
|
14.
|
Ладушка
|
248
|
15.
|
Мелодия здоровья
|
504
|
Для определения базовых характеристик первоначальные значения числа точек продаж табл. 2 были упорядочены по убыванию, после чего каждому значению был присвоен ранг также в порядке убывания (табл. 3).
Табл. 3 Базовые характеристики аптечных сетей
в разрезе количества точек продаж (I кв. 2015 г.)
Наименование аптечной сети
|
Количество точек продаж
|
Ранг
|
Базовая характеристика
|
Имплозия
|
1350
|
15
|
Наибольшее значение (максимум)
|
Ригла
|
1233
|
14
|
|
А5
|
1039
|
13
|
|
Радуга (вкл. Первая помощь)
|
875
|
12
|
|
|
(875 + 783) / 2 = 829
|
11,5
|
Верхний квартиль
|
А.в.е. (вкл. 36,6 и Старый лекарь)
|
783
|
11
|
|
Планета здоровья
|
619
|
10
|
|
Фармаимпекс
|
550
|
9
|
|
Мелодия здоровья
|
504
|
8
|
Медиана
|
Фармленд
|
490
|
7
|
|
Вита
|
452
|
6
|
|
Доктор Столетов (вкл. Озерки)
|
316
|
5
|
|
|
(316 + 248) / 2 = 282
|
4,5
|
Нижний квартиль
|
Ладушка
|
248
|
4
|
|
Фармакор
|
246
|
3
|
|
Классика
|
192
|
2
|
|
Самсон Фарма
|
42
|
1
|
Наименьшее значение (минимум)
|
Определение наибольшего и наименьшего значений не представляет особого труда, т.к. они находятся в первой и последней строках (ранги 15 и 1) табл. 3. Что касается медианы, то она имеет ранг (15 + 1) / 2 = 8, что соответствует 504 точкам продаж аптечной сети "Мелодия здоровья". Для нахождения ранга нижнего квартиля к рангу медианы прибавляем 1 и делим на 2, т.е. (8 + 1) / 2 = 4,5, что свидетельствует о необходимости усреднения значений 4-го и 5-го рангов. Найти ранг верхнего квартиля можно путем вычитания полученного значения ранга нижнего квартиля из суммы 15 + 1. Другими словами, ранг верхнего квартиля = (15 + 1) — 4,5 = 11,5, а, следовательно, само значение верхнего квартиля будет определено путем усреднения значений точек продаж, соответствующих 11 и 12 рангам. Ниже приведены общие формулы определения рангов квартилей, которые описывают представленный выше порядок вычислений.
где int означает функцию взятия целого, которая отбрасывает целую часть числа;
n — число рангов.
Рассматривая базовые бизнес–характеристики, следует упомянуть т.н. выбросы — экстремальные значения исследуемых данных. К выбросам (если таковые присутствуют) следует относить значения данных, расположенные далеко от центра распределения (медианы). В частности, к верхним выбросам следует относить значения, которые превышают величину, равную:
Нижний выброс определяется как
Используя приведенные выше формулы, для расчета выбросов исследуемых нами данных получаем значения, представленные в табл. 4. Впрочем, среди исходных данных таких экстремальных значений не наблюдается.
Табл. 4 Характеристика выбросов
Верхний квартиль
|
829
|
Нижний квартиль
|
282
|
Выброс верхний
|
829 + 1, 5 × (829–282) = 1649,5
|
Выброс нижний
|
282 – 1, 5 × (829-282) = –538,5
|
В завершение необходимо отметить, что на практике приходится оперировать значительно большими объемами информации и потому необходимо использовать возможности средств вычислительной техники. На первых порах достаточно возможностей хорошо известного табличного процессора Excel. На рис. 2 представлено решение по нахождению базовых характеристик аптечных сетей в разрезе количества точек продаж в I кв. 2015 г.
Рис. 2 Решение по нахождению базовых характеристик аптечных сетей
в разрезе количества точек продаж (I кв. 2015 г. Excel)