УДК 343.976

КЛАССИФИКАЦИЯ ГОСУДАРСТВ ПО ТИПУ ПОТРЕБЛЕНИЯ ПСИХОАКТИВНЫХ ВЕЩЕСТВ С ПОМОЩЬЮ МЕТОДА ГЛАВНЫХ КОМПОНЕНТ

№15,

Юридические науки

Галушин Павел Викторович (Кандидат технических наук)


Ключевые слова: ПСИХОАКТИВНЫЕ ВЕЩЕСТВА; КЛАССИФИКАЦИЯ; МЕТОД ГЛАВНЫХ КОМПОНЕНТ; PSYCHOACTIVE SUBSTANCES; CLASSIFICATION; PRINCIPAL COMPONENT ANALYSIS.


Аннотация: В данной статье описывает, как метода главных компонент может быть использован для классификации государств по типу потребления психоактивных веществ. Показано, что первая главная компонента может быть интерпретирована как общий уровень потребления психоактивных веществ. Существование подобного показателя говорит о том, что в одних государствах уровень потребления психоактивных веществ объективно выше, чем в других. Аналогичная методика классификации может применяться и для анализа структуры наркопотребления в различных регионах одного государства.

Наркомания и организованная наркопреступность являются острейшими проблемами как России, так и всего мирового сообщества. Эффективная борьба с немедицинским потреблением наркотических средств и психотропных веществ невозможна без понимания закономерностей структуры потребления психоактивных веществ в различных регионах и государствах.

В данной статье делается попытка классифицировать государства по типу потребления психоактивных веществ с помощью метода главных компонент.

Сначала рассмотрим данные о потреблении различных психоактивных веществ, которые имеются в свободном доступе [1]. Отметим, что оборот этих веществ в различных странах регулируется законодательством по-разному. Вопрос правого статуса психоактивных веществ выходит за рамки данного исследования. Для данного исследования отбирались те вещества, которые в той или иной степени влияют на состояние психики человека и вызывают зависимость: алкоголь (этиловый спирт), никотин, кокаин, каннабис и опиаты.

Потребление различных психоактивных веществ описывается различными показателями. Для алкоголя – это потребление алкоголя в литрах чистого этанола на душу населения (в возрасте 15 лет и старше) по данным ВОЗ. Для никотина – количество сигарет на одного взрослого в год. Для кокаина – доля жителей в возрасте от 15 до 64 лет, потребляющих кокаин хотя бы один раз в год. Для каннабиса – доля жителей в возрасте от 15 до 64 лет, потребляющих каннабис хотя бы один раз в год. Для опиатов – доля жителей в возрасте от 15 до 64 лет, потребляющих опиаты хотя бы один раз в год.

Рассмотрим проблемы, которые существуют для перечисленных статистических показателей. Во-первых, величины, выраженные в различных единицах, нельзя сравнивать непосредственно. Для корректной работы с разными по характеру показателями нужно перейти к безразмерным величинам, например, с помощью стандартизации показателей (в англоязычной литературе стандартизованные показатели называются z-score).

Стандартизованный показатель – это отклонение от среднего значения исходного показателя, делённое на среднее квадратичное отклонение этого показателя [2]. Стандартизованные показатели являются безразмерными, имеет среднее значение равное нулю и среднее квадратичное отклонение равное единице. В большинстве случаев стандартизованные показатели будут принимать вещественные значения из интервала от -3 до 3.

Во-вторых, не для каждого государства имеются статистические данные по всем перечисленным психоактивным веществам. Государства, для которых отсутствовали данные хотя бы по одному показателю, были исключены из дальнейшего исследования. После выполнения этой процедуры осталось 64 государства, для которых имелись данные по всем выбранным веществам.

Выявление типов потребления психоактивных веществ начнём с изучения вопроса о существование зависимостей между потреблением различных веществ. Если такие зависимости отсутствуют, то задача классификации государств по структуре потребления становится тривиальной: потребление каждого вещества можно рассматривать независимо от остальных.

Проверим наличие линейной статистической связи между выбранными показателями с помощью вычисления коэффициентов парной линейной корреляции [3]. Эти коэффициенты могут принимать вещественные значения от -1 до 1.

В таблице 1 приведены значения парных коэффициентов линейной корреляции между анализируемыми показателями, полученные по указанным выше данным. Здесь и далее статистическая обработка данных осуществлялась с помощью программной среды R [4].

Таблица 1.

Значения коэффициентов линейной корреляции показателей потребления психоактивных веществ

Алкоголь Кокаин Каннабис Опиаты Никотин
Алкоголь 1 0,265 0,208 0,519 0,335
Кокаин 0,265 1 0,389 0,030 -0,179
Каннабис 0,208 0,389 1 0,171 -0,082
Опиаты 0,519 0,030 0,171 1 0,476
Никотин 0,335 -0,179 -0,082 0,476 1

Проанализируем полученные результаты с учётом свойств коэффициента линейной корреляции. Знак коэффициента корреляции показывает направление зависимости (если коэффициент корреляции положительные, то увеличение одного показателя приводит, в среднем, к увеличению другого показателя, если же он является отрицательным, то увеличение одного показателя приводит, в среднем, к уменьшению другого показателя). Абсолютное значение показывает силу связи: чем ближе это значение к единице, тем сильнее связь. Если коэффициент линейной корреляции равен единице, то статистическая зависимость вырождается в функциональную зависимость: один показатель является линейной функцией другого.

Можно заметить, что большинство коэффициентов в таблице 1 являются положительными.

Отрицательная корреляция существует, например, между никотином и каннабисом (что может быть довольно легко объяснено, учитывая способы употребления данных веществ), а также между никотином и кокаином. Практически между всеми показателями есть умеренной силы корреляционная связь.

Итак, мы установили, что между потреблением различных психоактивных веществ существуют зависимости. Таким образом, постановка задачи выявления типов потребления этих веществ является оправданной.

Разумным было бы считать, что в один и тот же тип входят государства, в которых все показатели достаточно близки. Однако, эта формулировка не является достаточно формализованной, чтобы выявление так определённых типов можно было бы выполняться автоматизировано. Человек же из-за естественных ограничений не может наглядно воспринимать более трёх величин, причём трёхмерные графики воспринимаются хуже, чем двумерные. В нашем же случае имеется пять показателей.

Таким образом, встаёт вопрос, можно ли наглядно представить большое количество показателей на плоском графике без существенного искажения взаимного расположения исследуемых объектов. Одним из методов решения данной задачи является метод главных компонент [5].

В данном методе вместо исходных показателей рассматриваются их взвешенные суммы (главные компоненты). Веса в этих суммах выбираются из требований наибольшей информативности и отсутствия корреляционных связей между главными компонентами. Наиболее информативной является первая главная компонента, затем – вторая и так далее.

Информативность выделенных признаков определяется объяснённой с их помощью долей дисперсии исходных признаков. В таблице 2 приведена доля объяснённой дисперсии для каждой главной компоненты и суммарная доля объяснённой дисперсии для всех главных компонент от самой информативной до текущей.

Из представленных данных видно, что учёт первых двух главных компонент позволяет объяснить почти 70% изменчивости исходных данных, а первых трёх – более 80%. Таким образом, по двум главным компонентам можно получить достаточно объективное представление об уровнях потребления психоактивных веществ в различных государствах.

Таблица 2.

Доля объясненной дисперсии для главных компонент

Главные компоненты 1 2 3 4 5
Доля вариации 0,392 0,297 0,131 0,098 0,082
Накопленная доля вариации 0,392 0,689 0,820 0,918 1,000

График значений первых двух главных компонент будет наиболее адекватным двумерным графическим представлением данных, среди всех возможных среди тех, которые основаны на взвешенных суммах исходных признаков. Для рассматриваемых в данной статье данных график двух первых главных компонент показан на рисунке 1.


Рисунок 1. График двух первых главных компонент для данных о потреблении психоактивных веществ

Постараемся дать содержательную интерпретацию выделенных главных компонент с точки зрения предметной области. Коэффициенты связи главных компонент и стандартизированных показателей приведены в таблице 3.

Таблица 3.

Веса стандартизованных показателей в главных компонентах.

Главные компоненты 1 2 3 4 5
Алкоголь 0,587 -0,050 0,412 -0,382 0,581
Кокаин 0,213 -0,644 0,492 0,431 -0,335
Каннабис 0,281 -0,556 -0,743 0,062 0,236
Опиаты 0,587 0,191 -0,166 -0,347 -0,686
Никотин 0,432 0,487 -0,091 0,738 0,155

Для рассматриваемых данных все коэффициенты первой главной компоненты оказались положительными. Это означает, что наибольшая изменчивость исходных данных наблюдается вдоль направления увеличиения потребления всех рассматриваемых психоактивных веществ. Таким образом, первая главная компонента может рассматриваться как общий уровень потребления психоактивных веществ (нуль соответствует среднему потреблению, отрицательные значения – ниже среднего, положительные – выше среднего). Коэффициенты первой главной компоненты при такой её интерпретации показывают относительный вклад отдельных веществ в общий уровень их потребления: наибольший вклад вносят опиаты и алкоголь, наименьший – кокаин. Существование подобного показателя говорит о том, что в одних государствах уровень потребления психоактивных веществ объективно выше, чем в других.

У второй главной компоненты положительными являются коэффициенты при показателях «Опиаты» и «Никотин», а у остальных показателей коэффициенты отрицательны. Таким образом, вторая главная компонента разделяет страны на те, для которых характерно высокое потребление никотина и опиатов, и те, для которых характерно высокое потребление кокаина, каннабиса и (в меньшей степени) алкоголя.

У третьей главной компоненты положительным являются веса при показателях «Алкоголь» и «Кокаин», а у остальных коэффициенты отрицательны. Эта компонента разделяет страны, для которых характерно высокое потребление алкоголя и кокаина, и те, для которых характерно высокое потребление никотина, опиатов и каннабиса.

Остальные компоненты объясняют малую долю общей дисперсии, поэтому мы их не рассматриваем.

Так как главные компоненты являются статистически независимыми, то простейшую классификацию можно построить по каждой переменной отдельно. При этом будем пользоваться простейшим принципом построения классификаций – бинарным: разделить на государства с высокими и низкими значениями главной компоненты.

Подобная классификация показывает наличие зависимости между географическим положением государств и значениями первых двух главных компонент.

Отрицательные значения обеих компонент (низкий общий уровень потребления при преобладании потребления кокаина и героина) имеют страны Латинской Америки.

Положительные значения обеих компонент (высокий общий уровень потребления при преобладании никотина и опиатов) характерны для стран Восточной и Центральной Европы, Греции, Кипра, Мальты и Португалии.

Положительные значения первой и отрицательные второй (высокий общий уровень с преобладанием кокаина и каннабиса) характерны для стран западной Европы, а также для стран с близкими к ним культурной и государственной традициями (Австралия, Новая Зеландия и Канада).

Отрицательные значения первой и положительные второй (низкий общий уровень при преобладании никотина и опиатов) характерны для стран Африки. Кроме того, в эту категорию попадает множество стран из других регионов: Турция, Швеция, Япония, Финляндия. В этой группе географические закономерности выражены слабее всего.

Описанные географические закономерности сведены в таблицу 4. Конечно, из указанных закономерностей есть некоторые исключения. Например, Уругвай имеет значение второй главной компоненты 0,05 (то есть небольшое положительное) в отличие от большинства других стран Латинской Америки (для которых характерно отрицательное значение второй главной компоненты). Также отметим, что ближе всего к центру (общемировому уровню) находятся Бразилия и Швеция.

Таблица 4.

Классификация регионов и государств по типу потребления психоактивных веществ

Потребление никотина и опиатов Общий уровень потребления психоактивных веществ
Низкий Высокий
Низкое Латинская Америка Западная Европа, Австралия, Новая Зеландия и Канада
Высокое Африка, Турция, Швеция, Япония, Финляндия. Восточная и Центральная Европа, Греция, Кипр, Мальта и Португалия.

Таким образом, использование методов факторного анализа позволяет выявлять связь типов потребления психоактивных веществ с географико-экономическими условиями в различных государствах.

Основным выводом данной статьи можно считать наличие показателя общего уровня потребления психоактивных веществ в различных государствах.

Отметим также, что описанная в данной статье методика классификации может применяться и для анализа структуры наркопотребления в различных регионах одного государства при наличии соответствующих статистических данных.


Список литературы

  1. World drug report 2014 / URL: https://www.unodc.org/documents/wdr2014/World_Drug_Report_2014_web.pdf (дата обращения 23.10.2018).
  2. Статистические методы. Вероятность и основы статистики. Термины и определения : ГОСТ Р 50779.10-2000 (ИСО 3534.1-93). URL: http://docs.cntd.ru/document/1200017686 (дата обращения 23.10.2018).
  3. Прикладная статистика: Исследование зависимостей: Справ. изд. / С.А. Айвазян, И.С. Енюков, Л.Д. Мешалкин; Под. ред. С.А. Айвазяна. – М.: Финансы и статистика, 1985. С. 61-69.
  4. The R Project for Statistical Computing URL: https://www.r-project.org/ (дата обращения 23.10.2018).
  5. Прикладная статистика: Классификация и снижение размерности: Справ. изд. / С.А. Айвазян, В.М. Бухштабер, И.С. Енюков, Л.Д. Мешалкин; Под ред. С.А. Айвазяна. М.: Финансы и статистика, 1989. С. 332-370.