УДК 004

ИНТЕЛЛЕКТУАЛЬНАЯ ПОДДЕРЖКА НА ОСНОВЕ АНАЛИЗА ДАННЫХ

№30,

Технические науки

Буриков Антон Алексеевич
Косов Андрей Васильевич
Леонтьева Мария Владимировна

Ключевые слова: АНАЛИЗ ДАННЫХ; СИСТЕМЫ ИНТЕЛЛЕКТУАЛЬНОЙ ПОДДЕРЖКИ; СИСТЕМЫ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ; DATA ANALYSIS; INTELLIGENT SUPPORT SYSTEMS; DECISION SUPPORT SYSTEMS.
Аннотация: Рассмотрены методы анализа данных, а также выявлены их преимущества и недостатки. Разработан общий процесс работы системы интеллектуальной поддержки. Составлен процесс интеллектуального анализа данных. Основной идей статьи является выявление общих закономерностей при создании универсальной интеллектуальной системы, основанной на анализе данных.

Введение.

Интеллектуальные системы служат для помощи людям в сложных условиях для более полного анализа деятельности. Существование таких систем ежедневно ускоряют работу всех сфер деятельности пользователей. Для создания таких систем часто используются различные методы анализа данных, сравнение которых приведены ниже в статье. Все интеллектуальные системы можно привести к одному алгоритму создания, что в дальнейшем облегчит их проектирование.

Интеллектуальные системы служат для облегчения выбора в критичных ситуациях и предотвращения ошибок, зависящих от пользователя. Хоть и интеллектуальные системы поддержки принятия решения и выполняют большую часть работы по анализу деятельности человека, но конечный выбор делает все равно пользователь.

Представление интеллектуальной поддержки.

Интеллектуальная поддержка представляет собой интеллектуальную информационную систему, сокращенно — ИИС. ИИС, в свою очередь, включает в себя 5 основных взаимодействующих компонентов:

1. Языковая подсистема — механизм обеспечения связи между пользователем и другими компонентами ИСПР;

2. Информационная подсистема — хранилище данных и средств их обработки;

3. Подсистема управления знаниями — хранилище знаний о проблемной области, таких как процедуры, эвристики и правила, и средства обработки знаний;

4. Подсистема управления моделями — мозг системы;

5. Подсистема обработки и решения задач — связующее звено между другими подсистемами.

Интеллектуальные информационные системы решают ряд задач, таких как:

• Интерпретация данных;

• Диагностика;

• Мониторинг;

• Проектирование;

• Прогнозирование;

• Планирование;

• Обучение;

• Управление;

• Поддержка принятия решений.

В общем случае все системы можно разделить на системы решающие задачи анализа и на системы решающие задачи синтеза. В данной работе будут рассматриваться системы, которые решают задачи анализа.

Процесс построения систем можно на 5 этапов, указанных на рисунке 1.

Рис. 1 — Этапы построения ИИС.

Понятие методов анализа данных.

Методы анализа данных — это специальные инструменты или методы, которые можно использовать для анализа данных. Они делятся на две широкие категории в зависимости от того, являются ли данные количественными или качественными [1].

Количественные данные — это данные, которые могут быть выражены в цифрах. В результате большая часть количественного анализа данных использует статистические методы для поиска объективных закономерностей в данных. Вообще говоря, это предпочтительный тип данных для анализа данных, поскольку соответствующие методы не оставляют места для интерпретации.

Качественные данные — это любые данные, которые не могут быть выражены в цифрах. Он часто основан на мнениях или опыте, которые трудно или невозможно измерить количественно. Таким образом, качественные методы получения данных встречаются гораздо реже и, как правило, менее надежны для составления научных выводов.

Преимущество и недостатки методов анализа данных.

Сравнение методов анализа данных приведено в таблице 1.

Таблица 1.

Сравнение методов анализа данных

Методы Приложение Преимущества Недостатки
Инженерные Методы Отдельные здания и группы зданий Относительно быстро и недорого для простых инженерных методов. Наиболее полезно в качестве дополнения к другим методам. Методы совершенствуются. Полезно для базовой разработки. Относительно дорого для более сложных инженерных моделей. Необходимо откалибровать с помощью данных на месте. Сами по себе они не очень хороши для оценки побочного эффекта.
Одномерные статистические модели В первую очередь для групп зданий Относительно недорого и легко объяснимо. Предположения должны быть подтверждены данными обследований и другими измеренными данными. Ограниченная применимость. Невозможно оценить пиковые воздействия. Необходимы большие размеры образцов
Многомерные статистические модели В первую очередь для групп зданий Может изолировать проектные воздействия лучше, чем базовые статистические модели. Те же недостатки, что и для базовых статистических моделей. Относительно более сложные, дорогостоящие и труднообъяснимые, чем базовые статистические модели.
Измерение конечного использования Отдельные здания и группы зданий Наиболее точный метод измерения энергопотребления. Наиболее полезно для сбора данных, а не для анализа. Это может быть очень дорого. Требуется специализированное оборудование и специальные знания. Возможные предвзятости выборки. Трудно обобщить на другие проекты. Само по себе это не позволяет рассчитать экономию энергии. Трудно получить пред установочный расход.
Краткосрочный мониторинг Отдельные здания и группы зданий Полезно для мер с относительно стабильной и предсказуемой работой характеристики. Относительно точный метод. Наиболее полезно для сбора данных, а не для анализа. Ограниченная применимость. Используя только этот метод, невозможно рассчитать экономию энергии.

Интеллектуальный анализ.

Интеллектуальный анализ данных представляет собой процесс обнаружения пригодных к использованию сведений в крупных наборах данных. В интеллектуальном анализе данных применяется математический анализ для выявления закономерностей и тенденций, существующих в данных. Обычно такие закономерности нельзя обнаружить при традиционном просмотре данных, поскольку связи слишком сложны, или из-за чрезмерного объема данных.

Эти закономерности и тренды можно собрать вместе и определить как модель интеллектуального анализа данных. Модели интеллектуального анализа данных могут применяться к конкретным сценариям, а именно:

• Прогнозирование: оценка продаж, прогнозирование нагрузки сервера или времени простоя сервера

• Риск и вероятность: выбор наиболее подходящих заказчиков для целевой рассылки, определение точки равновесия для рискованных сценариев, назначение вероятностей диагнозам или другим результатам

• Рекомендации: определение продуктов, которые с высокой долей вероятности могут быть проданы вместе, создание рекомендаций

• Поиск последовательностей: анализ выбора заказчиков во время совершения покупок, прогнозирование следующего возможного события

• Группирование: разделение заказчиков или событий на кластеры связанных элементов, анализ и прогнозирование общих черт.

Построение модели интеллектуального анализа данных является частью более масштабного процесса, в который входят все задачи, от формулировки вопросов относительно данных и создания модели для ответов на эти вопросы до развертывания модели в рабочей среде. Этот процесс можно представить как последовательность следующих шести базовых шагов.

1. Постановка задачи

2. Подготовка данных

3. Изучение данных

4. Построение моделей

5. Исследование и проверка моделей

6. Развертывание и обновление моделей

На рисунке 2 описываются связи между каждым этапом процесса, которые можно использовать для выполнения каждого шага.

Рисунок 2 — Этапы и связи между ними

Процесс, представленный на следующей диаграмме, является циклическим, то есть создание аналитической модели данных является динамическим и повторяющимся процессом. Выполнив просмотр данных, пользователь может обнаружить, что данных недостаточно для создания требуемых моделей интеллектуального анализа данных, что ведет к необходимости поиска дополнительных данных. Также может возникнуть ситуация, когда после построения нескольких моделей окажется, что они не дают адекватный ответ на поставленную задачу, и поэтому необходимо поставить задачу по-другому. Может возникнуть необходимость в обновлении уже развернутых моделей за счет новых поступивших данных. Для создания хорошей модели может понадобиться многократно повторить каждый шаг процесса [3].

Заключение.

Проведенное сравнение различных методов анализа данных и созданные алгоритмы и правила создания системы поддержки принятия решения поможет в дальнейшем облегчить создание интеллектуальной системы.


Список литературы

  1. 7 Data Analysis Methods and How to Choose the Best[Электронный ресурс]. – Режим доступа: https://pestleanalysis.com/data-analysis-methods/ (дата обращения: 9.04.2021)
  2. Advantages and Disadvantages of Data Collection and Analysis Methods [Электронный ресурс]. – Режим доступа: https://www.researchgate.net/figure/Advantages-and-Disadvantages-of-Data-Collection-and-Analysis-Methods_tbl4_282294416 (дата обращения: 9.04.2021)
  3. Основные понятия интеллектуального анализа данных [Электронный ресурс]. – Режим доступа: https://docs.microsoft.com/ru-ru/analysis-services/data-mining/data-mining-concepts?view=asallproducts-allversions (дата обращения: 9.04.2021)