УДК 519.21

ВЕРОЯТНОСТНОЕ ПРОГНОЗИРОВАНИЕ ИСХОДОВ ИГР В КОМАНДНЫХ ВИДАХ СПОРТА

№15,

Технические науки

Молоков Вячеслав Витальевич (Кандидат технических наук)


Ключевые слова: ПРОГНОЗИРОВАНИЕ; ВЕРОЯТНОСТЬ ИСХОДОВ ИГР; МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ; РАСПРЕДЕЛЕНИЕ ПУАССОНА; FORECASTING; PROBABILITY OF OUTCOMES OF GAMES; MATHEMATICAL EXPECTATION; POISSON DISTRIBUTION.


Аннотация: В статье предлагается алгоритм прогнозирования исходов игр в командных видах спорта, основанный на вероятностных оценках событий игровых матчей. Для расчета вероятностей забитых голов используется формула распределения Пуассона. Результаты работы могут быть использованы для осуществления прогнозов футбольных чемпионатов.

Индустрия игрового бизнеса во всем мире приобрела огромные масштабы, частным ее элементом является деятельность букмекерских контор. Правительство Российской Федерации предприняла меры по законодательному регулированию этого вида деятельности, и он является в настоящий момент узаконенным. Букмекерский рынок в России демонстрирует стабильный рост. К началу 2018 года число пунктов приема ставок по всей стране приблизилось к 7 тысячам (в начале 2017 года их было 6836) [1]. Прогнозирование результатов спортивных состязаний привлекает большое количество людей, аккумулирует значительные финансовые, материальные и интеллектуальные ресурсы, становится элементом экономических отношений. Прогнозирование является неотъемлемой частью букмекерского бизнеса, поэтому каждая букмекерская контора обязательно содержит штат аналитиков, занимающихся предсказанием исходов игровых ситуаций с использованием различных математических, статистических и вероятностных методов. В свою очередь клиенты букмекерских контор, желая получить выигрыш, также занимаются прогнозированием исходов различных спортивных событий, но делают это в основном бессистемно, зачастую полагаясь на собственную интуицию. Безусловно, такой подход не может предполагать системное получение выигрыша в продолжительное время.

Учитывая интерес к результатам ставок, развиваются и практически тестируются различные методы экстраполяции и прогнозирования результатов процессов в условиях малых выборок при большом количестве влияющих факторов, некоторые из которых заранее неизвестны.

Особенным спросом у клиентов букмекерских контор пользуются ставки на исходы игр в командных видах спорта, самым популярным из которых является футбол.

Одним из подходов к прогнозированию результатов игр в футболе является вероятностная оценка исходов матчей.

Деятельность букмекерских контор ориентирована на расстановку коэффициентов и формирование спортивной линии, которые напрямую увязаны с вероятностями исходов. Способ формирования коэффициентов и расчет вероятностей в любой букмекерской конторе на исходы П1 (победа первого), Х (ничья), П2 (победа второго) – является секретом. Крупные букмекерские конторы пользуются собственными разработками в этой области, которые хранятся в тайне и недоступны обычному игроку. Разработчики существующих бесплатных автоматизированных систем также не раскрывают свои алгоритмы. Но очевидно, что на вероятность наступления исходов П1, Х, П2 влияют различные параметры, среди которых (применительно к футболу) можно выделить:

— сила встречающихся команд;
— количество забитых и пропущенных каждой командой мячей;
— текущая форма команд;
— фактор домашнего поля;
— фактор судейства;
— мотивация команд;
— верная оценка сил соперника;
— состояния поля.

Можно предположить, что из вышеперечисленных параметров основным является сила встречающихся команд. Однако резонным вопросом является, каким образом численно выразить эту силу? Для этого необходимо создание единого нормированного рейтинга, что может стать чересчур затратной и ресурсоемкой задачей. Исследования показали, что при решении задачи нахождения вероятностей наступления исходов П1, Х, П2 довольно большую роль играют средние тоталы (количество голов, которые забивает конкретная одна команда за основное время футбольного матча) встречающихся команд. Именно на основании средних тоталов команд и разработана методика вероятностной оценки.

Следует учесть, что рассматриваемая методика может быть использована лишь в каком-либо круговом турнире, где команды играют друг с другом на своем и чужом поле (применительно к России это Российская футбольная Премьер-лига, Футбольная Национальная лига, Профессиональная футбольная лига). Методика не будет эффективной, если между собой будут играть команды из разных дивизионов (например, в Кубке России) или из разных стран (например, в Лиге Чемпионов). Следует учесть, что методика основана на результатах уже сыгранных матчей в рамках конкретного турнира, поэтому может применяться после прохождения какого-либо игрового этапа (например, в Российской Премьер-лиги проходит 30 туров по 8 матчей в каждом, и применение методики имеет смысл, начиная с 7-го тура, когда уже известны некоторые исходные показатели).

Непосредственно рассмотрим предлагаемую методику вероятностного прогнозирования исходов П1, Х, П2.

Для начала приведем турнирные показатели каждой команды к одному матчу. Имеем две встречающиеся в ближайшем туре команды: Команда 1 – хозяева (далее – K_1), Команда 2 – гости (далее – K_2). В прошествии некоторого турнирного отрезка обе команды имеют свою разницу забитых и пропущенных мячей. Получим среднюю разницу мячей для одного матча, поделив забитые и пропущенные мячи на количество сыгранных матчей. Соответственно средняя разница мячей для K_1:, для K_2: .

Также необходимо вычислить, какой суммарный средний тотал имеет весь рассматриваемый турнир. Эти величины можно узнать, используя понятие средней гипотетической команды (это понятие впервые встречается в описании способа расчета рейтинга Джеффа Сагарина, который был очень популярен в США для прогнозирования бейсбольных матчей). Поделив общее количество забитых мячей на общее количество матчей, проведенных в выбранном турнире, получим средний тотал чемпионата Соответственно, командные показатели середняка будут равны , то есть средняя разница мячей будет равна .

Попробуем ответить на следующие вопросы:

1. Если K_1 пропускает за матч голов от команды, которая забивает , то сколько K_1 пропустит от K_2, которая забивает голов за матч?
2. Если K_2 пропускает за матч голов от команды, которая забивает , то сколько K_2 пропустит от K_1, которая забивает голов за матч?

Для решения задачи необходимо перейти от операций со средним количеством забитых голов к операциям над численными значениями вероятности того, что команда противника не забьет. Так как количество голов, забитых в матче – дискретная случайная величина, то эта величина подчиняется распределению Пуассона:

P( \xi = k)=\frac{ \lambda ^k}{k!}*e^{- \lambda }
Читается формула так: случайная величина \xi имеет распределение Пуассона с параметром \lambda.

Введем функцию P(0)=100/e^{m*k}, где k должно быть напрямую связано с отношением пропущенных голов рассматриваемой команды к пропущенным голам средней гипотетической команды. Для K_1 , для K_2 соответственно .

Следовательно, чтобы найти среднее количество голов которое K_1 забьет в ворота K_2, достаточно просто перемножить статистические показатели команд, приведенные к одному матчу: .

Количество голов, забитое K_2 в ворота K_1, будет равно: .

Соотношение m_1 и m_2, это не что иное, как математическое ожидание счета, то есть мы предполагаем, что команды K_1 и K_2 завершат встречу со счетом m_1:m_2.

Немаловажным фактором является выступление команд дома и на выезде. По статистике принимающая сторона чаще добивается положительного результата. Нам известна разница мячей для K_1 в домашних матчах (представим ее в виде ) и разница мячей для K_2 в гостевых матчах (представим ее в виде ).

По приведенным выше рассуждениям мы можем найти математическое ожидание счета, исходя из выступлений K_1 на своем поле и K_2 на чужом: . После этого найдем среднее арифметическое между математическим ожиданием счетов m_1:m_2 и , которое будет равно m_{1cp}:m_{2cp}.

Впрочем, нельзя не учитывать текущую форму команд, если рассуждать логически, то вероятность победы у команды, которая выиграла пять последних матчей со счетом 1:0, будет ничуть не ниже, чем у команды, которая дважды выиграла 6:0 и трижды проиграла 0:1. Для этого введем величины, корректирующие математическое ожидание счета m_{1cp}:m_{2cp}.

Пусть K_1 набрала в последних пяти матчах X_1 очков, а K_2X_2 очков. Поделим X_1 и X_2 на 15 (максимально возможное количество очков за пять матчей), затем найдем разницу между X_1 и X_2 (обозначим ее X3) и в зависимости от результатов внесем коррективы в математическое ожидание счета m_{1cp}:m_{2cp}. Рассмотрим возможные варианты:

Именно математическое ожидание счета m_{1cp}:m_{2cp} будем использовать в дальнейших рассуждениях. На величины m_{1cp} и m_{2cp} также могут оказывать влияние многие факторы, такие как травмы и дисквалификации ведущих игроков, мотивация команд (при этом сумма m_{1cp}+m_{2cp} должна оставаться неизменной), Но такие факторы проблематично представить в математическом виде, поэтому в дальнейших расчетах эти величины будут иметь те значения, которые получились при первоначальных вычислениях.

Далее в соответствии с распределением Пуассона следует рассчитать вероятности того, что K_1 и R_2 забьют строго определенное количество голов (0, 1, 2, 3, 4, 5 и более). Вероятность того, что K_1 забьет ровно 0 голов, находим по формуле:

P1(0)  = \frac{m_{1cp}^0}{0!}*e^{- m_{1cp} }

По аналогичной формуле считаем вероятности того, что K_1 забьет 1, 2, 3, 4, 5 и более голов (Р1(1), Р1(2), Р1(3), Р1(4), Р1(5)).

Далее рассчитываем вероятность того, что K_2 забьет ровно 0 голов (согласно распределения Пуассона):

P2(0)  = \frac{m_{2cp}^0}{0!}*e^{- m_{2cp}}

Аналогично считаем вероятности того, что K_2 забьет 1, 2, 3, 4, 5 и более голов (Р2(1), Р2(2), Р2(3), Р2(4), Р2(5)).

Затем находим вероятности появления точного счета по формуле: P(x:y)=P(x)*P(y). Каждый вероятный счет матча относится к одному из трех исходов (П1, Х, П2). Для удобства приведем их в таблице 1.

Таблица 1.

Принадлежность вероятности наступления точного счета к исходам П1, Х, П2

Победа К1 (П1) Ничья (Х) Победа К2 (П2)
Р(1:0) = Р1(1)*Р2(0) Р(0:0) = Р1(0)*Р2(0) Р(0:1) = Р1(0)*Р2(1)
Р(2:0) = Р1(2)*Р2(0) Р(1:1) = Р1(1)*Р2(1) Р(0:2) = Р1(0)*Р2(2)
Р(3:0) = Р1(3)*Р2(0) Р(2:2) = Р1(2)*Р2(2) Р(0:3) = Р1(0)*Р2(3)
Р(4:0) = Р1(4)*Р2(0) Р(3:3) = Р1(3)*Р2(3) Р(0:4) = Р1(0)*Р2(4)
Р(5 и более:0) = Р1(>=5)*Р2(0) Р(4:4) = Р1(4)*Р2(4) Р(0:5 и более) = Р1(0)*Р2(>=5)
Р(2:1) = Р1(2)*Р2(1) Р(5 и более:5 и более) = Р1(>=5)*Р2(>=5) Р(1:2) = Р1(1)*Р2(2)
Р(3:1) = Р1(3)*Р2(1) Р(1:3) = Р1(1)*Р2(3)
Р(4:1) = Р1(4)*Р2(1) Р(1:4) = Р1(1)*Р2(4)
Р(5 и более:1) = Р1(>=5)*Р2(1) Р(1:5 и более) = Р1(1)*Р2(>=5)
Р(3:2) = Р1(3)*Р2(2) Р(2:3) = Р1(2)*Р2(3)
Р(4:2) = Р1(4)*Р2(2) Р(2:4) = Р1(2)*Р2(4)
Р(5 и более:2) = Р1(>=5)*Р2(2) Р(2:5 и более) = Р1(2)*Р2(>=5)
Р(4:3) = Р1(4)*Р2(3) Р(3:4) = Р1(3)*Р2(4)
Р(5 и более:3) = Р1(>=5)*Р2(3) Р(3:5 и более) = Р1(3)*Р2(>=5)
Р(5 и более:4) = Р1(>=5)*Р2(4) Р(4:5 и более) = Р1(4)*Р2(>=5)

Суммируя вероятности для каждого из трех столбцов, получаем вероятности каждого из трех исходов – победы K_1, ничьи и победы K_2. На основании этих вероятностей осуществляется прогноз. Если вероятность наступления какого-либо исхода намного превышает вероятность наступления остальных, то прогнозируется наступление именно этого исхода. Если же вероятности примерно равны, то для выставления прогноза необходимы дополнительные сведения, которые нельзя выразить формальным языком, а именно – мотивация команд, травмы ведущих игроков и т.д., которые позволят составить некую экспертную оценку и выставить наиболее подходящий прогноз.

На основе предложенного алгоритма разработана информационная автоматизированная система, позволяющая работать со статистикой игровых чемпионатов и осуществлять прогнозирование исходов футбольных матчей [2].


Список литературы

  1. Как устроен букмекерский бизнес в России // Информационное агентство «ОБЗОР.PRESS» : сайт. – URL: https://obzor.press/biznes/64698.
  2. Сазонтов А.С. Система прогнозирования исходов спортивных состязаний // Теоретические и прикладные вопросы образования и науки : сборник научных трудов по материалам международной научно-практической конференции. Тамбов : ООО «Консалтинговая компания Юком», 2014. – С. 172-173.