HC Pure Math — Monte Carlo симуляция

3000 симуляций матча через Glicko-2 → hold% → set → match. Без ML, без обучения. Независимый сигнал от ML моделей — идеальный 4-й голос для Trio.

Как работает эта модель

HC Pure Math — семейство моделей без машинного обучения. Принцип: вместо тренировки на исторических данных, мы реализовали точную теоретическую модель тенниса на основе Glicko-2 рейтингов и Monte Carlo симуляции. Workflow для каждого матча: (1) получаем serve rating и return rating обоих игроков из Glicko-2 таблицы, (2) вычисляем P(выигрыша очка на подаче) для обоих через Bradley-Terry формулу, (3) из P(point) вычисляем P(удержания гейма) через замкнутую формулу для двух независимых биномиальных выборок, (4) из P(hold) — P(выигрыша сета) через рекурсивную матричную формулу включая tiebreak, (5) из P(set) — P(выигрыша матча) через best-of-3 или best-of-5 сетевую сетку. Для distribution margin (нужно для HC) — запускаем 3000 Monte Carlo симуляций полного матча, сохраняя games_a и games_b для каждой. Получаем эмпирическое распределение (margin_a − margin_b) и вычисляем P(margin ≥ line) для всех линий (2.5/3.5/4.5/5.5). Плюсы подхода: модель НЕ может overfit на исторические данные (она не училась), даёт independent signal vs ML моделей. Минусы: не учитывает фичи вне Glicko-2 рейтинга (форма, H2H, усталость). Идеальный 4-й голос для Trio — когда ML-модели согласны, а Pure Math тоже согласна = максимальная уверенность. На выборке 8 picks (ранний тест): 5W/2L/1void, WR 71%.

Частые вопросы по модели

Почему это лучше ML если результаты сопоставимы?

Ключевая разница — корреляция ошибок. Все ML-модели могут синхронно ошибаться на out-of-distribution матчах (новые условия, нестандартные игроки). Pure Math ошибается по-другому — только если Glicko-2 рейтинг неверный. Независимая модель → лучший ансамбль в Trio.

Сколько времени занимает Monte Carlo симуляция?

3000 симуляций занимают ~50-80ms на одной паре игроков. Кэшируется по (pa_hold, pb_hold, bo) — одна симуляция покрывает все 4 линии (2.5/3.5/4.5/5.5). Для прогноза на 100 матчей ~8 секунд.

Почему именно 3000 симуляций?

Компромисс скорость vs точность. 3000 даёт стандартную ошибку ±0.9% для оценки P(margin ≥ X). Для наших edge-порогов (≥8%) достаточно. При 10000 точность ±0.5% но в 3x дольше.

Другие модели StarkTennis

Посмотреть live прогнозы

Модель даёт сигналы в реальном времени — доступны бесплатно в миниаппе сайта. Каждый pick помечается edge, Kelly ¼ размером ставки и real-time статистикой.

📊 Открыть все прогнозы

Telegram канал с сигналами: @cxcap. Обновление каждые 30 минут.

О проекте StarkTennis

StarkTennis — исследовательская лаборатория теннисных прогнозов ATP и WTA. Ансамбль из 20 ML моделей (XGBoost, CatBoost, LightGBM quantile regression) плюс математические методы без машинного обучения (Glicko-2 Bradley-Terry, Monte Carlo симуляции). Trio meta-consensus фильтр выдаёт самые безопасные picks когда 3+ независимых моделей одного семейства согласны.

Все прогнозы бесплатны, статистика каждой модели обновляется в реальном времени с прозрачным трекингом реального P&L по flat-1000₽ ставке. Сервис не является букмекером и не принимает ставки. Не рекомендация к реальной игре — используйте только для исследовательских целей и понимания value в тенниса.