Ace%, hold%, first serve %, points won on serve — какие сёрв-метрики предсказывают исход и как они попадают в ML модель.
В теннисе 5 основных сёрв-метрик влияют на прогноз: (1) 1st serve % — доля попадания первой подачи (60-75%); (2) Points won on 1st serve — доля выигранных очков на первой (65-80%); (3) Points won on 2nd serve — на второй (50-60%); (4) Ace % — доля эйсов от всех подач (5-15%); (5) Double fault % — двойных (2-5%). Для прогноза победителя самая важная композиция — Service hold % = долгая формула от всех метрик выше. Top-игроки держат 85-92% своих сетов, средний ATP — 75-80%.
Ace% сильно коррелирует с выигрышем: каждый +1% ace rate ≈ +2.5% шансов на hold. Но это не чистый predictor — высокий ace% идёт вместе с высоким 1st serve %. В ML модели отдельно добавлять ace% даёт minimal gain (feature importance ~0.03) по сравнению с serve_points_won (importance ~0.30). Ace% полезен как proxy для total points модели: больше эйсов = короче розыгрыши = меньше total games → модель total over/under подтягивает это.
В модели Pure Math Winner две наиболее weighted features: (1) serve_points_won_weighted_avg_last_20 и (2) return_points_won_weighted_avg_last_20. Разница (own_serve − opp_return) предсказывает service hold rate. Если игрок A держит 82% а игрок B ломает только 25% сетов — прогноз A win близок к 85%. Эти цифры обновляются после каждого матча (weighted recency — свежие матчи имеют больший вес). Последние 20 матчей — optimal window по cross-validation.
Serve эффективность сильно зависит от покрытия. На Grass (Wimbledon): ace% +50% от base, hold% +5-8%. На Clay (Roland Garros): ace% -40%, hold% -5-8%. На Hard (Australian/US Open): baseline. Модель StarkTennis имеет отдельные surface-adjusted serve stats — если игрок A на grass держит 88%, а обычно 80% — модель знает что grass boost работает именно для него. Карлос Алькарас на clay держит +6% от baseline, John Isner на grass +11%. Такие individual adjustments есть по топ-200 игрокам.
(1) Малая выборка: 2-3 матча назад не надёжно. Модель требует ≥10 матчей на данной surface за последние 12 месяцев. (2) Injury: если игрок возвращается после 3+ месяцев пропуска — serve stats часто хуже 20% первые матчи. Модель помечает это флагом injury_return. (3) Altitude: Madrid, Mexico City — на высоте ace% повышается +15% у всех. Модель корректирует baseline. (4) Heat: жара снижает first serve % (усталость). Это учитывается через weather feature когда доступен.
Если ставите на тотал больше — ищите матчи между двумя big-servers с hold > 85% у обоих (Isner, Opelka, Kyrgios). Такие матчи идут в 5 сетов с тай-брейками, total games 40+ (over 38.5 line). Если ставите на тотал меньше — ищите return специалистов (Djokovic, Medvedev, Ruud) против слабых серверов на clay. Total games 20-24, under 24.5 работает. Общий принцип: serve stats предсказывают total better чем winner (для winner важнее pressure points, mental).
Ace rate ≠ winner. Isner держит сет 93% (топ-1 в истории), но ломает соперника только 15% (worst среди топ-50). В tiebreak-лотерее он не фаворит. Модель winner взвешивает ОБЕ стороны.
Да. Points won on 2nd serve — отдельный feature. Игроки с weak 2nd serve (Kyrgios 48%) уязвимы на breakpoints даже при mighty 1st serve. Модель это ловит.
Adult ATP игроки — медленно (years). Но можно упасть быстро: возраст 30+ часто теряет -3-5% на 1st serve % за 2 года. Модель использует rolling window 20 матчей — автоматически реагирует.
Теория — полезно, практика — полезнее. Все модели StarkTennis работают в реальном времени:
📊 Открыть миниаппTelegram канал: @cxcap. Обновление каждые 30 минут. Всё бесплатно.