要先了解清楚数据的本质和特性,考虑数据对分析主题是否有帮助,以找出能解释问题的特征,增加预测的准确度。
在马会和马报纸、官网站上找到的一般都是基本资料(或可称为原始数据),大约可分为4类:
· 赛事资料: 场次、日期、地点、跑道、途程、场地状况、班次
· 马匹资料: 马名、马龄、体重、评分、练马师
· 马匹赛况: 马号、骑师、负磅、档位、独赢赔率
· 比赛结果: 走位、名次、分段时间、总时间、胜负距离
在模型中当然可以只用以上的数据,但对赛事结果的预测准确度肯定不足,如果有看马经或马报的朋友都知道,其实还有很多资料可以使用從賭博的角度看,賭馬是一種很高深的學問。
赌马“十赌九输”有诗为证:
枯藤老树昏鸦,
深渊光头回家,
搬砖一年赌马,
一把输光裤衩,
夕阳西下,
天台风有点大。
工欲善其事,必先利其器
以上为平面图。
一、准则层对于目标层的判断矩阵及单排序和一致性检验
这一部分名称取材于官网 ,点击 黑三角 即可得到相应的名称和对应的当期数据参数。
二、方案层对于目标层的判断矩阵及单排序和一致性检验
Numero- 序号(赛马对应跑道)
Chebal-马匹素质排位
Déferré-赤足
Sexe- 性别
Age- 马龄
Driver-驾驭手
Distance-赛距离
Gains-赢得奖金
Repport reference-马场赔率
Rapport direct-即时概率
针对上述10项参数,依次填入(输入)相应表格中。并即时得到当次预测结果。
例如:
述10项参数:
1、Numero- 序号(1、赛马对应跑道)
以此类推:
4、马性别
5、马龄
6、驾驭手
7、赛距离
8、赢得奖金
9、开盘赔率
10、即时赔率
三、层次总排序计算
最终得到:
四、实战预测层次总排序计算
例1、
排序后,最结论是:
现场跑出是:13 3 15 2 11
退赛:9
跳马:4-5-8-9
例2:
2017/12/15 拉车马
13-18号多跑25米。2850m+25M
官网预测前8名:14 15 18 6 17 12 3 8 (官网预测8码测中1个)
现场跑出依次是:6 4 1 2 12 15 14 11 13 10 5 9 3 16 7 - 8 - 17 – 18
而我“用Excel实现层次分析18匹拉车马法的精确计算”的预测前8名如下:7 10 2 1 12 18 6 15
实战可见其预测成功率远大于官网或“马专家”。
特点1、 本软件预测成功率远高于“马专家”及官网的预测率;
特点2、整过预测过程约几分钟,无需买马报,有网就行,且不需有马经验;
特点3、可在网上直接参赌马;
特点4、拉车马的成功率远大于奔跑马;
特点5、拉车马跑的距离越远越接近预测峰值;
特点6、奔跑马跑的距离越远越接近“崩溃”,不可预测。
********************************************************
设计软件,实为爱好,不为参赌博,储藏为之。
如果有那么一天闲暇下来,或退休,再实战。
********************************************************
我撰写在《casino-赌马:法国赛马彩票技术帖》里的参数:
胜出率:0.339095387最终得出结论,依次为:
骑师最重要,胜出率: 0.339095387
训练师次之,胜出率: 0.307487279
匹马再次之,胜出率: 0.296410022
所以骑师比赛马更重要,并大出4个百分点。
检查数据 (Data Cleaning)
做好特征工程后抽取需要使用的特征,这例子使用的特征意义如下:
· Run: 场次ID,由年/月/日/场次
· Date: 赛事日期
· HrNO: 比赛马匹编号
· Age: 马龄
· HrWt: 马匹体重
· WtCr: 负磅
· L1Class: 上场与今场班次改变
· AVG4FinPos: 过去四场平均完成名次
· L1Rating: 上场与今场评分改变
· L1HrWt: 上场与今场体重改变
· LastRun: 上场与今场相距日数
· FO: 是否胜出赛事,1是胜出,0是落败
· FinPos: 完成名次
· FinOdd: 最终赔率
提取数据后对数据做些分析,看数据有没有问题:
· 分布情况: 数量 / 平均值(mean) / 标准偏差(standard deviation) / 异常数值(outlier)
1. 首先把有异常数值的数据拿走,可以是一场中其中一只马匹的数据,亦可以是删去整场数据
2. 再看有没有特征的标准偏差太小
· 数据检查: 缺失值(NA) / 无限值(Inf) / 错误值(Typo)
· 数据处理:
1. 标准化: 利用每个因子的平均值和标准偏差把不同数值单位的因子标准化以加快建模速度
2. 罝入数据: 以平均值 / 中位数 / 常数 / 0值替代缺失值 / 无限值 / 错误值等
各相关权重相关系数图:
经过以上这么多的步骤,用来建立模型的数据已准备得差不多。
很多很多,以后参赌时详细填调参数。
是时候啦,告一段落!