漫游猫认证
(1)收集数据:采用各种方法收集数据,比如爬虫等;
(2)准备数据:因为需要计算距离,所以数据类型应该是数值型,最好是结构化数据格式;
(4)训练算法:这是关键的一步,训练的目的是找到最佳的分类回归系数,可以使用随机梯度上升法;
(5)测试算法:训练完成,将数据投入模型进行测试;