时间:01-19人气:25作者:初恋栀子花
k近邻算法的k值一般取3到15之间,具体看数据量大小。数据少时k值小些,避免过度平滑;数据多时k值大些,减少噪声影响。实际应用中k=5或k=10很常见,k=3在小型数据集上表现也不错。k值太小容易过拟合,太大会忽略局部特征,需要反复测试确定最优值。
k值选择没有固定标准,常用方法包括交叉验证和网格搜索。小数据集k值不宜超过样本数1/3,大数据集k值可以适当增大。图像识别常用k=1到k=7,文本分类常用k=5到k=20。k值取奇数可以避免平票情况,实际中k=9或k=11也经常被采用。
注意:本站部分文字内容、图片由网友投稿,如侵权请联系删除,联系邮箱:happy56812@qq.com