时间:01-19人气:13作者:把你遗忘
多元线性回归需要足够多的数据才能保证模型准确,一般样本量要大于自变量个数的10倍。比如3个自变量至少需要30个样本,5个自变量至少需要50个样本。数据太少会导致模型不稳定,预测结果不可靠。实际应用中数据越多越好,几百个样本是比较理想的数量。
数据质量也很重要,要覆盖各种情况。比如预测房价需要不同地段、面积、户型的房子数据。数据要分布均匀,避免集中在某个范围。缺失值和异常值需要处理干净,不然会影响模型效果。收集数据时尽量让变量之间没有强烈关联,这样模型才不会出错。
注意:本站部分文字内容、图片由网友投稿,如侵权请联系删除,联系邮箱:happy56812@qq.com