[AI分析] 线性回归训练集占比参数调整

yhdata_299631f7青铜一 显示全部楼层 发表于 2023-7-11 09:16:01 |阅读模式 打印 上一主题 下一主题
1
已解决
线性回归数据集,在算法里面调整训练集占比参数,系统默认是0.8,手动调成了0.9,能否调成1或者0.99呢

最佳答案

yhdata_yzm 关注Ta

2023-07-11 09:16:02

在线性回归算法中,训练集占比参数通常指的是将原始数据集划分为训练集和测试集时,训练集所占的比例。常见的做法是将数据集按照指定的比例划分为训练集和测试集,以便评估模型在未见过的数据上的性能表现。 一般情况下,将训练集占比参数设置为0.8是为了保留一部分数据用于测试,以便评估模型的泛化能力。然而,你可以根据实际需求调整训练集占比参数,包括将其调整为1或0.99。 如果将训练集占比参数设置为1,即使用全部的数据 ...
查看完整内容
回复

使用道具 举报

精彩评论1

yhdata_yzm 显示全部楼层 发表于 2023-7-11 09:16:02
在线性回归算法中,训练集占比参数通常指的是将原始数据集划分为训练集和测试集时,训练集所占的比例。常见的做法是将数据集按照指定的比例划分为训练集和测试集,以便评估模型在未见过的数据上的性能表现。

一般情况下,将训练集占比参数设置为0.8是为了保留一部分数据用于测试,以便评估模型的泛化能力。然而,你可以根据实际需求调整训练集占比参数,包括将其调整为1或0.99。

如果将训练集占比参数设置为1,即使用全部的数据作为训练集,那么你将没有留下数据用于模型的测试和评估。这可能会导致模型在未见过的数据上的性能表现不佳,因为你没有对模型进行充分的验证。

如果将训练集占比参数设置为0.99,即使用99%的数据作为训练集,这样留下的1%数据可以用于测试和评估模型。尽管这种情况下有少量数据用于评估模型的性能,但在实际应用中,这样的数据量可能仍然过小,无法充分验证模型的泛化能力。

因此,在调整训练集占比参数时,需要权衡考虑数据量、模型的性能评估以及对模型泛化能力的要求。根据具体情况,你可以选择适当的训练集占比参数,使得模型能够得到合理的训练和评估。
回复

使用道具 举报

高级模式
您需要登录后才可以回帖 登录 | 免费注册

  • 官方微信

    欢迎关注永洪服务号!收费为0,价值无限

    扫码关注
  • 新浪微博

    让每位用户轻松挖掘数据价值!

    访问新浪微博
  • 智能客服
50W

会员等你来哦

Copyright   ©2012-2024  北京永洪商智科技有限公司  (京ICP备12050607) 京公网安备110110802011451号 |联系社区管理员|《永洪社区协议》
返回顶部