我正在尝试使用Facebook Prophet和Pandas UDF on spark来扩展多个模型。一切都很好,但我想通过给函数提供不同的参数来改进模型。
该函数在我的数据集的ID列上分组,该数据集是国家/地区和产品的组合。我想要的功能是将国家特定的假日应用到模型中,添加到一般的季节性数据框架中,例如,我用它来消除COVID19对数据的影响。最终,我希望根据ID值更改任何其他参数(例如,不同类型的增长)。
谢谢你的好意帮助。
发布于 2021-04-22 12:06:02
我想我解决这个问题的方法是在训练数据集中添加另一个列,然后为每个相应的模型ID指向该列的第一个值。
因此,例如,如果数据具有不同ID的每日数据点,并且ID与美国国家/地区相关,则新列将指向此国家/地区级别季节性的值。
日期,id,值,国家/地区 4/1,US-Item1,10,US 4/1,IT-Item1,5,IT 4/1,US-Item2,15,US
https://stackoverflow.com/questions/66084209
复制相似问题