我想循环通过时间间隔,并标记这些观察是在间隔内。此外,我希望解在设置间隔长度时是灵活的。到目前为止,我设法做了某事。像这样:
set.seed(1)
data=data.frame(start_year=sample(2007:2017,100,TRUE),start_month=sample(1:12,100,TRUE))
window_length=2
month=6
iteration_variable=2
end_horizon=2007+window_length+iteration_variable
start_horizon=2007+iteration_variable
data$period=ifelse( (data$start_year<=end_horizon & data$start_month<=month ) & (start_horizon<=data$start_year & month<=data$start_month ),1,0)我希望有一个更优雅的版本,但请记住,我不想使用caret,因为我需要将多重估计合并起来,并在每个折叠中仔细分析复杂的计算。
发布于 2017-09-12 17:36:39
如果将年份和月份转换为"yearmon"类,则可以进行直接比较:
library(zoo)
to_ym <- function(y, m) as.yearmon(y + (m-1)/12)
ym <- with(data, to_ym(start_horizon, start_month))
st <- to_ym(start_horizon, month)
en <- to_ym(end_horizon, month) ##
period <- (ym >= st & ym <= en) + 0另外,如果en是st之后的已知数,比如它在哪里是2,那么我们可以只写:
en <- st + 2而不是标记为##的行(如果它是已知的年份和月份数,例如2+ 6/12 = 2.5,则为2年和6个月)。
https://stackoverflow.com/questions/46181967
复制相似问题