DSV_summaryval_calculation_random_uninfected_counties.R

# This code randomly selects a county and does same calculations as
# DSV_summaryval_calculation_infected_counties.R

library(terra)
library(tidyverse)

l1 <- list.files("...", pattern="dsv.*masked.tif", recursive=T, full.names=T)
l2 <- list.files("...", pattern="maskcml.*tif", recursive=T, full.names=T)

infx <- read.csv( ".../USAB_NPDN_combined_USETHIS.csv")
infxco <- infx %>% filter(!State %in% c("AZ", "HI", "VI", "MP", "GU", "AS", "PR", "IA", "KS","MN","ND","ID","NE","OR","SD","AK","LA","MT","CA","CO","NB","UT","WA","AR","MO","NM","OK","WY","NV","MS","DC","TX"))
infx_df <- infxco %>% arrange(year, yday)

co1 <- vect(".../helpful_shapes_rasters/counties3857.shp")

#cl <- makeCluster(2)
#registerDoParallel(cl)
#starttime <- Sys.time()

dsvnoinfext <- function(infdf, indx, cr1, dr1, ...){ #cr1 = cumul, dr1 = daily
  sel_df  = infdf[indx, ]
  print(sel_df)
  sel_cty = sel_df$st_ct
  sel_hzone = as.character(sel_df$zone)
  # Keep the starting county out of the sample of potential counties
  potential_co = co1[co1$hardinessz == sel_hzone & co1$stco != sel_cty,]
  # If potential_co is not empty, sample from it
  if (nrow(potential_co) > 0) {
    complem_zone = potential_co[sample(nrow(potential_co),1),]
  } else {
    print("No other counties in the same hardiness zone.")
  }  
  complem_zone = potential_co[sample(nrow(potential_co),1),]
  print(paste0("complement ",as.character(as.data.frame(complem_zone)[,2])))
  # Get the days/durations relevant to each period
  sday = as.numeric(sel_df$yday)
  print(sday)
  syr1 = as.numeric(sel_df$year)
  print(syr1)
  # If sday is < 14 Jan., need to add in previous year's raster. This won't
  # work for before 2009.
  if(sday < 30){
    dr1     = c(rast(l1[grepl((syr1-1), l1)]), dr1)
    dr1     = crop(dr1, complem_zone, mask=T)
    sday2   = sday + 365
    fortnt  = dr1[[(sday2-13):sday2]]
    fortnt  = app(fortnt, cumsum)
    fortnt  = fortnt[[nlyr(fortnt)]]
    monthly = dr1[[(sday2-29):sday2]]
    monthly = app(monthly, cumsum)
    monthly = monthly[[nlyr(monthly)]]
  } else {
    dr1     = dr1
    dr1     = crop(dr1, complem_zone, mask=T)
    fortnt  = dr1[[(sday-13):sday]]
    fortnt  = app(fortnt, cumsum)
    fortnt  = fortnt[[nlyr(fortnt)]]
    monthly = dr1[[(sday-29):sday]]
    monthly = app(monthly, cumsum)
    monthly = monthly[[nlyr(monthly)]]
  }
  cr1  = crop(cr1, complem_zone, mask=T)
  cuml = cr1[[1:sday]]
  cuml = cuml[[nlyr(cuml)]]
  
  # Extract summary values from each of the DSV rasters
  cmlmin = min(freq(cuml)$value)
  cmlmax = max(freq(cuml)$value)
  cmlavg = weighted.mean(freq(cuml)$value, freq(cuml)$count)
  cmlsd = sd(freq(cuml)$value)
  cmlmed = median(freq(cuml)$value)
  
  fntmin =  min(freq(fortnt)$value)
  fntmax =  max(freq(fortnt)$value)
  fntavg = weighted.mean(freq(fortnt)$value, freq(fortnt)$count)
  fntsd =  sd(freq(fortnt)$value)
  fntmed = median(freq(fortnt)$value)
  
  mnthmin =  min(freq(monthly)$value)
  mnthmax =  max(freq(monthly)$value)
  mnthavg = weighted.mean(freq(monthly)$value, freq(monthly)$count)
  mnthsd =  sd(freq(monthly)$value)
  mnthmed = median(freq(monthly)$value)
  
  ddf1 = data.frame(loc=as.character(infdf[indx,"st_ct"]),
                    date=as.character(infdf[indx,"Samp_date"]),
                    cmlmin=cmlmin, cmlmax=cmlmax, cmlavg=cmlavg, cmlsd=cmlsd,
                    cmlmedian = cmlmed,
                    fortntmin=fntmin, fortntmax=fntmax,
                    fortntavg=fntavg, fortntsd=fntsd, fortntmedian = fntmed,
                    mnthmin=mnthmin, mnthmax=mnthmax, mnthavg=mnthavg,
                    mnthsd=mnthsd, mthmedian = mnthmed)
  return(ddf1)
}

infx9  <- infx_df %>% filter(year == 2009) %>% arrange(yday)
infx10 <- infx_df %>% filter(year == 2010) %>% arrange(yday)
infx11 <- infx_df %>% filter(year == 2011) %>% arrange(yday)
infx12 <- infx_df %>% filter(year == 2012) %>% arrange(yday)
infx13 <- infx_df %>% filter(year == 2013) %>% arrange(yday)
infx14 <- infx_df %>% filter(year == 2014) %>% arrange(yday)
infx15 <- infx_df %>% filter(year == 2015) %>% arrange(yday)
infx16 <- infx_df %>% filter(year == 2016) %>% arrange(yday)
infx17 <- infx_df %>% filter(year == 2017) %>% arrange(yday)
infx18 <- infx_df %>% filter(year == 2018) %>% arrange(yday)
infx19 <- infx_df %>% filter(year == 2019) %>% arrange(yday)
infx20 <- infx_df %>% filter(year == 2020) %>% arrange(yday)

# Note that running this takes a couple of days on HPC for each year of first 6 years.  
# The later years have fewer reports and can run in less than a day for each year.

cr1 <- rast(l1[1])
dr1 <- rast(l2[1])
del09 <- lapply(351:nrow(infx9), function(x) dsvnoinfext(infx9, x, cr1, dr1))
del09 <- do.call(rbind, del09)
write.csv(del09, ".../hpc_outputs/noinfdsvstats2009b.csv", row.names = F)

cr1 <- rast(l1[2])
dr1 <- rast(l2[2])
del10 <- lapply(1:nrow(infx10), function(x) dsvnoinfext(infx10, x, cr1, dr1))
del10 <- do.call(rbind, del10)
write.csv(del10, ".../hpc_outputs/noinfdsvstats2010.csv", row.names = F)

cr1 <- rast(l1[3])
dr1 <- rast(l2[3])
del11 <- lapply(1:nrow(infx11), function(x) dsvnoinfext(infx11, x, cr1, dr1))
del11 <- do.call(rbind, del11)
write.csv(del11, ".../hpc_outputs/noinfdsvstats2011.csv", row.names = F)

cr1 <- rast(l1[4])
dr1 <- rast(l2[4])
del12 <- lapply(1:nrow(infx12), function(x) dsvnoinfext(infx12, x, cr1, dr1))
del12 <- do.call(rbind, del12)
write.csv(del12, ".../hpc_outputs/noinfdsvstats2012.csv", row.names = F)

cr1 <- rast(l1[5])
dr1 <- rast(l2[5])
del13 <- lapply(1:nrow(infx13), function(x) dsvnoinfext(infx13, x, cr1, dr1))
del13 <- do.call(rbind, del13)
write.csv(del13, ".../hpc_outputs/noinfdsvstats2013.csv", row.names = F)

cr1 <- rast(l1[6])
dr1 <- rast(l2[6])
del14 <- lapply(1:nrow(infx14), function(x) dsvnoinfext(infx14, x, cr1, dr1))
del14 <- do.call(rbind, del14)
write.csv(del14, ".../hpc_outputs/noinfdsvstats2014.csv", row.names = F)

cr1 <- rast(l1[7])
dr1 <- rast(l2[7])
del15 <- lapply(1:nrow(infx15), function(x) dsvnoinfext(infx15, x, cr1, dr1))
del15 <- do.call(rbind, del15)
write.csv(del15, ".../hpc_outputs/noinfdsvstats2015.csv", row.names = F)

cr1 <- rast(l1[8])
dr1 <- rast(l2[8])
del16 <- lapply(1:nrow(infx16), function(x) dsvnoinfext(infx16, x, cr1, dr1))
del16 <- do.call(rbind, del16)
write.csv(del16, ".../hpc_outputs/noinfdsvstats2016.csv", row.names = F)

cr1 <- rast(l1[9])
dr1 <- rast(l2[9])
del17 <- lapply(1:nrow(infx17), function(x) dsvnoinfext(infx17, x, cr1, dr1))
del17 <- do.call(rbind, del17)
write.csv(del17, ".../hpc_outputs/noinfdsvstats2017.csv", row.names = F)

cr1 <- rast(l1[10])
dr1 <- rast(l2[10])
del18 <- lapply(1:nrow(infx18), function(x) dsvnoinfext(infx18, x, cr1, dr1))
del18 <- do.call(rbind, del18)
write.csv(del18, ".../hpc_outputs/noinfdsvstats2018.csv", row.names = F)

cr1 <- rast(l1[11])
dr1 <- rast(l2[11])
del19 <- lapply(1:nrow(infx19, function(x) dsvnoinfext(infx19, x, cr1, dr1))
del19 <- do.call(rbind, del19)
write.csv(del19, ".../hpc_outputs/noinfdsvstats2019.csv", row.names = F)

cr1 <- rast(l1[12])
dr1 <- rast(l2[12])
del20 <- lapply(1:nrow(infx20), function(x) dsvnoinfext(infx20, x, cr1, dr1))
del20 <- do.call(rbind, del20)
write.csv(del20, ".../hpc_outputs/noinfdsvstats2020.csv", row.names = F)