Predpokladajme nasledujúcej tabuľke:
data <- data.table(dummy=1:10)
Viem, že môžete urobiť nasledovné veci:
data[dummy < 5, c("test1", "test2") := list("Yes", 1)]
a:
data[, test1 := fcase(dummy < 5, "Yes")]
data[, test2 := fcase(dummy < 5, 1)]
Snažím sa spojiť ich do jednej, tak ako:
data[, c("test1", "test2") := fcase(dummy < 5, list("Yes", 1))]
Ale to mi dáva nasledujúce chybové hlásenie:
Error in fcase(dummy < 5, list("Yes", 1)) :
Length of output value #2 must either be 1 or length of logical condition.
Musím ísť cez viaceré filtre, tak to dáva zmysel používať fcase
. Môžem vždy uchyľujú k používaniu prvé riešenie pre každý filter tak ako:
data[dummy < 5, c("test1", "test2") := list("Yes", 1)]
data[dummy > 7, c("test1", "test2") := list("No", 0)]
data[between(dummy, 5, 7), c("test1", "test2") := list("Maybe", NA)]
ale ja som premýšľal, či tam nie je niečo viac, ako je to možné. K dispozícii je tiež riešenie vytvorenie tabuľky s každú kombináciu test1
a test2
a zlúčiť táto tabuľka s údajmi tabuľka po tom, fcase
len test1
tak ako:
tests <- data.table(test1 = c("Yes", "No", "Maybe"),
test2 = c(1, 0, NA))
data[, test1 := fcase(dummy < 5, "Yes",
dummy > 7, "No",
between(dummy, 5, 7), NA_character_)]
merge(data, tests, by = "test1", all.x = T, sort = F)
Ale to sa zdá byť neefektívne pre veľké a komplexné datatable