У меня есть R-кадр данных с 6 столбцами, и я хочу создать новую фреймворк данных, в которой есть только три столбца.
Предполагая, что мой кадр данных df
, и я хочу извлечь столбцы A
, B
и E
, это единственная команда, которую я могу выяснить:
data.frame(df$A,df$B,df$E)
Есть ли более компактный способ сделать это?
Да, есть.
# data for reproducible example
# (and to avoid confusion from trying to subset `stats::df`)
df <- setNames(data.frame(as.list(1:5)), LETTERS[1:5])
# subset
df[,c("A","B","E")]
Это роль функции subset()
:
> dat <- data.frame(A=c(1,2),B=c(3,4),C=c(5,6),D=c(7,7),E=c(8,8),F=c(9,9))
> subset(dat, select=c("A", "B"))
A B
1 1 3
2 2 4
c("A", "B")
- это вектор, а не список.
Есть два очевидных варианта: Джошуа Ульрих df[,c("A","B","E")]
или
df[,c(1,2,5)]
как в
> df <- data.frame(A=c(1,2),B=c(3,4),C=c(5,6),D=c(7,7),E=c(8,8),F=c(9,9))
> df
A B C D E F
1 1 3 5 7 8 9
2 2 4 6 7 8 9
> df[,c(1,2,5)]
A B E
1 1 3 8
2 2 4 8
> df[,c("A","B","E")]
A B E
1 1 3 8
2 2 4 8
Используя dplyr, если ваш data.frame называется df1
:
library(dplyr)
df1 %>%
select(A, B, E)
Это также можно записать без трубы %>%
как:
select(df1, A, B, E)
Снова используя dplyr, где df1 - ваш исходный фрейм данных:
df2 <- subset(df1, select = c(1, 2, 5))
dplyr
. Он использует base::subset
и идентичен ответу Stephane Laurent за исключением того, что вы используете номера столбцов вместо имен столбцов.
Вы также можете использовать пакет sqldf
, который выполняет выборки в кадрах данных R как:
df1 < - sqldf ( "выберите A, B, E из df" )
В качестве вывода выдается кадр данных df1
со столбцами: A, B, E.
По какой-то причине только
df[, (names(df) %in% c("A","B","E"))]
работал у меня. Все приведенные выше синтаксисы дали "undefined выбранные столбцы".
[
и подмножество не подменяются:
[
возвращает вектор, если выбран только один столбец.
df = data.frame(a="a",b="b")
identical(
df[,c("a")],
subset(df,select="a")
)
identical(
df[,c("a","b")],
subset(df,select=c("a","b"))
)
drop=FALSE
. Пример: df[,c("a"),drop=F]
object of type 'closure' is not subsettable
ошибкиobject of type 'closure' is not subsettable
.df
.df
также является функцией в пакете статистики.