Извлечение определенных столбцов из фрейма данных

234

У меня есть R-кадр данных с 6 столбцами, и я хочу создать новую фреймворк данных, в которой есть только три столбца.

Предполагая, что мой кадр данных df, и я хочу извлечь столбцы A, B и E, это единственная команда, которую я могу выяснить:

 data.frame(df$A,df$B,df$E)

Есть ли более компактный способ сделать это?

Теги:
dataframe

8 ответов

310
Лучший ответ

Да, есть.

# data for reproducible example
# (and to avoid confusion from trying to subset `stats::df`)
df <- setNames(data.frame(as.list(1:5)), LETTERS[1:5])
# subset
df[,c("A","B","E")]
  • 3
    Это дает object of type 'closure' is not subsettable ошибки object of type 'closure' is not subsettable .
  • 22
    @ArenCambre: тогда ваш data.frame на самом деле не называется df . df также является функцией в пакете статистики.
Показать ещё 9 комментариев
65

Это роль функции subset():

> dat <- data.frame(A=c(1,2),B=c(3,4),C=c(5,6),D=c(7,7),E=c(8,8),F=c(9,9)) 
> subset(dat, select=c("A", "B"))
  A B
1 1 3
2 2 4
  • 0
    Когда я пытаюсь это сделать с моими данными, я получаю сообщение об ошибке: «Ошибка в x [j]: недопустимый тип индекса« list »» Но если c («A», «B») не является списком, что это такое? ?
  • 0
    @Rafael_Espericueta Трудно угадать без просмотра вашего кода ... Но c("A", "B") - это вектор, а не список.
Показать ещё 1 комментарий
42

Есть два очевидных варианта: Джошуа Ульрих df[,c("A","B","E")] или

df[,c(1,2,5)]

как в

> df <- data.frame(A=c(1,2),B=c(3,4),C=c(5,6),D=c(7,7),E=c(8,8),F=c(9,9)) 
> df
  A B C D E F
1 1 3 5 7 8 9
2 2 4 6 7 8 9
> df[,c(1,2,5)]
  A B E
1 1 3 8
2 2 4 8
> df[,c("A","B","E")]
  A B E
1 1 3 8
2 2 4 8
25

Используя dplyr, если ваш data.frame называется df1:

library(dplyr)

df1 %>%
  select(A, B, E)

Это также можно записать без трубы %>% как:

select(df1, A, B, E)
  • 1
    Учитывая значительную эволюцию Tidyverse с момента публикации моего вопроса, я переключил ответ вам.
6

Снова используя dplyr, где df1 - ваш исходный фрейм данных:

df2 <- subset(df1, select = c(1, 2, 5))
  • 6
    Это не использует dplyr . Он использует base::subset и идентичен ответу Stephane Laurent за исключением того, что вы используете номера столбцов вместо имен столбцов.
  • 0
    отредактировано, чтобы уточнить, что подмножество не dplyr
5

Вы также можете использовать пакет sqldf, который выполняет выборки в кадрах данных R как:

df1 < - sqldf ( "выберите A, B, E из df" )

В качестве вывода выдается кадр данных df1 со столбцами: A, B, E.

2

По какой-то причине только

df[, (names(df) %in% c("A","B","E"))]

работал у меня. Все приведенные выше синтаксисы дали "undefined выбранные столбцы".

  • 0
    Я получил точно такую же ошибку, но ваше решение работает и для меня. Спасибо
0

[ и подмножество не подменяются:

[ возвращает вектор, если выбран только один столбец.

df = data.frame(a="a",b="b")    

identical(
  df[,c("a")], 
  subset(df,select="a")
) 

identical(
  df[,c("a","b")],  
  subset(df,select=c("a","b"))
)
  • 4
    Нет, если вы установите drop=FALSE . Пример: df[,c("a"),drop=F]

Ещё вопросы

Сообщество Overcoder
Наверх
Меню