Существует ли функция R для нахождения индекса элемента в векторе?

Question

Существует ли функция R для нахождения индекса элемента в векторе?

244

В R у меня есть элемент x и вектор v. Я хочу найти первый индекс элемента в v, который равен x. Я знаю, что один из способов сделать это: which(x == v)[[1]], но это кажется чрезмерно неэффективным. Есть ли более прямой способ сделать это?

Для бонусных очков существует ли функция, которая работает, если x - вектор? То есть, он должен возвращать вектор индексов, указывающий положение каждого элемента x в v.

Ryan Thompson 07 апр. 2011, в 06:55

Источник

0

Так как R оптимизирован для работы с векторами, which(x == v)[[1]] не так уж и неэффективно. Это один оператор сравнения ( == ), применяемый ко всем элементам вектора, и одно подмножество индексов ( which ). Вот и все. Ничего, что должно быть актуально, если вы не выполняете 10.000 повторений для этой функции. Другие решения , как match и Position не может возвращать столько данных , сколько which , но они не обязательно более эффективным.
BurninLeo 11 окт. 2015, в 18:09
2

В моем вопросе было указано, что я бы предпочел функцию, которая была векторизована над x, а which(x == v)[[1]] - нет.
Ryan Thompson 11 окт. 2015, в 22:12

Теги:

r

indexing

match

vectorization

4 ответа

19

функция Position в funprog {base} также выполняет задание. Он позволяет передавать произвольную функцию и возвращает первое или последнее совпадение.

Position(f, x, right = FALSE, nomatch = NA_integer)

pedroteixeira 11 фев. 2013, в 16:25

7

Небольшое замечание об эффективности вышеперечисленных методов:

 library(microbenchmark)

  microbenchmark(
    which("Feb" == month.abb)[[1]],
    which(month.abb %in% "Feb"))

  Unit: nanoseconds
   min     lq    mean median     uq  max neval
   891  979.0 1098.00   1031 1135.5 3693   100
   1052 1175.5 1339.74   1235 1390.0 7399  100

Итак, лучший из них

    which("Feb" == month.abb)[[1]]

andrii 17 май 2018, в 18:46

0

R перегрузил двойной оператор == с помощью метода поиска индекса иглы в векторной стоге сена. Он дает вектор logical, содержащий значения TRUE для каждого совпадения в стоге сена.

Пример:

haystack <- c(1, 2, 4, 3, 4)
needle <- 4
indices <- needle == haystack
indices
[1] 3  5
haystack[indices]
[1] 4  4

Он работает, если оба являются векторами и могут быть расширены для использования нескольких векторов.

hiten2 18 окт. 2016, в 13:49

2

Оператор == уже упоминался в моем вопросе как неэффективное решение, которое не работает с вектором игл.
Ryan Thompson 18 окт. 2016, в 14:35
0

«это работает, если оба являются векторами» - возможно, в зависимости от того, что вы имеете в виду ... но не в том смысле, в котором хотел ОП.
Frank 18 окт. 2016, в 17:29
24

Я получаю FALSE FALSE TRUE FALSE TRUE вместо индексов в этом примере
Sashko Lykhenko 31 окт. 2017, в 10:38
2

Вы никогда не запускали это в R. == возвращает логический вектор, а не индексы. Для этого вам нужно which() , как я объяснил 7 лет назад.
Joris Meys 29 нояб. 2018, в 16:48

Показать ещё 2 комментария

Ещё вопросы

Так как R оптимизирован для работы с векторами, which(x == v)[[1]] не так уж и неэффективно. Это один оператор сравнения ( == ), применяемый ко всем элементам вектора, и одно подмножество индексов ( which ). Вот и все. Ничего, что должно быть актуально, если вы не выполняете 10.000 повторений для этой функции. Другие решения , как match и Position не может возвращать столько данных , сколько which , но они не обязательно более эффективным.
В моем вопросе было указано, что я бы предпочел функцию, которая была векторизована над x, а which(x == v)[[1]] - нет.
Оператор == уже упоминался в моем вопросе как неэффективное решение, которое не работает с вектором игл.
«это работает, если оба являются векторами» - возможно, в зависимости от того, что вы имеете в виду ... но не в том смысле, в котором хотел ОП.
Я получаю FALSE FALSE TRUE FALSE TRUE вместо индексов в этом примере
Вы никогда не запускали это в R. == возвращает логический вектор, а не индексы. Для этого вам нужно which() , как я объяснил 7 лет назад.

Joris Meys · Accepted Answer · 2011-04-07T08-38-00.000Z

Функция match работает на векторах:

x <- sample(1:10)
x
# [1]  4  5  9  3  8  1  6 10  7  2
match(c(4,8),x)
# [1] 1 5

match возвращает только первое совпадение в соответствии с запросом. Он возвращает позицию во втором аргументе значений в первом аргументе.

Для множественного соответствия %in% - путь:

x <- sample(1:4,10,replace=TRUE)
x
# [1] 3 4 3 3 2 3 1 1 2 2
which(x %in% c(2,4))
# [1]  2  5  9 10

%in% возвращает логический вектор до тех пор, пока первый аргумент, с TRUE, если это значение можно найти во втором аргументе и FALSE в противном случае.

Я думаю, что пример с c (2,3,3) и c (1,2,3,4) с соответствием и% в% был бы более поучительным с меньшим количеством изменений между примерами. Функция match (c (2,3,3), c (1: 4)) возвращает различные результаты, из которых (c (2,3,3)% в% c (1: 4)) без необходимости использовать более длинный первый вектор и как много изменений от примера к примеру. Стоит также отметить, что они обрабатывают несоответствия совсем по-другому.
@ Джон: это все правда, но это не то, что спросил ОП. ОП попросил, начиная с длинного вектора, найти первое совпадение элементов, приведенных в другом. А для полноты я добавил, что если вас интересуют все индексы, вам придется использовать какой (% в%). Кстати, нет причин удалять ваш ответ. Это действительная информация.
Это достоверная информация, но она ушла ... :)
Я думаю, что было бы полезно подчеркнуть, что порядок аргументов в match имеет значение, если вы хотите индекс первого вхождения. Для вашего примера, match(x,c(4,8)) дает разные результаты, что на первый взгляд не очень очевидно.
@goldenoslik Это помогает, если вы читаете страницу справки match . Там все объяснено. Но я добавил эту информацию.