как выполнять построчную операцию в пандах [дубликаты]

Question

как выполнять построчную операцию в пандах [дубликаты]

1

У меня есть dataframe с двумя столбцами, last_name и description

Каков элегантный способ увидеть, содержит ли description last_name в каждой строке?

У меня есть уродливый

for i in range(0,len(df0)):
    df0['last_name_position'].loc[i] = \ 
        df0['description'].loc[i].find(df0['last_name'].loc[i])

Бег.

Это в основном та же задача, что и https://exceljet.net/formula/cell-contains-specific-text

Marshall 20 июнь 2018, в 23:22

Источник

Теги:

python

string

pandas

dataframe

3 ответа

Ещё вопросы

koPytok · Answer 1 · 2018-06-20T20-22-00.000Z

Тот же результат может быть достигнут с помощью df.apply:

df0['last_name_position'] = \ 
    df0.apply(lambda x: x.description.find(x.last_name), axis=1)

Если вам не нужно найти индекс подстроки:

df0['last_name_position'] = \ 
    df0.apply(lambda x: x.last_name in x.description, axis=1)

Bram van Hout · Answer 2 · 2018-06-20T20-01-00.000Z

Сохранение данных:

import pandas as pd 

a = pd.DataFrame([['Smith','Some description'],['Jones','Some Jones description']], columns=['last_name','description'])
a['Match']=a.apply(lambda x: x['last_name'] in x['description'], axis=1)
a.head()

last_name   description             Match
0   Smith   Some description        False
1   Jones   Some Jones description  True

killian95 · Answer 3 · 2018-06-20T19-57-00.000Z

0

Что может быть лучше, это перебрать строки, используя индекс. Затем сделайте ваше сравнение, используя in ключевом слове:

import pandas as pd 

a = pd.DataFrame([['Smith','Some description'],['Jones','Some Jones description']], columns=['last_name','description'])

for rname in a.index:
    row = a.loc[rname]

    it_contains = row['last_name'] in row['description']
    print "Description contains last name:", it_contains

# Outputs:
# Description contains last name: False
# Description contains last name: True

killian95 20 июнь 2018, в 19:57

0

Я бы сказал, что это анти-панды. Для простых сравнений нет необходимости перебирать индекс Панды. Существуют методы, pd.DataFrame.apply и pd.Series.apply , которые делают это избыточным.
jpp 20 июнь 2018, в 21:38
0

Как бы вы сделали это вместо этого? Я думаю, используя функцию DataFrame.apply () панды? Я поднял его около месяца назад, поэтому я приветствую больше предложений Panda-Nic
killian95 20 июнь 2018, в 21:40
0

Именно так. Или, как раз в этом конкретном случае, списочные представления также более обременительны.
jpp 20 июнь 2018, в 22:24
2

@jpp предложил действительно элегантное решение df0 ['last_name_in_description'] = [i в j для i, j в zip (df0 ['last_name'], df0 ['description'])] Спасибо. (Ваше имя пользователя совпадает с инициалами моего лучшего друга.)
Marshall 21 июнь 2018, в 07:32
0

@Marshall, нет проблем, я удалил свой ответ, так как он также присутствует в помеченном дубликате.
jpp 21 июнь 2018, в 08:08

Показать ещё 3 комментария