pandas merge_asof ошибка при использовании float в качестве ключа

1

При использовании pandas merge_asof, как в следующем примере

import pandas as pd

left = pd.DataFrame({'a': [1.1, 5.5, 10.9], 'left_val': ['a', 'b', 'c']})

right = pd.DataFrame({'a': [1.0, 2.8, 5.4, 5.55, 7.4], 'right_val': [1, 2, 3, 6, 7]})

pd.merge_asof(left, right, on='a', direction='nearest', tolerance=5)

Я получаю ошибку

~\AppData\Local\Continuum\anaconda3\lib\site-packages\pandas\core\reshape\merge.py in _get_merge_keys(self)
   1363 
   1364             else:
-> 1365                 raise MergeError("key must be integer or timestamp")
   1366 
   1367         # validate allow_exact_matches

MergeError: key must be integer or timestamp

Это выглядит странно, поскольку в документации, которую я читал

on : label

Field name to join on. Must be found in both DataFrames. The data MUST be ordered. Furthermore this must be a numeric column, such as datetimelike, integer, or float. On or left_on/right_on must be given

поэтому использование float как ключа должно быть в порядке...

Я использую pandas 0.23.0

Теги:
pandas
merge

1 ответ

1

Похоже, что параметр допуска допускается только для значений integer и timedelta, следовательно, ошибка, и она работает нормально.

Возможно, вы можете исправить это с помощью этапа последующей обработки, чтобы сказать:

right["b"] = right["a"]
df_result = pd.merge_asof(left, right, on='a', direction='nearest')
df_result.loc[abs(df_result["b"]-df_result["a"]) > 5, :] = np.nan
df_result.dropna()

Это объединит их по ближайшим, затем нулевым строкам, где соединение было выше вашего допуска (в этом случае 5), а затем вы можете сбросить нулевые строки, как никогда не существовавшие...

Ещё вопросы

Сообщество Overcoder
Наверх
Меню