При использовании pandas merge_asof, как в следующем примере
import pandas as pd
left = pd.DataFrame({'a': [1.1, 5.5, 10.9], 'left_val': ['a', 'b', 'c']})
right = pd.DataFrame({'a': [1.0, 2.8, 5.4, 5.55, 7.4], 'right_val': [1, 2, 3, 6, 7]})
pd.merge_asof(left, right, on='a', direction='nearest', tolerance=5)
Я получаю ошибку
~\AppData\Local\Continuum\anaconda3\lib\site-packages\pandas\core\reshape\merge.py in _get_merge_keys(self)
1363
1364 else:
-> 1365 raise MergeError("key must be integer or timestamp")
1366
1367 # validate allow_exact_matches
MergeError: key must be integer or timestamp
Это выглядит странно, поскольку в документации, которую я читал
on : label
Field name to join on. Must be found in both DataFrames. The data MUST be ordered. Furthermore this must be a numeric column, such as datetimelike, integer, or float. On or left_on/right_on must be given
поэтому использование float как ключа должно быть в порядке...
Я использую pandas 0.23.0
Похоже, что параметр допуска допускается только для значений integer и timedelta, следовательно, ошибка, и она работает нормально.
Возможно, вы можете исправить это с помощью этапа последующей обработки, чтобы сказать:
right["b"] = right["a"]
df_result = pd.merge_asof(left, right, on='a', direction='nearest')
df_result.loc[abs(df_result["b"]-df_result["a"]) > 5, :] = np.nan
df_result.dropna()
Это объединит их по ближайшим, затем нулевым строкам, где соединение было выше вашего допуска (в этом случае 5), а затем вы можете сбросить нулевые строки, как никогда не существовавшие...