Скажем, у вас есть 32000 записей с 89 байтами/записью, хранящейся в TSV файле.
Вы вставляете это в словарь Python или хеш Ruby, и вы индексируете с помощью 9-байтового ключа, который сам по себе является полем в каждой записи. Другими словами, у вас есть словарь с 32000 парами ключ-значение, где каждый ключ имеет 9 байтов, а каждое значение составляет 89 байт. На современном компьютере, таком как 2.4Ghz Macbook Pro, какая приблизительная оценка среднего времени, необходимого для получения записи, и что в худшем случае в тета-нотации? Является ли реализация в Ruby медленнее, чем в Python?
Словарь обычно может извлекать ключи в постоянное время, поэтому ответ на ваш вопрос "очень быстрый".
Единственный способ, которым это было бы медленным, если бы много ваших ключей столкнулись, но вы можете избежать этого, используя хорошую хэш-функцию. Хэш-функция по умолчанию, вероятно, будет прекрасной.
Является ли реализация в Ruby медленнее, чем в Python?
Ruby, как правило, медленнее в производительности, чем Python, с небольшим коэффициентом. Я бы предположил, что, вероятно, это правда и здесь.