«Клонирование» векторов строк или столбцов

104

Иногда полезно "клонировать" вектор строки или столбца в матрицу. Клонирование я имею в виду преобразование вектора строки, такого как

[1,2,3]

В матрицу

[[1,2,3]
 [1,2,3]
 [1,2,3]
]

или вектор столбца, такой как

[1
 2
 3
]

в

[[1,1,1]
 [2,2,2]
 [3,3,3]
]

В matlab или октаве это делается довольно легко:

 x = [1,2,3]
 a = ones(3,1) * x
 a =

    1   2   3
    1   2   3
    1   2   3

 b = (x') * ones(1,3)
 b =

    1   1   1
    2   2   2
    3   3   3

Я хочу повторить это в numpy, но безуспешно

In [14]: x = array([1,2,3])
In [14]: ones((3,1)) * x
Out[14]:
array([[ 1.,  2.,  3.],
       [ 1.,  2.,  3.],
       [ 1.,  2.,  3.]])
# so far so good
In [16]: x.transpose() * ones((1,3))
Out[16]: array([[ 1.,  2.,  3.]])
# DAMN
# I end up with 
In [17]: (ones((3,1)) * x).transpose()
Out[17]:
array([[ 1.,  1.,  1.],
       [ 2.,  2.,  2.],
       [ 3.,  3.,  3.]])

Почему не был первый метод (In [16])? Есть ли способ достичь этой задачи в python более элегантным способом?

  • 4
    В Matlab обратите внимание, что гораздо быстрее использовать repmat : repmat([1 2 3],3,1) или repmat([1 2 3].',1,3)
  • 0
    Октава также имеет repmat .
Показать ещё 1 комментарий
Теги:
numpy
linear-algebra
octave

8 ответов

57
Лучший ответ

Здесь элегантный, Pythonic способ сделать это:

>>> array([[1,2,3],]*3)
array([[1, 2, 3],
       [1, 2, 3],
       [1, 2, 3]])

>>> array([[1,2,3],]*3).transpose()
array([[1, 1, 1],
       [2, 2, 2],
       [3, 3, 3]])

проблема с [16] заключается в том, что транспонирование не влияет на массив. вы, вероятно, хотите получить матрицу:

>>> x = array([1,2,3])
>>> x
array([1, 2, 3])
>>> x.transpose()
array([1, 2, 3])
>>> matrix([1,2,3])
matrix([[1, 2, 3]])
>>> matrix([1,2,3]).transpose()
matrix([[1],
        [2],
        [3]])
  • 1
    (транспонировать произведения для двумерных массивов, например, для квадратного в примере, или при преобразовании в (N,1) -образный массив с помощью .reshape(-1, 1) )
  • 20
    Это крайне неэффективно. Используйте numpy.tile как показано в ответе .
234

Используйте numpy.tile:

>>> tile(array([1,2,3]), (3, 1))
array([[1, 2, 3],
       [1, 2, 3],
       [1, 2, 3]])

или для повторяющихся столбцов:

>>> tile(array([[1,2,3]]).transpose(), (1, 3))
array([[1, 1, 1],
       [2, 2, 2],
       [3, 3, 3]])
  • 9
    Upvote! В моей системе, для вектора с 10000 элементов повторяются 1000 раз, tile метод 19.5 раза быстрее , чем метод в принятом в настоящее время ответа ( с помощью умножения-оператор-метод).
  • 1
    Во втором разделе («повторяющиеся столбцы») вы можете объяснить, что делает второй набор квадратных скобок, то есть [[1,2,3]]
Показать ещё 2 комментария
33

Прежде всего, обратите внимание, что при многократных вещательных операциях обычно не требуется дублировать строки и столбцы. Для описания см. this и this.

Но для этого repeat и newaxis, вероятно, лучший способ

In [12]: x = array([1,2,3])

In [13]: repeat(x[:,newaxis], 3, 1)
Out[13]: 
array([[1, 1, 1],
       [2, 2, 2],
       [3, 3, 3]])

In [14]: repeat(x[newaxis,:], 3, 0)
Out[14]: 
array([[1, 2, 3],
       [1, 2, 3],
       [1, 2, 3]])

Этот пример предназначен для вектора строк, но применение этого к вектору столбца, мы надеемся, очевидно. повторение, похоже, хорошо написано, но вы также можете сделать это с помощью умножения, как в вашем примере

In [15]: x = array([[1, 2, 3]])  # note the double brackets

In [16]: (ones((3,1))*x).transpose()
Out[16]: 
array([[ 1.,  1.,  1.],
       [ 2.,  2.,  2.],
       [ 3.,  3.,  3.]])
  • 4
    newaxis имеет дополнительное преимущество, заключающееся в том, что он на самом деле не копирует данные, пока в этом нет необходимости. Поэтому, если вы делаете это для умножения или добавления в другой массив 3х3, повторение не требуется. Читайте о нудистском вещании, чтобы получить идею.
  • 0
    @AFoglia - Хороший вопрос. Я обновил свой ответ, чтобы указать на это.
Показать ещё 2 комментария
8

Я думаю, что использование широковещательной передачи в numpy является лучшим и быстрее

Я сделал сравнение, как показано ниже

import numpy as np
b = np.random.randn(1000)
In [105]: %timeit c = np.tile(b[:, newaxis], (1,100))
1000 loops, best of 3: 354 µs per loop

In [106]: %timeit c = np.repeat(b[:, newaxis], 100, axis=1)
1000 loops, best of 3: 347 µs per loop

In [107]: %timeit c = np.array([b,]*100).transpose()
100 loops, best of 3: 5.56 ms per loop

примерно в 15 раз быстрее, используя широковещательную рассылку

  • 0
    Вы можете индексировать с помощью None чтобы сделать то же самое.
  • 0
    что такое newaxis ?!
5

np.broadcast_to еще быстрее, чем np.tile:

x = np.arange(9)

%timeit np.broadcast_to(x, (6,9))
100000 loops, best of 3: 3.6 µs per loop

%timeit np.tile(x, (6,1))
100000 loops, best of 3: 8.4 µs per loop

Но самый быстрый метод @tom10:

%timeit np.repeat(x[np.newaxis, :], 6, axis=0) 
100000 loops, best of 3: 3.15 µs per loop
2

Вы можете использовать

np.tile(x,3).reshape((4,3))

tile будет генерировать повторения вектора

и изменить форму даст вам форму, которую вы хотите

0

Одно чистое решение - использовать функцию внешнего продукта NumPy с вектором единиц:

np.outer(np.ones_like(x), x)

дает повторяющиеся строки. Переключите порядок аргументов, чтобы получить повторяющиеся столбцы.

0
import numpy as np
x=np.array([1,2,3])
y=np.multiply(np.ones((len(x),len(x))),x).T
print(y)

выходы:

[[ 1.  1.  1.]
 [ 2.  2.  2.]
 [ 3.  3.  3.]]

Ещё вопросы

Сообщество Overcoder
Наверх
Меню