У меня есть корпус, состоящий из около 160 000 документов. Я хочу сделать моделирование тем, используя LDA в R (в частности, функцию lda.collapsed.gibbs.sampler в пакете lda). Я хочу определить оптимальное количество тем. Похоже, что общая процедура состоит в том, чтобы иметь вектор номеров тем, н...
05 июль 2018, в 10:07