r - 如何计算 vowpal wabbit 中 LDA 模型的对数似然

我是典型的、普通的、日常的 R 用户。在 R 中,lda 中的 lda.collapsed.gibbs.sampler 非常有用tha 包使用折叠的 Gibbs 采样器来拟合潜在 Dirichlet 分配 (LDA) 模型,并使用 Gibbs 采样的最后一次迭代时的状态返回潜在参数的点估计。

这个函数还有一个很棒的参数compute.log.likelihood,当设置为TRUE时,会导致采样器计算日志 每次扫描后单词的可能性(在常数因子内) 变量。 这对于评估收敛性和比较不同的 LDA 模型(针对不同数量的主题计算)很有用。

如果vowpal_wabbit's LDA中有这样的选项,我很感兴趣模型?

最佳答案

运行 vw -h --lda 1 时,帮助会提供以下参数。 metrics 参数默认关闭。 它用于计算实现的主题连贯性 here . 尝试通过传递 --metrics 1

来启用此功能
Latent Dirichlet Allocation:
  --lda arg                             Run lda with <int> topics

  --lda_alpha arg (=0.100000001)        Prior on sparsity of per-document topic
                                        weights
  --lda_rho arg (=0.100000001)          Prior on sparsity of topic 
                                        distributions
  --lda_D arg (=10000)                  Number of documents
  --lda_epsilon arg (=0.00100000005)    Loop convergence threshold
  --minibatch arg (=1)                  Minibatch size, for LDA
  --math-mode arg (=0)                  Math mode: simd, accuracy, fast-approx
  --metrics arg (=0)                    Compute metrics

或者直接跳转到source code of vw utility .

可以找到展示大多数参数的有用演示文稿 here .

https://stackoverflow.com/questions/31561067/

相关文章:

hibernate - Spring-data/Hibernate 不能正确处理空值

python - 在 Matplotlib 和 OSX 中使用数学模式和下标时出现错误偏移

c# - 在基于 Web 的架构上使用 POCO、DTO 和 ViewModel

algorithm - 生成填字游戏的高效算法(纽约时报的风格)

c# - Visual Studio : how to use scripts to "build

asp.net-mvc-4 - ModelState.IsValid == false,尽管插入了所

python - 通过 Mininet 网络发送 "random"流量

java - 如何通过键前缀查询 Samza KeyValueStore?

php - 带有 PHP SDK 的 AWS EC2 - 等到实例具有公共(public) DNS

php - 使用 Jsonb 绑定(bind)参数?|使用 Postgres 的 Doctrine2