我是典型的、普通的、日常的 R 用户。在 R 中,lda
中的 lda.collapsed.gibbs.sampler
非常有用tha 包使用折叠的 Gibbs 采样器来拟合潜在 Dirichlet 分配 (LDA) 模型,并使用 Gibbs 采样的最后一次迭代时的状态返回潜在参数的点估计。
这个函数还有一个很棒的参数compute.log.likelihood
,当设置为TRUE
时,会导致采样器计算日志
每次扫描后单词的可能性(在常数因子内)
变量。 这对于评估收敛性和比较不同的 LDA 模型(针对不同数量的主题计算)很有用。
如果vowpal_wabbit's LDA中有这样的选项,我很感兴趣模型?
最佳答案
运行 vw -h --lda 1
时,帮助会提供以下参数。
metrics
参数默认关闭。
它用于计算实现的主题连贯性 here .
尝试通过传递 --metrics 1
Latent Dirichlet Allocation:
--lda arg Run lda with <int> topics
--lda_alpha arg (=0.100000001) Prior on sparsity of per-document topic
weights
--lda_rho arg (=0.100000001) Prior on sparsity of topic
distributions
--lda_D arg (=10000) Number of documents
--lda_epsilon arg (=0.00100000005) Loop convergence threshold
--minibatch arg (=1) Minibatch size, for LDA
--math-mode arg (=0) Math mode: simd, accuracy, fast-approx
--metrics arg (=0) Compute metrics
或者直接跳转到source code of vw utility .
可以找到展示大多数参数的有用演示文稿 here .
https://stackoverflow.com/questions/31561067/
相关文章:
hibernate - Spring-data/Hibernate 不能正确处理空值
python - 在 Matplotlib 和 OSX 中使用数学模式和下标时出现错误偏移
c# - 在基于 Web 的架构上使用 POCO、DTO 和 ViewModel
algorithm - 生成填字游戏的高效算法(纽约时报的风格)
c# - Visual Studio : how to use scripts to "build
asp.net-mvc-4 - ModelState.IsValid == false,尽管插入了所
python - 通过 Mininet 网络发送 "random"流量
java - 如何通过键前缀查询 Samza KeyValueStore?