搜索历史
热搜词
百度开源中文主题建模工具集,三种主题模型
| 2017-06-29 10:17
百度Familia 开源项目包含文档主题推断工具、语义匹配计算工具以及基于工业级语料训练的三种主题模型:Latent Dirichlet Allocation(LDA)、SentenceLDA 和Topical Word Embedding(TWE)。 支持用户以“拿来即用”的方式进行文本分类、文本聚类、个性化推荐等多种场景的调研和应用。考虑到主题模型训练成本较高以及开源主题模型资源有限的现状,我们会陆续开放基于工业级语料训练的多个垂直领域的主题模型,以及这些模型在工业界的典型应用方式,助力主题模型技术的科研和落地。

原文网址:https://github.com/baidu/Familia
阅读 参与讨论 评论(0)

技术创新+体验革命,虹魔方加冕家庭互联三大奖
 01月05日
技术创新+体验革命,虹魔方加冕家庭互联三大奖
新媒股份荣膺“年度卓越运营奖”,运营实力获行业权威认可
 01月04日
新媒股份荣膺“年度卓越运营奖”,运营实力获行业权威认可
拾光同频,金彩纷呈:虹领金电视十周年,与千万家庭共赴新程
 12月26日
拾光同频,金彩纷呈:虹领金电视十周年,与千万家庭共赴新程
祝贺!长虹第一台彩色电视机入驻中国国家博物馆
 12月22日
祝贺!长虹第一台彩色电视机入驻中国国家博物馆
百视通携AI+创新成果亮相2025数智科技生态大会 共筑数智新视界
 12月07日
百视通携AI+创新成果亮相2025数智科技生态大会 共筑数智新视界