潜在狄利克雷分配相关论文
单细胞RNA测序(Single-cell RNA-seq,scRNA-seq)能够测定数万、数十万个细胞所组成的样本中每个细胞的转录组状态,通过分析细胞之间......
在过去的几年中,随机变分推断在多种机器学习任务中显示出其强大能力,其应用涵盖自然语言处理和信息检索等各个领域。各领域应用不......
随着计算机和网络技术的不断发展,以自然语言为特征的领域文本信息不断喷涌,这些文本信息是进行科学研究、企业竞争情报研究的宝贵......
随着拍照设备和社会媒体的快速发展,每天在社交网络中出现的图片数量数以亿计。面对如此海量的图像数据,寻找一种能够正确分析和理......
管理科学是一个广泛的跨学科领域。如果研究者们不了解新兴话题,在这个领域进行研究会非常具有挑战性。本项研究的首要目标是通过减......
随着互联网的快速发展,网络舆情对社会的影响与日俱增.对互联网上网民产生的海量文本内容进行快速准确的分析,以及在此基础上捕捉......
LDA没有考虑到输入,在原始的输入空间上对每一个词进行主题标签,因保留非作用词,而影响了主题概率分布。针对这种情况提出了一种m ......
针对短文本中固有的文本内容稀疏和上下文信息匮乏等问题,在双词主题模型(BTM)的基础上提出一种融合词向量特征的双词主题模型LF-B......
LDA没有考虑到数据输入,在原始输入空间上对所有词进行主题标签,因对非作用词同样分配主题,致使主题分布不精确。针对其不足,提出......
潜在狄利克雷分配(LDA)主题模型是处理非结构化文档的有效工具。但是它是建立在词袋模型(bag of word,BOW)假设上的,这种假设把每......
潜在狄利克雷分配(LDA)被广泛应用于文本的聚类.有效理解信息检索的查询和文本,被证明能提高信息检索的性能.其中吉布斯采样和置信传......
面向社交网络的情感社区检测,可应用于公共健康、舆情监测等领域.以新浪微博为平台建立一种情感社区检测框架,首先融合微博情感表......
针对前馈型图像多层视觉表示方法难以处理局部模糊情况,提出一种基于潜在狄利克雷分配(LDA)的图像多层视觉表示方法——LDA-IMVR。......
基于目标轨迹的异常行为检测算法忽略了轨迹内部信息,容易导致异常检测虚警率偏高。为解决该问题,提出一种基于轨迹分段主题模型的......
主题模型是一种强大的文本处理技术,在诸多领域之中都有广泛地应用。经过不断地发展,主题模型已具备了相对完善的理论,拥有适用于......
互联网+时代的到来,使得信息呈现爆炸式的增长。当前数据量越来越庞大,信息内容越来越复杂,数据形式越来越多样,人们迫切需要一种......
设计了一种基于主题与连接的局部社区划分算法。该算法结合节点的主题相似度和连接相似度,综合计算节点间的相似度。同时算法采用......
互联网与web2.0技术的飞速发展促使社交媒体(如微博,论坛等)逐渐成为人们进行信息交互的重要平台,并且已有逐渐取代传统媒体的趋势......
提出一种基于主题模型的高分辨率遥感影像变化检测方法。将前后两期遥感影像对应的像素点对作为基本单位,提取其邻域亮度相关度、......
针对目前国内的英语作文辅助批阅系统缺少准确而高效的跑题检测算法的问题,提出了一种结合LDA和word2vec的跑题检测算法。该算法利......
融合新闻命名实体、新闻标题、新闻重要段落、文本语义等多特征影响,提出基于多特征融合文本聚类的新闻话题发现模型。模型根据新闻......
评价对象抽取是自然语言处理中情感分析研究领域的一项重要任务。本文研究基于LDA进行中文评价对象的抽取问题。利用中文倾向性评......
为了降低半监督聚类算法的数据稀疏度,借鉴seeds集思想,提出了2种基于潜在狄利克雷分配(LDA)的半监督文本聚类算法,Seeded-LDA和Cons......
针对现有模型无法进行微博主题情感演化分析的问题,提出一种基于主题情感混合模型(TSCM)和情感周期性理论的主题情感演化模型——......
社交网络的快速发展为分析用户行为规律提供了绝佳的机会和平台。其中基于用户生成内容(User-generated Content, UGC)的主题偏好......
本研究深度挖掘了财经新闻主题内容与股市市场的相关性,并提出了一种基于理解当日新闻主题分布来分析中国股市涨跌的预测模型。具......
潜在狄利克雷分配(LDA)主题模型可用于识别大规模文档集中潜藏的主题信息,但是对于微博短文本的应用效果并不理想。为此,提出一种......
缺陷报告作为软件维护周期过程中产生的缺陷描述数据,由于这些报告通常由对软件本身了解甚少的用户匆忙撰写而成,它们不仅存在着表......
随着股指期货的上市以及融资融券业务的开通,国内金融市场中的量化交易也在逐步发展。然而就目前的国内金融市场而言,可交易品种匮......
医疗信息化的飞速发展给医学数据分析带来了极大的挑战。尤其是蕴含丰富医学信息的病历数据,这些病历数据语法结构松散,医学用词不......
现有的共享内存的并行潜在狄利克雷分配(LDA)主题模型,通常由于数据分布的原因,线程之间一般存在等待导致效率低下。针对线程等待问......
随着互联网的快速发展,对非结构化数据处理的时效性要求逐渐变高,并行化的主题建模是一种能够有效的快速处理非结构化数据的方法。......
网页作弊检测可以被看作二元分类问题。当前基于内容的作弊网页检测方法主要使用统计特征,不能准确识别隐藏的作弊手段。为此,提出一......
美丽的极光形态各异,不同形态的极光蕴含不同的物理意义,所以研究极光图像的分类具有重要的科学价值.在LDA(1atent Dirichlet allocati......
DNA序列分类作为生物信息领域的一项基础任务,其目的是根据结构或功能的相似性来预测DNA序列所属的类别。本文在基于LDA(潜在狄利......