论文部分内容阅读
汽车专利文本以其专业性和高技术价值性,为汽车厂商和相关研究者把握该行业的技术发展、寻求技术创新等提供了一个重要途径。现有针对汽车专利文本的研究分析,多是基于传统的专利计量分析、文本挖掘模型或方法等,它们或是只针对其结构化部分进行较粗粒度的统计分析,或是只能挖掘其非结构化文本内容的浅层信息,很少能深入其文本内部挖掘其深层的语义信息,从而无法从语义角度进行一些较精细的分析或应用,如技术主题识别、技术趋势分析等。随着自然语言处理技术、机器学习相关模型或方法在文本分析领域的应用和发展,以LDA(Latent