论文部分内容阅读
随着国家对二胎、三胎政策的全面放开,新生儿出生数量有所增长,对婴儿用品的数量和质量需求也发生着改变.本文主要研究婴儿用品的商品评论相关信息的爬取,对目标网站的网页进行分析,采集数据.获取数据后,采用Python语言中的Pandas、Numpy等库进行数据预处理.然后,使用Matplotlib、Nltk、Jieba库对数据分析,去除重复评论,去除停用词,词频统计后制作词云图等可视化数据结果,挖掘出大数据背后的隐含信息.