论文部分内容阅读
目的 分析特定关键词的百度指数与新型冠状病毒肺炎流行的相关性,探讨大数据时代中新发传染病监测的新思路.方法 以范围选词法为主,直接选词法为辅,结合国家新冠肺炎诊疗及防控方案,并运用百度指数的拓展功能确定关键词库;选取2020年1月19日至2月29日的数据,分别对每个关键词的百度指数与新冠肺炎发病数进行Spearman相关分析.结果 共有25个关键词进入词库,“口罩”、“N95口罩”、“外科口罩和医用口罩的区别”等15个关键词的百度指数与新冠肺炎发病数的相关关系有统计学意义(P <0.01),其中“发热”、“乏力”、“咳嗽”等11个关键词的百度指数序列向前移动若干单位时间后,与新冠肺炎发病数的相关系数达到最大值,相关系数为0.71~0.92.结论 “发热”、“乏力”、“咳嗽”等11个关键词作为先行关键词可提前对新冠肺炎的疫情做出反馈,具有一定预测预警的价值.