论文部分内容阅读
近年来大学生心理疾病呈明显地上升趋势,自杀、伤害等由心理问题导致的恶性事件频发,严重影响了学生的成长和高校正常的教学管理秩序。虽然越来越多的高校开始重视学生心理健康工作,但是心理教师的短缺加剧了这一矛盾。以微博为代表的社交网络成为获取个人生活轨迹和情感信息的重要平台,为当前的研究开启了新的方向。通过收集学生的微博信息来找出风险的迹象,有助于学生日后接受临床的筛查和心理疏导。目前的工作是采用人工识别的方法,在大量的微博内容中寻找危机信号,工作量大,容易导致疏忽和遗漏。通过计算机对微博内容进行分析,尤其是分析高校中重点学生的微博内容,可以减轻人工识别的劳动强度,提高筛查的效率和预警准确度。微博情感分析存在两个方面的困难:一方面,情感的变化是一个十分复杂的过程,需要构建一个情感模型进行有效地模拟;另一方面,针对微博这种短文本、语法规则不规范的中文文本,传统机器学习的方法和常识库很难提取到特征值,识别效果较差。因此需要我们构建一个完备的具有专业领域特点的情感词典,应用到文本情感识别过程中。同时中文情感识别过程还涉及到分词、词性标注、句法分析等。鉴于以上,本文开展了以下三个方面的工作:(1)设计了一种基于性格、心情和情感空间的多层次心理预警模型。该模型充分考虑到性格、心情、外界刺激等人类的认知因素,模拟人类情感的发生和变化过程,并基于此来推定特定人物当前的情感状态。(2)研究了微博内容的获取和分析技术。包括:改进了传统的爬虫技术,设计了微博爬虫模型,能够自动收集特定人物的微博信息;分析了微博情感识别的特点,改进了基于情感词典的文本分析算法,构造了情感元结构并建立推导规则,将文本的情感分析过程简化为对情感元的推理和统计,同时构建了具有专业特色的微博心理情感词典(MPED词典)和微博表情词典,作为提取情感元的重要依据。(3)设计并实现了一个基于心理预警模型的微博情感预警系统。该系统可以自动收集校园内特定人物的微博信息,通过对微博的情感分析,筛查出可能出现心理危机的重点人物,满足了当前研究的需要。