【摘 要】
:
大数据问题所固有的规模繁杂性、高速增长性、形式多样性、价值密度低等特点为传统计算处理方法带来了严峻的挑战.一方面,大数据的规模繁杂性和高速增长性带来了海量计算分析
【机 构】
:
清华大学交叉信息研究院,清华大学计算机系
论文部分内容阅读
大数据问题所固有的规模繁杂性、高速增长性、形式多样性、价值密度低等特点为传统计算处理方法带来了严峻的挑战.一方面,大数据的规模繁杂性和高速增长性带来了海量计算分析的需求;另一方面,形式多样性和价值密度低等特点使得大数据计算任务高度依赖复杂认知推理技术.针对大数据计算中海量计算分析和复杂认知推理需求并存的技术挑战,传统的基于计算机的算法已经无法满足日益苛刻的数据处理要求,而基于人机协作的群体计算是有效的解决途径.在大数据群体计算中,最基础的就是任务的分配方式.考虑到大量网络用户不同的专业背景、诚信程度,因此不能简单随机地将要处理的任务交给大众来完成.针对此问题,提出了一种基于用户主题感知的迭代式任务分配算法.利用已知答案的测试问题迭代地检测不同人群的专业背景和完成任务的准确率.在充分了解用户真实主题和准确率的情况下为他们分配合适的问题.通过和随机任务分配算法在模拟数据和真实数据上的对比,有效显示了基于主题感知任务分配算法的准确性.
其他文献
鲁迅先生是五四“新文化运动”的发起人和领导者之一,以其创作成就显示了文学革命的实绩。相对于其他现代作家而言,鲁迅的各类文章在中学阶段中收录比率最大、类型最丰富。就
我国卫生事业管理专业教育起步较晚,随着社会经济的发展,社会对卫生管理的专门人才的要求越来越严格,这就要求我国卫生事业管理专业教育的不断前进。本文旨在介绍我国和美国
随着有线网络中多路径路由的部署和异构无线网络的发展,通信对等双方存在多条IP路径的场景越来越普遍.由于传统的单径传输协议无法充分发挥多路径带来的好处,如何设计有效的
随着近几年微博的快速发展与普及,微博凭借平台的开放性、终端扩展性、内容简洁性和低门槛等特性,在网民中快速渗透,已发展成一个重要的社会化媒体,微博成为网民获取新闻时事
就涡旋光束和光学涡旋的基本特征和原理进行了概述,对其产生、传播及应用进行了介绍。对涡旋光束和光学涡旋的研究动态进行了叙述,并对其未来的研究和应用前景进行了展望。
采用文献资料和逻辑推理分析等研究方法,以青奥会为视角,分析中国青少年体育发展的时代要求、奋斗目标与任务以及发展策略,以期为我国青少年体育的进一步发展提供战略依据。
目的研究2006年秋冬季腹泻患儿轮状病毒基因型。方法收集昆明医学院第一附属医院2006年10月~2006年12月住院的腹泻患儿的粪便标本60份,采用酶联免疫吸附试验(ELISA)方法检测RV
在超短强激光与固体薄膜靶相互作用产生高能离子的研究领域内,由于靶后静电场持续时间较长、离子具有较好的准直性及单能性,靶后鞘层加速(TNSA)机制一直都是研究重点。介绍了
《故事新编》作为一部独具特色的小说集,在鲁迅小说创作中具有鲜明的异质性。本文从反讽这一古老而又常新的概念入手,首先探究了《故事新编》的文本特征,从言语反讽、结构反
针对目前触点材料领域的现状和存在的问题及低压电器对触点材料的应用要求 ,提出了一种研究触点材料的新思路 ,制成了银基导电陶瓷触点材料。实验结果表明 ,该材料具有优良的