百度众测标注系统及其在数据采集方面的扩展应用的设计与实现

来源 :南京大学 | 被引量 : 0次 | 上传用户:szm2009szm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年,国内外互联网界迎来了人工智能发展的大热潮,人工智能领域会使用到很多深度学习算法,当前大部分的深度学习还集中在监督式的学习,所以对于很多人工智能领域诸如人脸识别、用户行为分析、智能驾驶等都需要通过数据标注和采集工作来提供海量的训练数据集。百度公司紧随AI潮流,目前已经形成了一个较完整的人工智能布局,而数据的标注与采集是这一大布局中不可缺少的基础一环。为了解决数据标注与采集领域的保证数据质量和降低成本两大难点,本文构建了一个百度众测数据数据标注子系统,包括标注模块、管理模块以及扩展的采集模块三个模块,并在系统的构建过程采用了注入样本题机制、审核机制、拟合答案机制等多种手段来保证数据的质量,同时系统所属的百度众测平台实践了众包理念,利用了大众能力和资源,降低了数据生产成本。本项目为百度公司提供一个廉价且高质量的训练数据解决方案,节约了企业开发成本,保证了企业产品质量。项目的构建过程中,前端采用了成熟稳定的Angular2框架,服务器端使用了 PHP的Yii框架,Yii框架是一个MVC结构的纯OOP的框架,让开发人员可以专注于业务逻辑的开发。同时为了弥补PHP语言对异步开发支持不足的缺陷,项目嵌入使用了 Linux下的Crontab功能,此外项目也使用Redis来进行一些业务信息缓存,降低关系数据库的访问压力,提高系统性能。目前,项目已经平稳运行,为公司的生产线包括Apollo、DureOS等AI产品线,提供了大量的精确数据。
其他文献
目的:研究老年桡骨远端骨折患者髂骨松质骨的骨结构参数和骨转换参数.方法:在14例老年桡骨远端骨折患者(实验组)和12例同期住院的青年桡骨远端骨折患者(对照组)中进行内固定
大兴安岭北部塔河县十八站—呼玛县韩家园地区发育早古生代中酸性侵入岩。文章选取二长闪长岩和二长花岗岩开展岩石年代学与地球化学研究。二长闪长岩LA-ICP-MS锆石U-Pb年龄
企业财务风险是企业财务管理的重要组成部分,财务风险几乎是不可避免的。通过定期的财务分析,分析财务指标,做出适当的财务决策,防止财务危机。建立财务风险识别系统和有效的
在应用双液(水泥和水玻璃)注浆法封堵被淹煤矿井巷的过程中,研究总结出一套独特而便于操作的封堵含水层突水和方法的措施。这种封堵突水方法还可以推广应用到岩层坑和各种隧道中
目的 探究分析CBL教学法在内分泌科教学中的应用及教学效果.方法 2018年9月—2019年9月,该院内分泌科一共接收实习医师及规培医师60名,将实习及规培医师按照奇偶数分组法分组
1对象和方法1.1对象 2004-04/2006-04确诊癫痫患者188(男109,女79)例,其中儿童组患者153例,年龄6~14岁;成年组患者35例,年龄15~54岁;病程0.5~12a.癫痫发作类型:简单部分性34例,复杂部分性47例,
<正>随着我国改革开放的不断深化发展,特别是我国加入WTO以来,国际交流越来越频繁,涉及到了金融行业在内的各个领域。不言而喻,英语作为一种对外交流、沟通的工具,其重要性日