技术微信:375279829 欢迎来到【毕业设计资料-计算机毕业设计源码网】官网!
您的位置:您的位置:主页 > 作品中心 > Java毕业设计

语料库管理及标注平台的开发

技术微信:375279829

本课题包括源程序、数据库、论文、运行软件、运行教程

毕业设计资料-计算机毕业设计源码网:我们提供的源码通过邮箱或者QQ微信传送,如果有啥问题直接联系客服

包在您电脑上运行成功

语言:Java

数据库:MySQL

框架:ssm、springboot、mvc

课题相关技术、功能详情请联系技术

作品描述

题目

语料管理及标注平台开发

题目类型

应用研究型    理论研究型   工程设计型

计算机软件设计型  社会调查型

社会热点难点型    其他

题目来源

教师科研(含国家、省部级、校级项目或校外协作项目)        囗教师自拟  囗学生自选  囗生产实践 囗实验室(课程)建设    囗大学生创新创业训练项目 囗其他

一、选题依据及意义

网络的快速发展,要想实时了解机构组织的决策信息及其与其他机构之间的关系不再是难事,然而,网络的飞速发展也为人们带来了困扰。在信息多元化的今天,庞大而繁杂的信息不仅使人们产生了阅读疲劳,而且极大地增加了获取所需信息的成本。因此,如何自动地从语料库实体中并自动地抽取实体并标注出来就显得极为重要,语料库管理及标注平台正是在这样的背景下产生的。通过语料库管理及标注平台,综合新闻文本中的信息,能使决策者更为方便的了解情况,从而做出更优质的决策,同时,还能帮助节省大量的时间。因此,对语料库管理及标注平台进行研究,具有现实意义。

语料库管理及标注平台以方便、快捷、不受地域限制等优点冲击着传统的软件管理方式,正因为如此,使它更符合现代社会快节奏、高效率的生活方式。它已经广泛的应用于目前的各大数据分析机构。

目前,国内外各大信息技术研究企业大部分都已经有了自己的“语料库管理及标注平台”,而且已经成为广大管理者的必要工具。由于信息技术的高速发展和语料库管理及标注平台本身的优势,很多发达国家的大学在信息化的过程中都包括了语料库管理及标注平台,通过计算机网络实现数据实时分析。

当代社会,人们已经深深地领略到信息革命第二次浪潮的冲击。信息技术已经突破了单位性、地域性、时间的局限,实现了全球网络化。计算机的全球联网,形成了地域、空间无关的时间一体化市场,一种新的、基于计算机网络技术的信息传递模式正在逐步形成。

网页信息、新闻、文件、视频等作为信息发布的主要载体,能及时的报道行业的决策信息及其发生事件的进展情况。同时,网页作为消息传播的主要途径,具有权威性、及时性、写作规范的特点,这使得网页新闻逐渐成为了基于互联网信息抽取的主要素材。因此,以某新闻文本为研究对象,对新闻文本语料库中的信息名实体进行识别并对实体进行标注,是为信息处理技术的研究提供宝贵的数据资源,对我国多语言、跨平台技术的发展将会起到促进作用。

 

二、研究目标与主要任务

研究目标:随着信息技术的飞速发展,网络已成为世界上最大的信息库,也是信息获取和传播的重要途径。而一个理想标注语料库至少应该具有数据量大、覆盖范围广、准确度高等特点。为了能够管理大规模的数据,并为用户分析 和研究语言系统的规律提供了一个更方便、快捷的方式,本系统借助网络平台开发了一个管理标注语料库 的管理系统,实现了标注语料库的智能化管理。

主要任务:

1、采集语料并处理                                           

2、实现管理用户、注册,登录等功能的设计                           

3、实现 分配任务,修改提交等功能的设计                             

4、实现任务上传的功能                                    

5、提供一份符合要求的毕业论文 

三、研究方法和手段

此系统主要三个角色  1.管理员 2.老师 3.学生

管理员:负责管理整个信息,比如增删改查,统计完成率

老师:负责管理学生信息,审批及管理音频文件,统计完成率(可以加各种图形化统计)

学生:主要上传文件,修改个人信息,查看自己完成的采集数据,是否通过了等信息

开发主要用 Java为主, 框架 SpringBoot , 数据库Mysql ,现在流行的微服务方式开发

四、主要参考文献

[1]张宝林,崔希亮.“全球汉语中介语语料库”的特点与功能[J].世界汉语教学,2022,36(01):90-100.DOI:10.13724/j.cnki.ctiw.2022.01.008.

[2]周俊明,秦哲,李锐龙,李艳翠.汉英主从对齐语料标注平台[J].电信快报,2021(08):41-46.

[3]杨欣,群诺,郭龙银,孟姚媛.藏文情感语料库的构建与分析[J].计算机时代,2019(09):5-7+12.DOI:10.16644/j.cnki.cn33-1094/tp.2019.09.002.

[4]徐健. 维吾尔语语音语料库管理平台的研究与实现[D].新疆大学,2018.

[5]徐健,热依曼·吐尔逊,吾守尔·斯拉木.在线多语种语音语料库平台的研究与实现[J].信息通信,2018(04):150-153.

[6]于娜娜. 基于B/S架构的语料库管理系统[D].哈尔滨理工大学,2017.

[7]崔晓玲.基于汉语网络新闻评论的情感语料库标注研究[J].北京邮电大学学报(社会科学版),2013,15(06):21-29.

[8]王玥. 基于深度学习的命名实体识别研究[D].云南财经大学,2019.

[9]殷章志. 中文命名实体识别研究[D].大连理工大学,2019.

[10]王志辉.JAVA语言在计算机软件开发中的应用[J].电子技术与软件工程,2019(20):42-43.

[11] 王岩. JAVA 网络开发指南[M]. 北京:清华大学出版社2016.

[12] 李宗颜, 孙更新, 宾晟. JAVA从基础到项目实战[M].化学工业出版社, 2016.

[13] 蒋韩洋,SQL Server2015数据库管理与开发教程[M].北京:电子工业出版社,2017.

[14]   刘曾杰.MySQL5.7从入门到精通[M].北京:清华大学出版社,2018.

[15]   高见斌.基于MYSQL数据库存储引擎的研究[M].化学工业出版社,2018(05).

[16]   传智播客高教产品研发部.Java Web程序开发入门[M].北京:清华大学出版社,2018.

[17]Margaretha Ohyver,Jurike V. Moniaga,Iwa Sungkawa,Bonifasius Edwin Subagyo,Ian Argus Chandra. The Comparison Firebase Realtime Database and MySQL Database Performance using Wilcoxon Signed-Rank Test[J]. Procedia Computer Science,2019,157.

[18]. ScaleGrid; MySQL Hosting on Azure, Fully Managed Cloud Database Service Launches at ScaleGrid[J]. Computers, Networks & Communications,2018.

[19]Guimaraes,Collins. How to Move a Mountain: The Preparation and Transfer of One Million Volumes to an Off-Site Storage Facility[J]. The Serials Librarian,2018,74(1-4).

[20]Yun Quan. Design and Implementation of E-commerce Platform based on Vue.js and MySQL[P]. Proceedings of the 3rd International Conference on Computer Engineering, Information Science & Application Technology (ICCIA 2019),2019.

五、工作进度安排(时间、内容、步骤)

2022120-2022130日(实现管理用户、注册,登录等功能的设计)

202222-202228日(实现 分配任务,修改提交等功能的设计)

2022210-2022223日(实现 分配任务,修改提交等功能的设计)

2022225--202232日(采集语料并处理)

学生签名:          

如需定做或者获取更多资料,请联系QQ:375279829
在线客服
联系方式

技术微信

375279829

在线时间

周一到周日

客服QQ

375279829

二维码
线