文本标注服务-用户案例
1. 某权威国家通讯社:全国最大体量新闻NLP标注
一、需求:
国家新闻稿件文本标注。
二、项目难点:
1)NLP自然语言标注主观性强,难度大,需要标注员具有较强的中文语言能力和较好的政治素养;
2)项目前期,标注需求不够清晰,缺乏完善的标注规则体系;文章篇幅长,大标签数量22个,累积标签和选项达70-80个;
3)文章类型多,场景多,包含9大场景,数据形式多,包含文字、图片和视频等。
三、解决方案:
1)星尘自动化考试系统,部署对应需求的考题设置标注门槛对标注员进行筛选,保证标注员的质量;
2)对于不够完善的标注规则体系,项目配置的专属PM(项目经理),即时反馈标注过程遇到的标注问题并提供多个解决方案,推动优化完善标注规则体系;
3)对于复杂的标注场景与需求,星尘系统带有的预标注与自动质检大大地提高了标注的效率与质量。
2. 某高校研究院:英文语料文本标注
一、需求:
对英文语料文本进行主体关键词识别提取、语义分析及对话情感打标。
二、项目难点:
1)英文语料内容复杂,需要标注员具备一定的英文水平;
2)对话情感主观性较强,难以判断;项目工期紧。
三、解决方案:
1)培训相关专业的优质标注员,将项目难点整理成培训手册;
2)优化标注流程,将语料文本进行多轮标注后再进行多层质检,以避免由于主观性产生的分歧;
3)采用算法辅助对文本进行预标注。