轻松提高机器编码的内容分析准确性,这两个步骤超实用!

上一期图文,我们了解了机器编码和(机器辅助)人工编码的执行差异和各自的优劣势。

这一期,我们将介绍大数据技术辅助内容编码的操作方式。

首先,我们先来看看DiVoMiner是如何执行机器编码的。


DiVoMiner如何执行机器编码?

注意:DiVoMiner 平台允许多次执行机器编码,若您更新了数据库,或修改了编码类目,重新点击【机器编码】即可。


大湾区-人文历史话题统计


“大湾区11个城市旅游品牌个性研究”这个项目,各个渠道数据加起来超5万条,你知道小编从拿到数据,到做出图表,要多久时间呢,10分钟!

机器编码,效率就是这么高~

看到这里,可能有同学会有疑问,机器编码效率高是毋庸置疑,但是如何保证其准确性呢?


如何提升机器编码的准确性?

其实,上文已经说到了,机器编码并不是完全交由机器解决全部问题,机器编码结果高度依赖用户自设的选项关键词条件。即关键词是机器判断的逻辑依据,机器编码是通过给类目选项设定关键字,在海量数据中搜索出与关键字相关的内容结果。因此,做好这两步,机器编码的准确性大大提升。


1) 设置准确的类目关键词

类目选项的关键词设置越准确,机器编码的结果准确性越高。在研究过程中,有可能需反复调整、优化关键字的设定方式,以获得更全面及具有代表性的数据分析結果。

小编以大湾区城市的旅游资源中的人文资源题目为例:通过文献或资料查阅,大湾区城市的人文资源划分为历史文化、传统美食、民俗风情、地方特产、娱乐设施、宗教几个类别。

接下来,需要对每个选项以概念的形式来定义关键词,点击类目选项右侧的【关键词】,设置该选项对应的关键词。

例如大湾区城市的“历史文化”这个选项,综合大湾区城市的人文资源在历史文化方面的各个方面,可以总结出以下关键词组:

通过增加、删减等方式不断地完善类目选项关键词来提升机器编码的准确性。


2) 调整关键词的逻辑关系

由于语言的复杂性,单个关键词可能无法保证数据恰如其分地被检索出来。那么,我们还可以通过调整关键词的逻辑关系来提高机器编码的准确性。


DiVoMiner平台支持关键词设有多层逻辑关系。逻辑关键词有AND/OR/NOT(和/或/非)。

【OR】表示“或者”

【AND】表示“并列(和)”

【NOT】表示“不包括”

检索n个字之间的两个字符,关键词规则是“A B”~n。


例如:

“文化节 大湾区”~10,含义是检索10个字符内含有“文化节”和“大湾区”两个关键词的内容。

(底蕴 AND (历史 OR 文化)),含义是检索文中同时出现“底蕴”+“历史”,或者“底蕴”+“文化”两个关键词的内容,即可被编码为“历史文化”。

古镇 NOT 古镇郎中,含义是检索含有“古镇”这个关键词的内容,而不是“古镇郎中”这个关键词的内容。

注意:设置关键字时,连接关键字之间的逻辑词AND、OR、NOT大小写都可以,英文词组用英文引号""引用。括号需使用英文半角格式。

此外,我们还可以通过信度测试来检验机器编码的准确性。


本期内容就分享到这里,如有疑惑,可在评论区留言告诉小编。

如想了解更多操作方式,可登录DiVoMiner平台查阅《使用手册》。注册即免费使用!


DiVoMiner是按学术标准的量化内容分析法一站式平台,马上注册,使用公益免费版,学好研究方法,做论文,出报告,研出必行!做原创内容,尤其是研究内容,着实不易,敬请分享、点赞、关注!欢迎投稿,分享您的研究或思考!

展开阅读全文

更新时间:2024-09-03

标签:准确性   机器   内容   古镇   历史文化   选项   逻辑   步骤   关键词   关键字   轻松   数据

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top