上一期图文,我们了解了机器编码和(机器辅助)人工编码的执行差异和各自的优劣势。
这一期,我们将介绍大数据技术辅助内容编码的操作方式。
首先,我们先来看看DiVoMiner是如何执行机器编码的。
注意:DiVoMiner 平台允许多次执行机器编码,若您更新了数据库,或修改了编码类目,重新点击【机器编码】即可。
大湾区-人文历史话题统计
“大湾区11个城市旅游品牌个性研究”这个项目,各个渠道数据加起来超5万条,你知道小编从拿到数据,到做出图表,要多久时间呢,10分钟!
机器编码,效率就是这么高~
看到这里,可能有同学会有疑问,机器编码效率高是毋庸置疑,但是如何保证其准确性呢?
其实,上文已经说到了,机器编码并不是完全交由机器解决全部问题,机器编码结果高度依赖用户自设的选项关键词条件。即关键词是机器判断的逻辑依据,机器编码是通过给类目选项设定关键字,在海量数据中搜索出与关键字相关的内容结果。因此,做好这两步,机器编码的准确性大大提升。
类目选项的关键词设置越准确,机器编码的结果准确性越高。在研究过程中,有可能需反复调整、优化关键字的设定方式,以获得更全面及具有代表性的数据分析結果。
小编以大湾区城市的旅游资源中的人文资源题目为例:通过文献或资料查阅,大湾区城市的人文资源划分为历史文化、传统美食、民俗风情、地方特产、娱乐设施、宗教几个类别。
接下来,需要对每个选项以概念的形式来定义关键词,点击类目选项右侧的【关键词】,设置该选项对应的关键词。
例如大湾区城市的“历史文化”这个选项,综合大湾区城市的人文资源在历史文化方面的各个方面,可以总结出以下关键词组:
通过增加、删减等方式不断地完善类目选项关键词来提升机器编码的准确性。
由于语言的复杂性,单个关键词可能无法保证数据恰如其分地被检索出来。那么,我们还可以通过调整关键词的逻辑关系来提高机器编码的准确性。
DiVoMiner平台支持关键词设有多层逻辑关系。逻辑关键词有AND/OR/NOT(和/或/非)。
【OR】表示“或者”
【AND】表示“并列(和)”
【NOT】表示“不包括”
检索n个字之间的两个字符,关键词规则是“A B”~n。
例如:
“文化节 大湾区”~10,含义是检索10个字符内含有“文化节”和“大湾区”两个关键词的内容。
(底蕴 AND (历史 OR 文化)),含义是检索文中同时出现“底蕴”+“历史”,或者“底蕴”+“文化”两个关键词的内容,即可被编码为“历史文化”。
古镇 NOT 古镇郎中,含义是检索含有“古镇”这个关键词的内容,而不是“古镇郎中”这个关键词的内容。
注意:设置关键字时,连接关键字之间的逻辑词AND、OR、NOT大小写都可以,英文词组用英文引号""引用。括号需使用英文半角格式。
此外,我们还可以通过信度测试来检验机器编码的准确性。
本期内容就分享到这里,如有疑惑,可在评论区留言告诉小编。
如想了解更多操作方式,可登录DiVoMiner平台查阅《使用手册》。注册即免费使用!
DiVoMiner是按学术标准的量化内容分析法一站式平台,马上注册,使用公益免费版,学好研究方法,做论文,出报告,研出必行!做原创内容,尤其是研究内容,着实不易,敬请分享、点赞、关注!欢迎投稿,分享您的研究或思考!
更新时间:2024-09-03
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号