HI,下午好,新媒易不收取任何费用,公益非盈利机构
24小时服务热线: 4000-162-306
请扫码咨询

新媒易动态

NEWS CENTER

初始数据来源于我们为客户提供的产品价值

2021-11-25

 如何进行学者库的数据积累?

在第一次推送时,没有任何学者数据,也没有学者库,学者库的数据是如何积累起来的呢?

初始数据来源于我们为客户提供的产品价值。

学者库最原始的学者数据以我们为客户提供的邮件传播产品服务为线索获得。邮件传播作为一种文献传播服务产品提供给客户时,我们为客户带来的价值是通过对该刊物/文献的画像分析并采集相关学者,再发送邮件来吸引学者阅读、引用等一系列关注。

从分析文献到匹配学者,这期间获得的数据,包括期刊之间引用引证关系数据、期刊发文机构信息、引用引证机构信息、关键词/共现词信息、学者基本信息尤其是学者邮箱等数据都是我们提供给客户的产品价值,其中学者相关信息则是学者库最初始的数据来源。

在这个基础上,学者打开邮件阅读文章等一系列行为数据也被记录,这些数据都在不断补充进学者库。

除了每次为客户提供服务时获取到的数据能作为学者库的资源,另外,其他产线,如投稿平台学者投稿时提交的数据,又或者其他第三方平台的公开数据采集都是后续学者库数据的补充。

学者库的海量数据不但可以为后续推送提供支持,还可以给其他产线如审稿邀请提供服务。

2. 学者筛选

学者筛选,是指为每次论文推送从学者库中选择一部分更为精准的学者推送。

每次推送密切相关的学者数量都是有限的,若选择太多人数,部分相关度不够高的学者会带来流量资源的浪费,并且过多邮件还会导致被当成垃圾邮件等问题。

所以,从节约成本提高质量的角度出发,我们要筛选出相关度最高的一批学者来推送。

学者筛选可以从领域相关的角度,也可以从关注指标的角度来入手。

从领域相关的角度,指的是找出与本次推送论文研究领域类似的学者。

如何定义或确定论文的主题和学者的研究方向有较强的相关性?

首先,可以以期刊论文的基本信息为线索来筛选。从期刊的角度,期刊通常会有所属的中信所分类(一种期刊常用的标准分类),可以筛选出该中信所分类下其他刊的学者;从期刊论文的角度,可以从论文的引用文献来找到引用引证文献的作者作为推送目标学者;从发文作者机构的角度,可以找到论文作者的同机构学者,以及引用引证机构的学者。

其次,是对论文主题的再次分析。一般从关键词、共现词、分类号,以及摘要中观点的分析,来总结出本期论文的研究领域词,再去匹配具有相同研究领域词的学者。

相关推荐