金数据帮助中心

如何减少刷票或减少无效数据的收集

对于投票、调查类的表单,往往会遇到随意填写或刷票的数据,这些数据不仅浪费提交量,也影响分析结果。从技术上讲,刷票不能完全避免,但通过一定的限制,能够提升刷票成本,降低刷票几率,从而降低垃圾数据的产生。 以下是金数据根据这类表单的特点,总结的一些制表设置时的建议,希望能帮助你获得合格高质量的数据。

限制填写权限

开启方法:表单「设置」——「数据收集」——「填写规则」,如图所示:

  • 所有人可填 杀伤力:★

这是默认设置,打开表单的任何人都能够任意次数地提交数据。

  • 仅金数据用户可填 杀伤力:★★★★

用户需要登录金数据才能填写表单,如果没有金数据账户,则需要创建一个账户才能填写。这个限制可能会因为注册流程而让潜在填表者望而却步,但能够极大地增加刷票成本,提升数据质量。

  • 仅管理员可填 杀伤力:★★★★★

这个配置主要用来进行内部数据填报,无法被外部填写。

  • 每设备限填一次 杀伤力:★

该限制依赖于用户浏览器的 Cookies,如果用户禁用 Cookies ,或每次提交后清除 Cookies ,或者更换多个浏览器多个填写设备填写,限制都将失效。这项限制对于机器刷票或清除 Cookies 刷票毫无帮助。 表单如果在微信中填写,用户退出微信会自动清除 Cookies,这也会导致该限制失效。

  • 每 IP地址限填一次 杀伤力:★★★

这项限制对机器刷票有较好的抑制效果,但容易误伤。因为学校、公司等公共场所的对外出口只有一个或者几个 IP 地址,来自这些区域的填表者会无法正常提交;来自省内同一个运营商的手机用户也可能是通过有限的 IP 地址池访问互联网,这些用户也有可能无法正常提交。

  • 每微信openID限填一次 杀伤力:★★★

需勾选「仅限在微信中填写」并且开启「收集用户微信信息」时才可用。 微信openID是微信用户在公众号appid下的唯一用户标识,可用于永久标记一个用户。 但appid不同,则获取到的openid就不同。即:若用来收集用户微信信息的公众号发生改变,同一个微信用户的openiD也将发生改变,该用户则可能再次提交数据。

限制数据收集的时间/数量

杀伤力:★★

开启方法:表单「设置」——「数据收集」——「表单开启/停止」,如图所示:

  • 表单开启/停止: 如果你的表单已经不需要收集数据,还不断有数据提交,可以直接关闭,关闭后就再收不到任何新数据了。
  • 设定开启/停止时间: 相当于一个自动计时器,可以设置从 XX 日 X 分 X 秒自动开启,至 YY 日 Y 分 Y 秒自动停止。
  • 设定每日开启时段:与上条一样的功能,但细化到以天为单位的循环。
  • 设定数据量上限: 设定数据总的收集量上限,但可以不断更改,例如将收集量设置为 700,下周一改为 1400,这样就可以控制每周的数据收集量了。

注意:以上方法需要你对刚开始收集的数据进行评估,再做调整,例如你发现每晚都会有大量垃圾信息提交,就可以在晚上关闭表单。

使用手机字段

杀伤力:★★★

手机字段是减少刷票行为最重要的工具之一,它不影响正常的填写者,同时可以大幅提高刷票成本。

  • 必须填 勾选后,用户必须填写正确格式的手机号后才能提交。

  • 不能和已有数据重复 即,同一个手机号码只能填写一次。

  • 白名单 可以设置白名单内的手机号才能填写。

  • 使用短信验证 必须输入手机验证码才能提交,即,只有真实有效的手机号码才能提交数据。虽然这会消耗短信余量,但是极大地增加数据有效性及减少刷票行为。

  • 获取验证码前需填写图形验证码开启短信验证会默认勾选此项,防止手机验证码滥用,有效减少刷票行为。

字段白名单

杀伤力:★★★★★

如果你的表单只希望公司内部,或少数你已经知道姓名、电话等信息的人填写,可以使用此功能,目前「姓名」、「手机」、「单行文字」这三种字段可以设置白名单,设置之后,只有在白名单内的数据才能正常提交。这也代表了此表单基本无法被外人填写。

开启方法:进入表单编辑页面,添加相关字段后,在右侧「编辑字段」的操作面板,勾选「白名单」点击「设置」:

把表单变得复杂

杀伤力:★★★★

1、进行填写设置 开启方法:进入表单设置——数据收集——填写设置,如图:

  • 凭密码填写 主要用于信任的人的填写。除了知道密码的人,其他人不可能成功填写表单。

  • 提交前需填写验证码 通常防止机器刷票的垃圾数据提交。

  • 禁止在微信中分享 打开此选项后,在微信中浏览此表单时,填表者将不能选择将此表单分享到朋友圈、QQ等三方平台,也不能转发给朋友。有效减少无效数据的收集。

2、如果你对数据质量的要求非常高,还可以参考以下原则来设计表单:

(1). 提供至少一个以上的、需要用户输入的字段。 该字段可以是姓名、电话号码等,并且设置其中至少一项为必选、不能重复。

(2). 对于某些关键问题,可以采用同一个目的、多个问题反复问的方式,获得真实数据。 你在后期筛选的时候可以通过组合筛选,过滤掉这些无效数据。

例如:在一个调查问卷中,询问现在的幸福感,你可以给出两个问题:
     你觉得现在的工作满意吗? 不满意/还行/非常满意
     你对下份工作充满期待吗? 不期待/一般/非常期待

如果用户填写了「非常满意」,又填写了「非常期待」,这条数据的价值就不大了。
有帮助(0) 未解决问题?