你秃了但数据质量变好了!—「市场部聊数据」之浅谈数据质量

书到用时方恨少,“数”到用时却方恨“多”!望着茫茫用户数据海洋,大部分市场部同仁可能和最初的小编一样,只能兴叹而不知如何回头是岸。这时候,你就需要营销自动化中的数据整合平台来帮你的忙。

你可能遇到过以下场景:

  • 场景一:你想更新邮件营销名单,要整合 10份“考古出土”的来自各种活动的高意向潜客名单,却惊奇的发现各类信息参差不齐,还有未标注的各色高亮标记、最新的意向状态居然是半年前更新的—— 小朋友,你是不是有很多问号?
  • 场景二:你想要总结各渠道获客数据,发现每个渠道的用户数据没有存在统一字段下,要写无数个vlookup来帮你匹配无数个phone number、Shouji、手机、手机号、Name、姓名、Xingming、最新姓名、姓名-用这个,更有甚者,来个乱码的PNY2gGWVcQa3shUhAiB2Mg渠道名让你“哭问”客从何处来。

无论你是在B2B或是B2C公司的市场部搬砖,处理的数据大或小,以上都是你可能会遇到的数据质量挑战。在数据分析中有句俗话:垃圾进,垃圾出。再完美的数据模型、再全面的分析解释,都无法将垃圾数据变成有价值的商业洞察。 本期「市场部聊数据」我们就来聊聊用户数据分析中的数据质量。

 

数据质量定义

数据质量指的是数据的质量水平,定义是“应用适用性”,由数据使用者来评判。若适用于运营、决策、规划的使用目的,则被认为是高质量的数据。美国数据科学国家机构制定的数据质量准则是:

  1. 数据是产品(有成本和价值)
  2. 数据有质量
  3. 数据质量取决于多种因素(如数据使用目的、用户、时间等)

数据质量挑战

 

数据质量挑战

从零售、旅游到制造业,各行业的商业数据都将在大数据趋势下迎接数据质量的挑战,呈现以下四大特征:Volume(大量)、Velocity(高速)、Variety(多样性)、Veracity(真实性)。

这带来了相应的数据质量挑战:

  • 大量数据种类以及复杂的数据结构使数据整合的困难程度上升;
  • 数据体量大以致无法在短时间内判断数据质量水平;
  • 数据变化太快而且数据的“及时性”很短,因此要求更高的处理技术;
  • 目前没有统一和经过实践的数据质量标准,对于数据质量的研究才刚刚开始。

 

提高数据质量的四大策略

  • 为全公司创建一个实用及有价值的数据收集和清洗过程
  • 可视化
    1. 将数据切片(Slice)以查看细节
    2. 了解数据错误
  • 发动群众力量来修复数据
    1. 让过程变得机动
    2. 让数据易于被修正
  • 中心化地创建规则及清理元数据
    1. 如何分类及打标签(如男、男性、Male、0或1……)

 

应用以上策略来规划数据生命周期的四个阶段

  • 计划阶段:数据定义、收集手段等;
  • 收集阶段(数据获取):标准化数据收集表单、全面的员工培训以及良好搭建的数据库;
  • 管理阶段(数据结构):缺失数据管理及非结构化数据;
  • 分析阶段(数据传递):数据模型。

好了,本期我们大致了解了市场部数据质量的理论。Stay tuned,且听小编「市场部聊数据」下回的实例分解!