首页 / 数据科学 / dark data
dark data/dɑːrk deɪtə/
暗数据 · 数据科学
指未被系统记录或分析的原始数据,通常来自非结构化信息(如文本、音频、视频),在数据科学中具有重要价值,但常被忽视。

🔍 定义

  • 未被处理的原始数据
  • 来源多样,包括日志、聊天记录、语音等
  • 需要额外分析才能提取价值

🔍 应用场景

  • 用户行为分析
  • 市场趋势预测
  • 异常检测与安全监控
💡 实例
某电商平台通过分析用户的聊天记录和搜索历史,发现了一些潜在的市场需求,这就是对 dark data 的有效利用。