数据分析概述

已完成

在数据可用于讲故事之前,必须通过使其在故事中可用的过程来运行数据。 数据分析是标识、清除、转换和建模数据的过程,用于发现有意义和有用的信息。 然后通过报表将数据制作成故事进行分析,支持关键的决策过程。

有关可信数据的报告

随着数据对世界发展的推动作用日益增加,通过数据分析讲述故事正在成为大大小小企业非常重要的一部分。 这也是组织继续雇用数据分析师的原因。

数据驱动型企业根据数据讲述的故事做出决策,而在当今数据驱动的世界中,数据的潜力未完全发挥,这是大多数企业面临的挑战。 数据分析是并且也应该成为所有组织的重要部分,应利用它帮助确定业务影响(包括评估客户情绪、进行市场和产品研究,以及确定趋势或其他数据见解)。

尽管数据分析过程着重于清理、建模和可视化数据的任务,但数据分析的概念及其对企业的重要性不容小觑。 为了分析数据,分析的核心部分划分为以下几个类别:

  • 说明性
  • 诊断性
  • 预测性
  • 规范性
  • 认知性

描述性分析

描述性分析有助于根据历史数据回答有关发生了什么的问题。 描述性分析技术汇总了大型语义模型,向利益干系人描述结果。

通过开发关键绩效指标 (KPI),这些策略有助于跟踪关键目标的成功或失败情况。 许多行业都使用了投资回报率 (ROI) 等指标,某些行业还开发了专门用于跟踪性能的指标。

描述性分析的示例包括生成报表来提供组织销售和财务数据的视图。

诊断分析

诊断分析有助于解答事件发生原因相关问题。 诊断分析技术是对基本描述性分析的补充,通过使用描述性分析的结果来发现这些事件发生的原因。 然后,进一步调查绩效指标,以发现这些事件变得更好或更糟的原因。 此过程通常分为三个步骤:

  1. 确定数据中的异常。 这些异常可能是指标或特定市场中发生的意外变化。

  2. 收集与这些异常相关的数据。

  3. 使用统计技术来发现用以解释这些异常的关系和趋势。

预测分析

预测分析有助于回答有关将来会发生什么的问题。 预测分析技术使用历史数据来确定趋势并确定它们是否有可能重复出现。 预测分析工具提供将来可能发生什么的有价值见解。 技术包括各种统计和机器学习技术,例如神经网络、决策树和回归。

规范性分析

规范性分析有助于回答应采取哪些措施来实现目标的问题。 通过使用来自规范性分析的见解,组织可基于数据制定决策。 此方法允许企业在面临不确定性时做出明智的决策。 规范性分析技术依赖于机器学习作为在大型语义模型中寻找模式的策略之一。 通过分析过去的决策和事件,组织可以估计不同结果的可能性。

认知分析

认知分析尝试从现有数据和模式中进行推断,并基于现有知识库得出结论,然后将这些结果添加回知识库,以供将来进行推断,这是一个自学习反馈循环。 认知分析有助于了解如果情况发生变化可能发生什么,以及确定如何处理这些情况。

推断不是基于规则数据库的结构化查询,而是从多个源收集的非结构化假设,并以不同的置信度表示。 有效的认知分析取决于机器学习算法,并使用多种自然语言处理概念来利用以前未使用过的数据源,例如呼叫中心对话日志和产品评审。

示例

通过启用报告和数据可视化,零售企业使用描述性分析来查看近些年的购买模式,确定下一年可能会受欢迎的产品。 企业还可以查看支持性数据,了解特定产品为何受欢迎,以及该趋势是否会持续下去,这将有助于确定是否需要继续储备该产品。

企业可能确认了某个产品在特定时间段内很受欢迎。 然后,企业可以利用此分析来确定某些市场营销工作或在线社交活动是否有助于销售增长。

数据分析的一个基础就是企业需要信任其数据。 数据分析过程的一个实践方案是捕获来自可信来源的数据并将其转化为可使用、有意义且易于理解的内容,用于帮助决策制定过程。 通过数据分析,企业可以借助数据驱动的过程和决策来充分了解其数据,使企业能够放心地做出决策。

随着数据量的增加,对数据分析师的需求也增加。 数据分析师知道如何组织信息,并对信息进行“萃取和提炼”,最后得到可理解的有意义的内容。 数据分析师知道如何收集适当的数据以及如何使用它们,即在数据重载中理解弄清数据。