close
当前位置: 物联网在线 > IT技术 > 商业智能 >

部署预测模型时的最佳实践

理解业务需求

正如以前提到的, 在早期计划阶段企业识别预测分析项目背后的驱动力是至关重要的。一旦企业定义了它正试图发现的新信息, 它想学习的新事实, 或者需要加强哪些业务活动时, 它可以建立模型和部署相应的结果。

理解数据

应该对数据进行彻底的收集和探究。这使那些正在构建应用程序的人熟悉手头的信息, 这样他们就能够识别数据质量问题, 收集到初步的洞察力,或检测相关的子集, 可以被专家用来形成隐藏信息的假设性建议。这也确保可用数据能解决业务的目标。

数据准备

要准备数据,IT机构必须从各个业务部门的不同数据源来选择表、记录和属性。数据必须转换、合并、聚合、派生、样本、权衡。然后清洗和增强来达到优化结果。这些步骤可能需要多次执行,以便让数据真正为建模工具做好准备。

建模

一旦信息准备好了, 各种建模技术应该选择并应用, 及其参数较准为最佳值。建模技术的选择是由底层数据特征或期望的计分模型的形式决定的。换句话说,一些技术可能比其它能更好地解释数据中基本模式,因此,各种建模方法的结果必须比较。如果一组规则作为计分模型是重要的,也应该使用决策树,它很容易解释。一些技术可以应用到相同的场景来产生多个视角的结果。

评估

彻底评估应该从两个独特的视角进行: 通常被统计学家采用的一种技术/数据的方法和一种业务方法。业务方法收集业务问题所有者和终端用户的反馈。这常常会导致模型中的变化; 但尽管技术/数据评估是十分重要的, 它不应该严格到大大延迟模型的实现和使用。模型的业务价值应该是主要的测试。

部署

部署,是最后一步,可能意味着两种情况之一: 生成一个报表进行分析,或实现一个可重复的数据挖掘或计分应用程序。这里的目标是创建一个可重复的应用程序可以用于生成大量当前数据的预测。然后结果被分布到一线员工; 以一种他们熟悉的格式 — 报表、仪表盘、映射、或图形 — 以实现积极的决策。

避免常见的最差实践并采用最佳实践,是成功实现和使用预测分析的关键。通过了解需要避免的一些缺陷, 以及需要采取的重要步骤, 企业可加速实现, 用户采用最大化, 实现实质性的投资回报率。


you might also like

  • 关于移动互联网产品的指标分析初探
  • 进行数据挖掘的8个最佳开源工具
  • 2017 Gartner数据科学魔力象限出炉,16位上榜公司花落谁家?
  • 一个资深数据人对数据挖掘解读
  • 数据科学的基本内容
  • 想从事大数据、海量数据处理相关的工作,如何自学打基础?
  • 追踪 | 获投5千万 他为华为拆解数据联系 自然语言绘用户画像定制内容
  • 我们找了 4 家大数据公司技术 Leader,聊了聊算法和数据挖掘工程师的机会和选择
  • SVM算法
  • 统计名词和数据挖掘术语大盘点

  • (责任编辑:ioter)