预测分析工具融合了人工智能和业务报告。这些工具包括用于从整个企业收集数据的复杂管道,添加统计分析和机器学习层以对未来进行预测,并将这些见解提炼成有用的摘要,以便业务用户可以对此采取行动。
预测的质量主要取决于进入系统的数据——大型机时代的老口号“垃圾进,垃圾出”,如今仍然有效。但还有更深层次的挑战,因为预测分析软件无法预测世界变化的时刻,以及未来与过去的弱关联。这些主要通过确定模式来运作的工具正变得越来越复杂。
与从头开始编写工具相比,使用专用的预测分析工具通常相对容易。大多数工具都提供可视化编程界面,使用户能够拖放各种针对数据分析而优化的图标,有助于用户理解编码并像程序员一样思考,而且这些工具确实可以通过点击鼠标来生成复杂的预测。
工具 | 重点 | 部署 | 价格 | 免费选项 | 开源 |
Alteryx Analytics Process Automation | 用于数据管道的可视化IDE;用于繁琐任务的RPA | 在本地或Alteryx云中部署 | 用户/年 | 免费试用 | 可用 |
AWS SageMaker | 与AWS、第三方市场、无服务器选项完全集成 | AWS云平台 | 与资源使用挂钩 | 免费套餐 | 未知 |
H2O.ai AI Cloud | 无人驱动人工智能提供自动化管道;人工智能适应传入的数据 | 在本地或任何云平台部署 | 企业支持的云选项 | 开源核心 | 可用 |
IBM SPSS | 用于创建管道、IBM集成的拖放式建模器 | 在本地或IBM Cloud中部署 | 用户/月 | 免费试用 | 未知 |
RapidMiner | 面向数据科学家的完整IDE、面向非编码用户的自动化,拖放式设计器 | 在本地或任何云平台中部署 | 按需收费 | 免费套餐 | 未知 |
SAP | 与SAP仓库和SCM深度集成;低代码,无代码功能 | 在本地或SAP云平台部署 | 用户/月 | 免费套餐 | 未知 |
SAS | 复合人工智能混合了统计和机器学习;特定行业的解决方案 | 在本地或云平台部署 | 按需收费 | 免费试用 | 未知 |
TIBCO | 支持更大的数据管理架构;提供模块化选项 | 在本地或云平台部署 | 各种选项,包括按资源使用情况 | 免费试用 | 未知 |
Alteryx Analytics Process Automation(APA)平台的目标是帮助您在应用最佳数据科学和机器学习算法之前构建清理数据的管道。高度自动化支持将这些模型部署到生产中,以生成源源不断的见解和预测。可视化IDE提供了300多个选项,这些选项可以组合在一起形成一个复杂的管道。APA的优势之一是它与其他数据源(例如地理空间数据库或人口统计数据)的深度集成,以丰富您自己的数据集质量。
要点:
对于数据科学家来说,这是一个非常好的解决方案,可以帮助他们自动收集复杂的数据源,以生成多个可交付成果的;
用于本地部署或Alteryx云中的部署。
包括许多用于处理文本识别或图像处理等杂务的机器人流程自动化(RPA)工具;
旨在为可能希望将数据显示为仪表板、电子表格或其他一些自定义平台的多个客户提供见解。
Designer等工具的起价为每位用户每年5195美元。额外费用由销售团队定价。提供免费试用和开源选项。
作为亚马逊(Amazon)的主要人工智能平台,AWS SageMaker与AWS产品组合的其余部分很好地集成,以帮助用户分析来自云供应商的主要数据源之一——亚马逊的数据,然后将其部署为在自己的实例中运行或作为无服务器lambda函数的一部分运行。SageMaker是一个提供全方位服务的平台,具有数据准备工具(例如Data Wrangler),一个由Jupyter笔记本构建的展示层,以及一个名为Autopilot的自动化选项。可视化工具可以帮助用户一目了然地了解正在发生的事情。
要点:
与AWS生态系统的许多部分完全集成,使其成为基于AWS的操作的绝佳选择;
无服务器部署选项允许成本随使用情况扩展;
市场促进与其他SageMaker用户买卖模型和算法;
与各种AWS数据库、数据湖和其他数据存储选项集成,使处理大数据集变得简单;
定价通常与支持计算的计算资源的大小相关,慷慨的免费套餐使试验成为可能。
将优秀的人工智能算法转化为富有成效的洞察力是H2O.ai AI Cloud的主要目标。它的“无人驱动人工智能”提供了一个用于摄取数据和研究最显著特征的自动化管道。一组开源和专有特征工程工具有助于将算法集中在数据最重要的部分上。其结果显示在仪表板或自动图形可视化的集合中。
要点:
专注于人工智能最适合需要适应传入数据的复杂解决方案的问题;
工具范围从用于创建大型数据驱动管道的AI Cloud,到帮助桌面用户创建实时仪表板的基于Python的开源Wave;
在本地部署或任何云平台中运行;
核心平台全开源;
几十年来,统计学家一直在使用IBM公司的SPSS来处理数字。最新版本包括集成新方法的选项,例如机器学习、文本分析或其他人工智能算法。统计数据包侧重于对所发生事件的数字解释。SPSS Modeler是一个拖放工具,用于创建数据管道,从而获取可操作的见解。
要点:
非常适合拥有大数据流的大型传统企业;
与其他IBM工具(例如WatsonStudio)集成;
起价为每位用户每月499美元,并提供大量免费试用。
RapidMiner的工具总是首先提供给第一线的数据科学家。其核心产品是一个完整的可视化IDE,用于试验各种数据流以找到最佳见解。该产品线现在包括更多的自动化解决方案,可以通过更简单的界面和一系列用于清理数据和寻找最佳建模解决方案的工具,向企业中更多的人员开放流程。然后可以将这些部署到生产线。该公司还通过一个旨在简化采用的人工智能中心来扩展其云产品。
要点:
非常适合直接处理数据并推动探索的数据科学家;
为需要了解预测背后原因的用户提供透明度;
使用Jupyter notebook驱动的人工智能中心(AI Hub)鼓励AI科学家和用户之间的协作;
对基于Python的开源工具的强大支持;
广泛的免费层为早期试验和教育计划提供RapidMiner Studio;
可根据需求为大型项目和生产部署定价模式。
任何制造行业从业人员应该都知道SAP软件。它的数据库可以在供应链的各个阶段跟踪货物。为此,他们投入巨资开发了一种用于预测分析的绝佳工具,使企业能够就下一步可能发生的事情做出更明智的决策。该工具在很大程度上基于商业智能和报告,将预测视为分析演示文稿中的另一个专栏。来自过去的信息主要使用高度自动化的机器学习例程集合,为有关未来的决策提供信息。不需要成为人工智能程序员即可运行它。事实上,他们还一直致力于创建所谓的“对话分析”工具,可以为任何用人类语言提问的管理者提供有用的见解。
要点:
非常适合已经依赖与SAP仓库和供应链管理软件深度集成的堆栈;
采用低代码和无代码策略设计,向所有人开放分析;
常规商业智能流程的一部分,以确保一致性和简单性;
用户可以通过询问预测背后的上下文,来深入了解人工智能是如何做出决策的。
免费计划允许进行试验。基本起价为每位用户每月36美元。
作为最古老的统计和商业智能软件包之一,SAS的功能随着时间的推移变得愈发强大。需要预测的企业,可以生成依赖于统计数据和机器学习算法的任何组合的前瞻性报告,SAS称之为“复合人工智能(composite AI)”。该产品线分为用于基本探索的工具,例如可视化数据挖掘或可视化预测。还有一些针对特定行业的重点工具,例如旨在预测潜在合规问题的反洗钱软件。
重点:
已针对特定行业(例如银行)优化的大量工具集;
传统统计学与现代机器学习的完美结合;
专为本地和基于云的部署而设计;
定价在很大程度上取决于产品选择和使用情况。
在各种集成工具收集数据后,TIBCO的预测分析可以开始生成预测。Data Science Studio旨在使团队能够共同创建低代码和无代码分析。更集中的选项可用于特定数据集。例如,TIBCO Streaming已针对从一系列事件创建实时决策进行了优化。Spotfire则通过将基于位置的数据与历史结果集成来创建仪表板。这些工具与该公司更强大的产品线配合使用,以更好地支持数据收集、集成和存储。
要点:
非常适合支持更大的数据管理架构;
预测分析与多个数据移动和存储选项集成;
建立在生成报告和商业智能的传统之上;
机器学习和其他人工智能选项可以提高准确性;
产品为各种不同的云平台和内部部署选项计划提供独立定价。“交钥匙式”(Turn-key)AWS实例起价为每小时99美分。
原文链接:
https://www.cio.com/article/193743/top-tools-for-predictive-analytics.html