沃卡logo

AutoML综合分析

2023-02-18来源:

该图片由Gerd Altmann 在Pixabay上发布

  介绍

  一个改变一切的旧观念是自动化。我们以某种方式创造的每一种工具和方法都涉及某种程度的自动化。一个被称为自动化机器学习或 AutoML 的新兴领域自动化了创建机器学习模型以对数据建模的过程。借助适用于 ML 项目的最佳 AutoML,机器学习项目现在非常容易完成。新手和专家都可以随时从机器学习应用程序的 AutoML 库中受益匪浅,而不会出现错误。这些库以提供资源来自动识别涉及预测建模的任务的顶级机器学习计划而闻名。让我们探索一下最近在研究人员中流行的机器学习项目的十大 AutoML 库中的一些。

  什么是自动机器学习?

  术语“AutoML”是指部分或全部机器学习模型构建过程的自动化,包括特征选择和配置、性能指标调整、特征选择和构建、训练多个模型、评估模型性能和选择最佳模型.

  在具有多个预处理步骤(缺失值插补、缩放、PCA、特征选择等)的管道中,所有模型和预处理步骤的超参数,以及在管道内集成或堆叠算法的各种方法。

  AutoML 考虑了各种机器学习算法(随机森林、线性模型、SVM 等)。

  采用 AutoML 的好处是它可以自动化机器学习过程中参与度最低且最耗时的组件。它允许数据科学家专注于更具创造性和战略性的任务,而不是浪费时间自动化费力但计算要求高的建模阶段。

  使用 AutoML 的缺点是自动化的特征工程和预处理可能会使判断模型是否过度拟合变得困难。此外,强大的性能不一定来自自动化模型训练。

  为什么 AutoML 是未来的需要?

  从应用的角度来看,过去几年对机器学习系统的需求急剧增长。许多不同的应用程序都结合了机器学习。尽管已经证明机器学习可以改善对某些企业的支持,但许多企业仍然难以部署 ML 模型。

  替代某些人类劳动是人工智能的理论目标之一。特别是,采用适当的算法可以帮助完成 AI 的很大一部分设计工作。以参数调整为例,通过利用增加的计算能力,贝叶斯、NAS 和进化编程等算法可以在参数调整过程中替代人工。

  一个组织首先需要一个经验丰富的数据科学家团队,他们在部署 AI 模型之前需要高薪。即使企业拥有一流的员工,选择最适合企业的模型通常也需要比 AI 专业知识更多的经验。由于机器学习在一系列应用中的成功,机器学习系统的需求不断增长,即使对于非专家来说也是如此。在最少的人为干预下,Automl 倾向于尽可能多地自动化 ML 管道步骤,同时保持较高的模型性能。

  使用 AutoML 的三个主要好处是:

  自动运行重复性杂务以提高工作效率。因此,数据科学家现在可以更多地关注问题而不是模型。

  自动化 ML 管道还有助于防止体力劳动带来的潜在错误。

  AutoML 使任何人都可以使用 ML 功能,这是迈向机器学习民主化的重要一步。

  各种 AutoML 平台

  1.自动Sklearn

  创建了一个名为 Auto-Sklearn 的开源 Python 包来自动化机器学习 (AutoML) 过程。它为一系列分类器、回归和聚类技术自动进行模型选择和超参数调整,这是机器学习中最耗时但最不令人兴奋的部分。Auto-sklearn 实现了支持向量机 (SVM)、随机森林、梯度提升机 (GBM)、k-means 和其他 ML 技术。

  2.AutoKeras

  通过一系列高级 Python API,AutoKeras 自动化预处理过程,包括特征提取和缩放。使用 AutoKeras 的好处是可以自动执行所有困难的机器学习活动,包括数据处理、模型选择和参数调整。

  3. 超级选择

  用于大规模 AutoML 的开源库称为 HyperOpt。流行的 Scikit-Learn 机器学习库由 HyperOpt-Sklearn 支持,它是 HyperOpt 的包装器。这包括收集数据准备技术以及分类和回归方法。

  4.数据块

  您可以使用 Databricks AutoML 轻松创建基线模型和笔记本。通过使用其 MLlib 库(自动执行特征提取和缩放等预处理任务),它实现了机器学习的自动化。使用 Databricks AutoML 的好处是可以自动执行所有困难的机器学习活动,包括数据处理、模型选择和参数调整。

  5.变形金刚

  TransmogrifAI 是一个著名的用于机器学习项目的 AutoML 包,它在 Scala 中构建并在 Apache Spark 之上运行。通过机器学习自动化和 API,它旨在提高机器学习开发人员在 ML 项目中的生产力。它有助于高效构建模块化和紧密类型的机器学习工作流,以及通过较少的手动修改来训练高质量的机器学习模型。

  6. 盒子

  MLBox 具有快速读取、分布式数据准备或格式化、非常强大的特征选择和泄漏检测、精确的超参数优化以及模型解释预测等功能,是用于机器学习项目的著名 AutoML 包。它专注于超参数优化、实体嵌入和漂移识别。

  7. H20 自动机器学习

  用于机器学习应用程序的最佳 AutoML 库之一是 H20 AutoML,它可以自动执行迭代建模、超参数调整、特征生成和算法选择。它有助于机器学习模型的无差错训练和评估。它有望减少对机器学习知识的需求,从而提高项目绩效。

  8. 自胶子

  AutoGluon 是一个易于使用且易于扩展的 AutoML 库,适用于机器学习项目。它有助于自动化堆栈集成、深度学习以及跨文本和图像的真实应用程序。它允许使用几行代码快速构建深度学习和机器学习模型的原型,并利用自动超参数调整。

  9. TPOT

  TPOT 是一个著名的 AutoML 包,用于自动为需要预测建模的工作寻找一流的机器学习模型。它是一个带有机器学习模型和 scikit-learn 数据准备框架的开源库。它是一个用于基因修改机器学习过程的 Python AutoML 工具。从数以千计的潜在管道中选出最合适的管道用于自动化重复和繁琐的流程。

  10. 自动 ViML

  在庞大的 AutoML 库中,机器学习任务是使用 Auto-ViML 完成的。其目的是使用更少的变量创建高效、可解释的模型。只需一行代码,即可自动构建多个机器学习项目。这个 AutoML 包具有吸引人的特性,包括 SMOTE、Auto NLP、数据时间变量和特征工程。

  11.路德维希

  借助直接且适应性强的数据驱动配置机制,声明式机器学习框架 Ludwig 使机器学习管道的设计变得简单。Linux Foundation AI and Data host Ludwig,可用于广泛的 AI 活动。

  输入和输出功能以及适当的数据类型在配置中声明。用户可以指定额外的参数来预处理、编码和解码特征,从预训练模型加载数据,构建内部模型架构,调整训练参数,或执行超参数优化。

  Ludwig 将使用配置的显式参数自动创建端到端的机器学习管道,同时将那些不是的设置恢复为智能默认值。

  12.亚马逊转录

  通过使用一种称为自动语音识别 (ASR) 的深度学习方法,Amazon Transcribe 使开发人员可以轻松地将语音转文本功能添加到他们的应用程序中。

  此外,AWS 还提供 Amazon Transcribe Medical,它使临床文档应用程序能够将医疗语音转换为文本。

  AutoGluon 专注于自动堆栈集成、深度学习和涵盖文本、图像和表格数据的实际应用,提供易于使用和易于扩展的 AutoML。

  Amazon Transcribe 的主要优势包括:

  创建易于阅读的转录

  过滤特定字词

  通过自定义转录提高准确性

  Amazon Transcribe 的一些示例用例是:

  客户体验

  通话后分析

  临床谈话文件

  字幕和字幕工作流程

  编目音频档案

  13.数据机器人

  对于预测模型,DataRobot 按需提供自动化机器学习。它使用所有可用数据,自动执行特征工程、模型选择和超参数优化,无需重新训练模型。

  14. 亚马逊 Sagemaker 自动驾驶仪

  Amazon Sagemaker AutoPilot 提供机器学习模型训练和扩展的无服务器和分布式自动化。使用这个完全托管的解决方案,可以在 Amazon ECM 或 Amazon SageMaker 上以任何规模部署机器学习模型。

  15. 谷歌云自动机器学习

  AutoML 由 Google Cloud 作为云服务提供。它针对机器学习问题自动化模型构建和超参数调整,包括情感分析、自然语言处理 (NLP)、图片分类等。

  16. SMAC

  SMAC(基于顺序模型的算法配置)是一个用 Python 编写的 Automl 库,它可以自动训练大量模型(网格搜索)和使用各种行业标准评估对分类或回归问题模型的性能进行评估指标,例如准确性。

  17. Azure 自动机器学习

  Microsoft Azure 的 AutoML 通过使用其独特的算法来使用最有效的机器学习算法来配置、训练和评分模型,从而实现机器学习的自动化。

  18.PyCaret

  PyCaret 是一个著名的 Python 机器学习框架,它使用低代码并且是开源的,用于自动化机器学习模型。它是一种广受欢迎、实用且成功的模型管理和端到端机器学习解决方案,可提高生产力。这种自动化机器学习应用程序具有许多不同的功能,例如数据准备、模型训练、超参数调整、分析和可解释性。

  19. 汽车维卡

  这个数据挖掘软件的名称是 AutoWeka。Weka 机器学习软件是其基础。由于其卓越的可用性和强大的功能,它适合新手和专家。该工具支持使用两种机器学习技术(即支持向量机和人工神经网络)快速构建预测数据挖掘模型。

  20. 斯普伦克

  Splunk 的主要卖点是实时处理。您肯定注意到,虽然存储和 CPU 技术随着时间的推移而进步,但数据传输却没有。所以,Splunk 会解决这个问题。该平台使您能够为运营智能创建知识对象,在机器状态开始时接收警报/事件,并准确预测基础设施扩展所需的资源。

  21.亚马逊莱克斯

  这使您可以开发具有基于语音或文本的用户界面并由支持 Amazon Alexa 的相同技术提供支持的程序。为了在应用程序中设计、构建、测试和部署对话界面,完全托管的人工智能 (AI) 服务 Amazon Lex 使用高级自然语言模型。

  22. 大机器学习

  BigML 是 AutoML 最著名的解决方案之一,它使公司可以轻松利用一系列机器学习模型和平台来推进其运营。这个自动化机器学习软件提供了一个完整的平台、快速访问、易于理解和导出的模型、协作、自动化、适应性部署以及许多其他功能。

  23. 自动机器学习 JADBio

  JADBio AutoML 是一个著名的 AutoML 系统,无需脚本即可提供用户友好的机器学习。使用此工具,AutoML、研究人员、数据科学家和其他用户可以成功地与机器学习模型进行交互。准备数据进行分析、进行预测分析、学习新信息、分析结果以及部署经过训练的机器学习模型是使用 AutoML 所需的仅有的五个过程。

  24. 阿基奥

  Akkio 是一个用户友好的可视化平台,您可以使用它来增强销售、营销和财务运营。在不到五分钟的时间内,AI 模型就可以训练好并投入使用。不是顾问。无需安装任何软件。没有与销售相关的对话。以前的 AI 经验不是必需的。

  25. MLJAR

  它是与 Mercury 交换 Python Notebooks 并使用 MLJAR AutoML 获得最佳结果的最佳 AutoML 工具之一。对于表格数据,可以使用最复杂的自动化机器学习算法。由于其全面的特征工程、算法选择和修改、自动文档和 ML 解释,它使构建广泛的机器学习管道变得更加容易。MLJAR AutoML 框架众所周知,因为它有四种内置模式。

  26. 踏子爱

  Tazi.ai 是一个著名的可用于实时数据的连续机器学习 AutoML 产品。允许业务领域专家应用机器学习以生成预测是有利的。AutoML 应用程序使用监督、非监督和半监督机器学习模型。

  27.增强器

  Enhencer 是一个 AutoML 平台,非常强调可用性和开放性。其尖端的用户界面使快速开发机器学习模型成为可能。Enhencer 提供透明的性能指标,便于评估和微调模型性能。此外,Enhencer 接口允许随着时间的推移跟踪模型性能。

  28.艾布尔

  Aible 以直接、快速和安全的方式开发对业务具有明显影响的人工智能。当 AI 针对业务效果而非准确性进行训练时,商业人士会根据他们实际的成本效益权衡和资源限制来构建 AI。Aible 处理剩下的事情,从数据到影响,只需要回答三个业务问题。

  29. 点数据

  在机器学习公司中独一无二的 dotData 建立在一个大胆的理念之上,即如果数据科学可以尽可能简单,任何人都可以从中获益。DotData 是在著名数据科学家、NEC 119 年历史上最年轻的研究员 Ryohei Fujimaki 博士的指导下建立的。企业尊重客户并努力为他们提供自动化机器学习 (AutoML) 的最佳价值。DotData 是第一家使用机器学习为企业提供完整的数据科学自动化的公司。通过自动化加速、民主化和操作整个数据科学流程,其数据科学自动化平台缩短了实现价值的时间。

  30. 机器人

  基于 Python 的鲁棒贝叶斯优化系统。Robo 的基本构建块是一个模块化架构,可以轻松添加和更换贝叶斯优化组件,如各种采集函数或回归模型。

  它包括一系列不同的获取函数,例如预测改进、改进可能性、置信下限或信息增益,以及各种回归模型,例如高斯过程、随机森林或贝叶斯神经网络。

  31. 自动对开

  选择最佳选择策略及其超参数允许 AutoFolio 最大化算法选择系统的性能。

  算法选择 (AS) 策略需要从预期最有效地解决特定问题实例的算法组中选择算法,在解决许多众所周知的 AI 挑战方面显着推进了最新技术水平。

  32. 活页夹

  Flexfolio 是一种基于投资组合的模块化和开放式求解器架构,其中包含多种基于投资组合的算法选择方法和策略。它提供了一个特殊的框架,用于将几种基于投资组合的算法选择方法和方法进行对比并将其集成到一个单一的、有凝聚力的框架中。

  33. 数据库

  Dataiku 是一个将数据和人工智能的使用系统化的平台。它的目标是整合人工智能和数据,使其成为日常运营不可或缺的一部分。他们专门针对企业、技术专业人员(如分析师)和业务专家(如工程师、架构师和数据科学家)。缺乏数据科学经验的用户可能不是 Dataiku 的最佳人选,因为成功使用该平台的功能可能需要相当多的技术专长。

  34. 创建ML

  Apple 提供了一种名为 CreateML 的无代码机器学习工具,可让您直接在 Mac 上开发、训练和部署模型。用户可以通过使用 CreateML 显着减少训练和部署 ML 模型所需的时间,并在很短的时间内完成。由于该工具的拖放功能,模型构建现在变得更加简单和方便。用户可以开发和使用模型来执行任务,包括从文本中提取含义、识别噪声、识别视频中的活动以及识别图像。

  35.Prevision.io

  Prevision.io 是一个人工智能 (AI) 平台,旨在帮助数据科学家和开发人员快速轻松地构建、部署、监控和管理模型,以便更多的数据科学项目可以快速投入生产。由于其功能和清晰的用户界面,用户可以在几分钟内设置平台。该平台可在 Google Cloud Marketplace 上使用,并采用即用即付许可模式。

  36.显然.ai

  明显地。AI 是一种无代码 AutoML 工具,可以轻松创建和维护预测性机器学习模型。由于该工具的无代码功能,企业用户、公民数据科学家和基本上任何其他人都可以在不编写一行代码的情况下开始进行预测。数据科学技能匮乏的问题已通过 Obviously.ai 的解决方案得到解决。即使公司没有重要的数据科学团队,他们仍然可以使用 ML 进行预测分析。

  37. 人工智能和分析引擎

  它是一个端到端的无代码 AutoML 平台,称为 AI 和分析引擎。该引擎无需花费数天或数周时间,而是加快了从原始数据到消费者模型部署的过程。通过在每个阶段提供简单的 AI 指导建议,该平台使任何用户,无论其机器学习能力如何,都能够构建和部署模型。该引擎面向范围广泛的用户,从个人和团体到企业。因此,有订阅定价计划来适应每个级别的使用。

  38.食谱

  另一个构建在 Scikit-Learn 之上的有趣的 AutoML 工具是 RECIPE 或 REsilient ClassifIcation Pipeline Evolution。它从其他进化框架中脱颖而出,因为它可以避免产生无效的个体,并将大量可能有用的数据预处理和分类技术组织成一个语法。RECIPE 使用遗传编程来发展具有上下文无关语法定义的管道,可以实现更高水平的灵活性。

  39. 自动目标

  一个名为 AutoGOAL 的 Python 包可以自动确定完成任务的最有效方法。它主要是为 AutoML 创建的,用于开发人员有多种选择来完成任务的各种情况。它已经有几个低级机器学习算法,可以自动组合到管道中以解决各种问题。

  它用作程序综合的框架,程序综合是选择最佳程序来解决特定问题的过程。用户必须能够指定所有潜在程序的空间才能运行。ML 程序员会喜欢这个额外的 AutoML 工具箱,因为它提供了此类工具通常不具备的多功能性。

  40. 快速矿工

  RapidMiner 的机器学习技术可以显着减少为任何不关心部门、资产或估计的协会或组织开发预测模型所需的时间和工作。

  使用自动模型,可以在大约五分钟内生成预测模型。它不需要任何特定的专业知识。客户可以轻松传输他们的数据并确定他们需要的结果。

  届时,Auto Model 将产生高评价的体验。计算机化的数据科学可以用 RapidMiner Auto Model 完成。分析和显示数据是其中的一部分。

  41.改变

  通过一系列软件解决方案,Alteryx 提供数据科学和机器学习功能。该自助服务平台拥有 260 多个拖放式构建组件,其中最突出的特点是 Alteryx Designer。Alteryx Designer 可自动执行数据准备、数据混合、报告、预测分析和数据科学。Alteryx 的用户可以轻松地选择和比较各种算法的性能,并立即看到变量关系和分布。该软件可以在托管环境、云中、您自己的防火墙后面或两者中设置,无需任何编码知识。

  42. IBM 沃森工作室

  用户可以使用 IBM Watson Studio 在任何云上大规模创建、运行和管理 AI 模型。该项目是 IBM Cloud Pak for Data 的一个组件,IBM Cloud Pak for Data 是该组织的 AI 和数据核心平台。该解决方案使您能够管理和保护开源笔记本、通过一键集成部署和执行模型、可视化地准备和构建模型、通过可解释的 AI 管理和监控模型以及自动化 AI 生命周期管理。由于软件提供的灵活架构,IBM Watson Studio 的用户可以使用 PyTorch、TensorFlow 和 sci-kit-learn 等开源框架。

  43. 尼姆

  用于数据科学开发的开源平台是 KNIME Analytics。它提供了一个图形化的拖放界面,无需脚本即可构建可视化工作流。为了设计工作流、为分析的每个阶段建模、调节数据流并保证工作是最新的,用户可以从 2000 多个节点中进行选择。为了生成统计数据、清理数据以及提取和选择特征,KNIME 可以组合来自任何来源的数据。该软件使用人工智能和机器学习,使用传统图表和前沿图表可视化数据。

  44. MathWorks 软件

  MathWorks MATLAB 将原生表达矩阵和数组数学的编程语言与针对迭代分析和设计过程优化的桌面环境相结合。为了在可执行笔记本中编写混合代码、输出和格式化文本的脚本,它附带了实时编辑器。专业创建、全面审查和测试的 MATLAB 工具箱。您还可以使用 MATLAB 程序使用您的数据测试各种算法。

  45.TIBCO

  对于现代 BI、描述性和预测性分析、流分析和数据科学,TIBCO 提供了广泛的产品。用户可以使用 TIBCO Data Science 准备数据、构建模型、部署这些模型并监控它们。此外,它还嵌入了 Jupyter 笔记本,用于共享可重复使用的模块、拖放式工作流和 AutoML。用户可以在 TIBCO 的 Spotfire Analytics 上运行工作流程时,使用 TensorFlow、SageMaker、Rekognition 和 Cognitive Services 编排开源。

  46. 螺旋钻

  俄歇。最精确的 AutoML 平台是 AI。通过 Auger 专有的基于贝叶斯优化的算法/超参数组合搜索,可以更快地开发预测模型。得益于开源 A2ML 项目(Auger、Google Cloud AutoML 或 Microsoft Azure AutoML),开发人员可以利用任何基于云的 AutoML 提供商创建预测模型。Auger 的机器学习审查和监控 (MLRAM) 工具可确保在 Auger 或任何其他机器学习平台上开发的训练有素的预测模型的持续准确性。

  47.亚马逊波莉

  它是一种从文本中模拟语音的服务。利用深度学习的力量有助于创建新的语音商品类别,并有助于开发会说话的应用程序。此外,它代表了为残障人士创建包容性应用程序方面的重大进步。

  在其他语言中,Polly 主要支持英语、普通话、巴西葡萄牙语、丹麦语、法语、日语、韩语和丹麦语。

  Polly 的神经文本转语音 (TTS) 支持两种说话时态-

  新闻阅读器风格的新闻叙述用例。

  电话和会话风格等双向应用的理想选择。

  此外,它还提供 Amazon Polly Brand,使企业能够设计自己的声音。

  FICO、今日美国、ProQuest、CBSi、Whooshkaa、MapBox 等公司使用 Amazon Polly Brand。

  48.对话流

  使用 Dialogflow(一个用于创建语言和视觉机器人的平台),可以设计对话用户界面并将其集成到移动应用程序、Web 应用程序和交互式语音响应系统中。该技术可以分析各种输入,包括文本和音频数据。

  下面列出的术语用于 Dialogflow 环境:

  代理:管理与最终用户通信的虚拟代理称为代理。

  意图:最终目标用户的交流反映在他们的意图中。每个代理可能有许多意图,这些意图组合起来形成对话。Dialogflow 意图执行意图分类任务,将最终用户表达与定义的代理的最佳感觉相匹配。

  父意图自动接收上下文,后续意图接收具有相同名称的输入上下文。

  实体:每个意图参数都存在一个名为 Entity 的类型,它提取最终用户表达式。

  上下文:对话流可以由 Dialogflow 中的上下文管理。

  后续意图:后续意图是它所连接的父级意图的子级。建立后续意图时,会自动将具有相同名称的输入上下文添加到父意图,并且将具有相同名称的输出上下文添加到后续意图。

  对话流控制台:用于管理 Dialogflow 代理的基于 Web 的用户界面是 Dialogflow 控制台。

  Dialogflow 的示例用例:

  聊天机器人——可以配置为接收请求、设置约会、访问订单和响应查询的界面。

  物联网 (IoT) —它可用于提高对上下文的理解和 IoT 设备响应的准确性。

  49. 亚马逊识别

  在照片和视频中,Amazon Rekognition 可能有助于识别物体、人物、场景、文本和活动,并标记任何令人反感的内容。此外,它还提供精确的面部分析和搜索功能,以查找、检查和对比面部以进行用户身份验证工作。

  使用 Amazon Rekognition 有几个优势:

  它提供标签来区分自行车、电话、建筑物等物体以及停车场、海滩和城市等风景。

  自定义标签增加了可以检测到的事物的数量。

  内容审查

  文字识别

  人脸识别与评估

  人脸验证和搜索

  Amazon Rekognition 被一些大公司使用,包括 NFL、CBS、国家地理、Marinus Analytics 和 SkyNews。

  50.亚马逊理解

  为了揭示文本中的模式和联系,Amazon Comprehend 使用机器学习进行自然语言处理 (NLP)。

  这些技术利用机器学习来揭示非结构化数据中的模式和联系。该服务识别句子的语言并提取重要的单词、短语、名称、组织或事件。

  为了发现医学问题、药物和药物开发,Amazon Comprehend Medical 经常被用来提取医学语料库信息。

  Amazon Comprehend 的一些用例:

  呼叫中心分析

  索引和搜索产品评论

  网站上的个性化内容

  客户支持工单处理

  临床试验招募

  LexisNexis、TeraDACT、FINRA 和 Vidmob 等公司使用 Amazon Comprehend。

  AutoML 会取代数据科学家吗?

  不,是答案。

  尽管 AutoML 擅长创建模型,但它们仍然无法处理数据科学家的大部分任务。要定义业务关注点,仍然需要数据科学家。为了创建更有用的功能,数据科学家仍然需要运用他们的主题专业知识。如今,autoML 只能处理一小部分问题,例如分类和回归问题。他们目前无法创建推荐和排名模型。最重要的是,单独使用 AutoML 不会从数据中产生有用的见解;仍然需要数据科学家。

  尽管如此,AutoML 仍然是数据科学家为其利益相关者创造价值的有效工具。因此,下一个逻辑查询是:

  我们应该如何以及何时使用 AutoML?

  数据科学家什么时候可以利用 AutoML 平台发挥自己的优势?

  在这里,我想列出一些可能值得的实例。

  性能优先于可解释性:在其他情况下,利益相关者可能只对模型的准确性感兴趣,而可解释性可能不是最重要的因素。根据我们的测试,AutoML 与适当的特征工程相结合时似乎可以产生令人满意的性能。然而,我们案例中的可解释性仅适用于对两个平台都至关重要的功能。换句话说,如果特征重要性足以满足您的情况,AutoML 可能是提高精度的最佳选择。

  快速部署到生产中:您可以使用 Google 和 Azure 轻松地将模型部署到生产中。例如,批量预测和在线预测都可以通过谷歌云轻松访问。您还可以使用他们的 API 将您的模型部署到您的网站。这些特性可以帮助数据科学家更快、更省力地完成工作。

  更好的时间管理:数据科学家面临着无数可能令人筋疲力尽的职责。作为数据科学家,时间可能是您最有限的资源。你的日子充满了与利益相关者(产品经理、业务部门的员工和客户)的几次会议、当前模型的维护、数据的收集和清理、为下次会议做准备等等。AutoML 可以成为一个非常棒的省时工具,因为它只需点击几下并花费几美元来训练一个性能良好的模型。因此,您可以专注于最有益的活动(有时,花时间创建出色的演示文稿比将模型的准确性提高 1% 更有价值)。

  结论

  我希望您通过本文对 AutoML 背后的概念有所了解。AutoML 的主要目标是释放数据科学家的时间,以便他们可以通过自动化重复性任务(如管道创建和超参数调整)来专注于实际业务问题。此外,AutoML 使每个人,而不仅仅是少数人,都能使用机器学习技术。使用 AutoML 构建极其有效的机器学习的数据科学家可以加速 ML 的开发。

  成功或失败将取决于 AutoML 的使用方式以及机器学习领域的发展方式。然而,AutoML 无疑将在机器学习的未来发挥重要作用。

  图片使用申明:原创文章图片源自‘Canva可画’平台免费版权图片素材;引用文章源自引用平台文章中所使用的原图。