DataRobot MLOps电子书背景

MLOps 101:你的AI策略的基础


什么是MLOps?

MLOps的定义 (机器学习操作)包括人的顶点, 流程, 自动化部署的实践和基础技术, 监控, 和管理 机器学习模型 以可伸缩和完全治理的方式投入生产,最终提供来自机器学习的可测量的业务价值. 建立MLOps基础允许数据, 发展, 生产团队协作,利用自动化进行部署, 监控, 并管理组织内的机器学习服务和计划. 

这取决于组织的成熟度级别, 他们的MLOps基础架构可以用一组经过审查和维护的流程这样简单的东西来表示. 例如:

  • 模型是如何创建、培训和批准的
  • 模型存储在哪里
  • 如何部署模型
  • 如何在生产中评估和监控模型
  • 模型如何从生产环境中修正或删除以最小化风险
  • 这些过程如何重复和交织,以实现周期性的机器学习操作过程

一个成熟的 MLOps 基础可以由一个自动化系统来表示,该系统简化了模型的所有生命周期步骤, 从训练和部署, 通过它的生产寿命, 出于合规和风险管理的原因,对其进行退役和储存, 提供整个过程的透明度. 不用说, 上述功能需要与当前所有Ops和云服务和流程完全无缝集成.

遵循 这个链接 要了解更多.

为什么组织需要MLOps基础架构?

许多组织都开始涉足这个领域 机器学习人工智能 (AI). 一些人已经开始收获一些 人工智能的回报 通过提高生产力和收入. 然而, 对于大多数开始转型的组织来说, 结果还有待观察,对于那些已经在进行的人来说, 缩放他们的结果似乎是完全未知的水域.

根据一项 NewVantage 合作伙伴的调查在美国,只有15%的领先企业已经将人工智能能力部署到任何规模的生产中. 这些领先的机构大多在人工智能方面投入了大量资金, 但他们获得切实商业利益的道路是具有挑战性的, 退一步说. 造成这一现象的原因有很多,ob真人游戏发现几乎在所有地方都在重复发生. 

想知道谁需要MLOps,请访问 这个页面.

开发中的团队之间存在着技能、动机和激励方面的差距 机器学习模型 (数据科学家)和这些模型的操作员(DevOps,软件开发人员,IT等).). 这里有太多的问题,这些问题因组织和业务单位而异. 以下是一些例子: 

  • 缺乏可用的数据科学人才意味着当组织找到具有正确经验的人时, 它们允许这些个体在最适合他们的环境中工作, 这就引出了下一个问题.
  • 模型通常使用ds友好的语言和平台创建, 谁是典型的次优或更优, 对行动小组和他们的服务不熟悉, 谁是为常规软件语言和平台而设计的.
  • 运维团队致力于优化云上的运行时环境, 资源管理器, 基于角色的服务, 等. 数据科学团队不仅不知道这些依赖关系需要的任何考虑, 但他们通常完全不理会这些因素,因此他们创建的模型根本没有考虑这些因素.
  • 缺少一个地道的本地人 机器学习模型的治理结构, 与系统, 生命周期, 用户登录, 扼杀了故障排除, 以及法律和监管报告.
  • 没有正确地监控他们的模型的组织最终会引入可能会对他们的组织造成巨大风险的产品模型,因为它没有反映 数据中不断变化的模式, 用户/消费者行为, 还有很多其他的问题可能会影响模型的准确性当它们发生的时候不会改变.
  • 许多操作专业人员没有意识到机器学习的独特特性和敏感性, 他们的角色主要是管理关键的生产环境, 对将机器学习应用到生产中可能会对他们的工作产生的影响非常警惕和关心. 缺乏相关的ML管理工具和过程只会增加ML采用的风险. 这些合情合理的担忧只是造成进展和部署严重延误的微不足道的原因. 数据科学家不熟悉生产级代码的原则, 所以当最终出了问题时,他们花时间照顾他们的模特.

MLOps 允许组织减轻这些和许多其他问题 通过自动化和可扩展性提供管理机器学习生命周期的技术支柱. 它提供了负责生成模型的数据团队与传统上管理在生产环境上运行的服务的团队之间的无缝协作, 因此 简化实现战略目标的路径 组织想要通过人工智能实现的目标. 

MLOps的支柱

任何能够灵活处理复杂情况的MLOps解决方案都必须精通以下四个关键领域,才能安全地在大规模生产中交付机器学习应用:

没有这些柱子, 没有任何MLOps系统能够保持最大影响所需的复杂程度. 这四个关键领域的缺失将导致更多的手工过程, 人为误差空间, 甚至是程序盲点, 关键问题可能几天甚至几个月都没有被发现, 放大企业和经营风险. 让ob真人游戏仔细看看这些支柱.

什么是模型部署?

所面临的挑战 

机器学习模型的渊源可以追溯到无数的机器学习平台和各种编程语言, 它的创建者通常不知道实际的生产环境及其任务关键的考虑. 当组织试图在适合正常软件应用程序的环境中实现它们时, 手动集成会产生摩擦, 以至于这个模型无法在不破坏稳定的情况下部署 生产环境. 作为一个结果, 组织失去了扩展该活动的选择, 以及收益和损失成本的节省.

解决方案 

通过简化建模和生产部署之间的流程,MLOps简化了模型部署. 模型建立在哪个平台或语言的基础上并不重要. 企业级MLOps系统应该允许组织插入他们的模型并生成一致的结果 API 对另一端的应用程序团队的访问, 无论部署环境和云服务和提供商的选择.  

探索生产模型部署的最佳实践

什么是模型监控?

所面临的挑战 

随着时间的推移,机器学习模型退化或其他性能相关问题的原因有很多. 例如,您可以使用客户数据对数据集进行实时预测,但是 顾客的行为模式可能发生了变化,因为经济危机、市场波动、自然灾害,或者只是天气. 这些模型的性能将不会有用,甚至可能对您的业务有害. 用不能代表当前现实的旧数据训练出来的模型不仅不准确,而且不相关. 根本问题在于,你不知道或无法判断这种情况何时会发生. 没有专门为机器学习设计的生产监控, 你可能会因为不知道完全不相关的预测而使你的业务面临一连串的风险.

解决方案 

MLOps 允许生产和人工智能团队以特定于机器学习的方式监控模型. 一个健壮的监控基础设施应该能够主动监控 数据漂移,特征重要性,以及 模型的准确性 问题. 高级功能可能包括构建的特性 增加对模型的信任 在生产过程中. 例如,原理 谦逊在人工智能 规定了模型不仅应该能够在预测可能出现问题时提供信息, 但当他们对自己预测的质量不自信的时候.

学习生产模型监视中的一些最佳实践

什么是模型生命周期管理?

所面临的挑战 

随着组织建立起强大的机器学习计划, 实际生产的车型数量可能会呈指数增长, 使管理这些模型及其生命周期成为一项繁琐的任务. 大量的时间花费在手动尝试使这个过程变得有序上,这可能包括所有与确保任何模型必须经历的阶段都是流线型相关的事情, 通过灵活的工作流程批准, 并且尽可能的自动化. 一些例子:

  • 冠军/挑战者模型 限制:现在引入任何新模型(又名“挑战者”)的最佳实践是,首先在生产中运行它,并在确定的时间框架内相对于它的前身(又名“冠军”)衡量它的性能, 为了确定新模式是否值得通过超越它而成为新的“冠军”. 而这一过程确保了不断提高的质量水平和持续改进的预测和模型的稳定性, 重要的是这个过程要完全自动化.
  • 故障排除和分类:在没有分类能力的情况下,仅仅监测模型是不够的, 进行故障排除, 并纠正可疑或表现不佳的模型.
  • 模型批准:一个正式的过程,旨在将与部署模型相关的风险降到最低, 确保所有相关的业务或技术涉众已经签署了模型.
  • 生产中的模型更新:在不干扰生产工作流的情况下交换模型的能力是业务连续性的关键.

解决方案 

MLOps 允许生产模型生命周期管理系统自动化过程, 比如冠军/挑战者门控, 故障排除和诊断, 热交换模型批准, 并且提供了一个安全的工作流,以确保在扩展时对模型的生命周期进行有效的管理.

发现模型生命周期管理的力量

什么是生产模式治理?

所面临的挑战 

将机器学习模型投入生产的组织正在处理监管问题, 合规, 企业风险雷区, 尤其是在CCPA这样的法规出台之后, 欧盟/英国GDPR, 和其他人. 对于在全球范围内运作的组织来说,这个问题变得尤为重要, 规则和法律的迷宫变得几乎无法驾驭. 在这些情况下,组织需要保持完整 模型 沿袭跟踪(批准、模型交互、部署的版本、更新,等等.),这实际上是不可能手工完成的.

解决方案 

MLOps 提供企业级的生产模型治理解决方案,它可以交付:

  • 模型版本控制
  • 自动文档
  • 所有生产模型的完整和可搜索沿袭跟踪和审计跟踪 

这使得公司可以将公司和法律风险降到最低, 保持透明的生产模式管理管道, 最小化甚至消除模型偏差, 并带来许多其他好处.

了解如何在生产中确保模型的可重复过程

数据科学的MLOps 领导人 和数据科学家

从事机器学习和AI项目的数据科学家和数据科学团队可以极大地受益于MLOps. 一方面, 这个解决方案将使他们日常生活的许多部分自动化, 另一方面, 它将帮助数据科学家有效地与Ops同行合作, 减轻了日常模型管理的负担.

MLOps允许数据科学家专注于重要的事情——发现需要处理的新用例, 致力于功能发现, 建立更深入的业务专长. 数据科学家不应该浪费时间来维护模型或手动检查它们的性能. 不再需要手动测试、监视和验证. 

发现MLOps的优点 数据科学领袖练习数据科学家.

商业领袖学习班高管

有了MLOps功能, 组织可以开始关注真正重要的事情, 在整个组织中扩展AI能力, 同时跟踪对每个团队和部门重要的kpi. 

商业领袖们现在都在寻求保证,他们的预测是快速的, 准确的, 最重要的是能够公正和可信. 确保他们根据收到的预测做出决定是至关重要的, 因为能够让公司进行更深入、更有意义的分析意味着更好的业务结果. 然而,在实现具有ROI的AI的道路上还存在许多障碍. 达到节约的目的, 组织和竞争利益, 以及AI项目的可衡量ROI, 公司需要具备MLOps能力,以大规模运作AI和机器学习.

发现MLOps的所有优点 行业领袖 高管.

软件开发人员的MLOps

在很多情况下, 试图让机器学习模型在应用程序或服务中工作变成了无尽的ETL噩梦. 一个健壮的MLOps系统通过提供一个简单的部署和版本控制系统为开发人员简化了这个过程, 背靠清晰、易于管理 API

Developer-foc使用 MLOps 这些系统的特点包括但不限于:

  • 简单明了 API (休息)
  • 开发人员对机器学习操作的支持(文档,示例等.)
  • 所有产品模型的版本控制和沿袭
  • 便携式Docker图像等

IT运营团队的MLOps

MLOps的精确构建是为了让IT团队完全控制生产模型, 确保任何模型都可以在点击操作中轻松部署, 无论是起源还是编程语言. 它被设计成看起来和感觉起来像熟悉的It解决方案, 并与领先的IT管理解决方案无缝集成. 消除IT和AI团队之间的摩擦和脱节.  

MLOps可以通过以下方式让IT团队有机会在生产中拥有AI的所有权:

  • 警报和连接到服务,IT管理系统和票务系统
  • 回购集成
  • 改变审批工作流 
  • 无缝模型更新的推出 
  • 健壮的访问控制管理(LDAP、RBAC等).),更

要了解更多关于IT运营团队的MLOps,请访问 这个页面.

面向DevOps和数据工程师的MLOps

MLOps允许DevOps和数据工程团队集中管理实际的机器学习模型层, 处理从测试和验证到更新和性能指标的所有事情, 在一个地方. 这使得您的业务能够无缝地扩展内部部署和监控功能,并随着时间的推移监控服务健康状况,以满足延迟,从而从AI产生更多的价值, 吞吐量, 和可靠性sla. 

DevOps团队和数据工程师的MLOps应该包括多种功能:

  • 没有代码预测GUI
  • 异常、性能和偏差警告
  • 访问和优化 API
  • 可切换的模型与自动选门,保证平稳过渡和100%的正常运行时间

风险和合规团队的MLOps

MLOps基础设施允许风险和合规团队简化他们的内部流程,并提高复杂机器学习项目的监督质量. 成熟的MLOps解决方案应该支持各种特性, 比如可定制的治理工作流策略, 审批流程和警报, 立即提高对这些问题的认识,并确保所有血统被跟踪,随时可以找到. 

这也是概念 谦逊在人工智能 再次发挥作用. 一个可以通过预测自我诊断问题并通知相关风险管理利益相关者的系统,允许企业对生产中的机器学习项目进行更严格的控制. 风险和法规遵循团队应该注意的其他关键MLOps元素是内置的 预测的解释 功能、长期预测分析和审计日志.

要了解更多关于风险和合规团队的MLOps,请访问 这个页面.

人工智能和卓越机器学习中心的MLOps 

建立一个协调, 战略一致, 可扩展的AI和机器学习驱动的操作是困难的. 从处理组织孤岛到对抗公司的技术核心和“做事的一贯方式”,“这是一项艰巨的任务. MLOps允许AI和运维团队以高效和价值驱动的方式嵌入前沿预测模型. 

  • 在单个MLOps解决方案中使用任何平台和任何语言创建的不同类型的模型进行工作和实验. 
  • 在你已经拥有的基础上使用和建设, 不管运行时环境如何, 适用于前提或多云场景. 
  • 部署可靠、可信和公正的模型.

要了解更多关于AI和卓越机器学习中心的MLOps,请访问 这个页面.

DataRobot MLOps

DataRobot MLOps 允许组织部署, 管理, 监控, 并从一个地方控制他们的机器学习模型, 授权不同的涉众围绕在生产中伸缩和管理可信ML模型的共同目标进行无缝协作. 作为一个不知道起源和目的地的平台, 无论在什么环境或语言中开发MLOps,都可以使用模型, 或者它们将被部署在哪里. 该平台包括专有的模型健康监测,并通过自动挑战者模型不断学习来适应不断变化的条件,挑战者模型旨在测试生产中现有模型的有效性, 并根据需要自动生成新的挑战者型号.

DataRobot确保所有集中的生产机器学习过程在一个健壮的治理框架下跨组织工作, 利用并与您已经拥有的其他团队共享生产管理的负载. 

在任何地方构建和运行您的模型

ob真人游戏的MLOps功能可以将几乎任何模型部署到几乎任何生产环境中. 这可以是任何云、预制或混合环境. 最重要的是, datarrobot的监控功能可以确保您已经部署的生产模型将实时性能更新传输到一个单一的集中式机器学习操作系统. 

MLOps监控代理 - MLOps独特地应用了DevOps世界中熟悉的代理概念,在首选的基础设施中运行你的模型,同时在一个单一的玻璃面板中集中监控所有模型.

中央和可扩展的ML监控系统 -专门为此类场景建立的专有监控, 提供对数百种模型性能的即时可见性, 部署在任何地方,并由组织中的任何人构建.

灵活的部署模型 -在任何开源语言或库中轻松部署模型,并公开产品质量的模型 休息 支持实时或批量预测的API.

自动化模型运行状况监视和生命周期管理

内置数据科学专长 -完全产品化的机构设计,表面漂移的数据,准确性和偏差.

连续模型比赛 -通过冠军/挑战者过程自动进入新模型.

生产诊断 —随时间推移监视服务运行状况,以满足延迟、吞吐量和可靠性sla.

嵌入式治理、谦逊和公平

谦逊可信的AI -通过比较不同行业可配置的道德准则的模型预测和准确性,确保你的AI的道德使用.

审批工作流模型 -用较少繁琐的手工工作维护对模型更新的全面审查, 使用可定制的、受治理的评审周期和批准工作流.

ML审计跟踪和日志记录 —为了符合法规要求, MLOps跟踪并保存预测活动和任何模型更新的完整沿袭,以便您始终知道创建了什么模型, 使用, 更新的时候, 以及由谁.

面向未来的AI项目

MLOps教育

datarrobot大学允许任何人学习更多关于MLOps的基本概念, 以及深入研究DataRobot的MLOps,以及它如何让企业扩展他们的人工智能和机器学习工作. 你可以选择免费的和付费的 MLOps课程 现在.

访问 这个页面 通过访问ob真人游戏的课程、学习会议和资源来开始掌握MLOps.