DevOps(研发运营一体化):是 Development 和 Operations 的组合词,它是一组过程、方法与系统的统称,用于促进开发(应用程序/软件工程)、技术运营和质量保障(QA)部门之间的沟通、协作与整合。研发运营一体化是将应用的需求、开发、测试、部署和运营统一起来,基于整个组织的协作和应用架构的优化,实现敏捷开发、持续交付和应用运营的无缝集成,在保证稳定的同时,快速交付高质量的软件及服务,灵活应对快速变化的业务需求和市场环境。
在上一篇《【AI工程】06-CD4ML-机器学习的持续交付(上)》文中,我们介绍了如何实现机器学习的持续交付。最近阅读了《DevOps for AI – Challenges in Development of AI-enabled Applications》,本篇文章主要介绍了将DevOps和ML工作流结合的解决方案和实践。
近年来,随着AI相关技术快速演进,AI应用也广泛的出现在人们的日常生活中。然而,由于机器学习系统本身的复杂性—ML核心是通过大量训练迭代来找到最佳的预测模型,导致开发包含机器学习组件的软件系统时,开发过程会变得异常复杂。现代软件开发过程中,如DevOps,已经被广泛采用,用于应对频繁的开发迭代和软件变更的持续交付。尽管最新的软件开发技术可以解决构建基于ML的软件系统所面临的一些问题,但目前还没有一个关于如何将它们与ML工作流结合起来的既定流程。在《DevOps for AI – Challenges in Development of AI-enabled Applications》文章中,作者结合工业案例指出了包括ML组件在内的复杂软件系统开发中会面临的挑战,然后讨论了由DevOps和ML工作流流程结合驱动解决挑战的可能解决方案。
概述