论文笔记:Data distribution debugging in machine learning pipeline[VLDB2022]
这篇工作主要是关于在MLpipeline中进行数据分布偏移检测,其中介绍了关于如何从原生python代码编写的pipeline中提取工作流的方法。主要是利用gorilla库,使用python代码可在运行时进行修改的特性,通过monkey patch在原来的pipeline操作算子执行前后加入自定义处理逻辑,从而提取pipeline的工作流。
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 摆烂仙人!