论文笔记:Exploration of Approaches for In-Database ML[EDBT2023]
这篇工作主要是关于探索在数据库中执行机器学习预测模型的方法,作者提出了两种思路,一种是将模型的预测执行转化为SQL语句,把模型的参数存到模型表中,将模型预测操作转化为事实表和模型表的嵌套查询,从而而将线性代数操作转化为关系代数操作,但是这种方案执行效率较低。然后作者又利用并行模型构建,向量化执行,列存储等技术在数据库中实现了一个专用的模型推理算子。此外作者对目前已有的相关工作进行梳理,将在数据库中执行机器学习预测模型的方法分为四类,即python udf,机器学习系统提供的的原生api,转化为sql语句,数据库内部实现模型预测操作算子。
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 摆烂仙人!