开源特征商店Feathr项目正式推出,添加沙盒环境供用户简单上手

开源一年多,经过众多企业的贡献,LFAI与资料基金会旗下的开源特征商店Feathr项目终于达到1.0版本,最新的正式版本有几项新功能,包括线上转换、快速沙盒环境等,目标是要加速企业级机器学习项目的开发和部署。

Feathr为企业级特征商店,由LinkedIn在2017年开发,并2022年的时候和微软共同开源,Feathr主要的功能是供开发者利用Python形式的的API,定义原始资料的特征,并在模型训练和推理工作流程中,按名称注册和取用特征,通过Feathr企业能够方便地在不同的团队间共享特征。

由于准备和管理特征,是开发大规模机器学习应用程序,极度耗耗时间的工作之一,而Feathr提供一个抽象层,供开发者方便地按名称计算和访问特征,使得特征生产者和消费者都可以通过Feathr交易特征,生产者定义并注册特征,让消费者访问和导入特征至机器学习工作流程中。

Feathr正式版中提供了特征即时转换支持,官方提到,在许多机器学习场景中,训练和推理都需要产生特征,但是Feathr却有着数据源无法来自于线上服务的限制。

由于特征转换只能发生在特征资料发布到线上商店之前,因此当要求转换速度接近即时,便需要创建一个机制,供用户能够在模型进行推理之前,动态地对推理资料进行转换,而Feathr新的特定领域语言(Domain Specific Language,DSL)线上转换功能,使用自定义转换引擎解决这样的问题,该引擎能够以接近即时的速度,处理特征转换请求并且提供回应。

另外,Feathr还加入功能齐全的沙盒环境,能够快速启动Feathr环境,供用户快速对Feathr各种功能进行原型设计,让没有基础设施背景知识的数据科学家,也能够快速上手Feathr,实验特征定义和想法。该沙盒带有Jupyter笔记本,供用户能够简单地操作Feathr平台。