相关特性

最近更新时间: 2019-11-26 15:30:16

  • 数据集管理:异构数据管理,可以将外部的异构数据源添加为抽象的数据集,并且提供统一的程序接口SDK对异构数据进行读写,用于数据挖掘任务和离线推理任务。

  • 模型开发:提供可视化建模和Jupyter notebook两种方式进行模型开发,支持主流数据挖掘框架,sklearn、lightGBM、XGBoost、Spark MLlib,以及主流的数据挖掘算法,SVM、逻辑回归、线性回归、决策树、随机森林、协同过滤满足多种数据挖掘需求。

  • 模型管理:通过平台训练的模型可以自动进行模型管理,用户可以对相同实验下的模型进行对比,并把任意模型发布为实时推理服务和离线推理服务。模型信息包括:模型序列化文件、模型封装程序(Model.py)、模型训练脚本(Train.py)、模型的超参数信息、模型的指标以及模型校验信息等。

  • 推理服务:平台的管理的模型可以通过推理服务,发布为对外的推理服务,包含实时在线推理和离线推理服务。实时推理服务支持自动扩缩容,通过水平扩展支持高并发实时访问。离线推理服务支持TB级数据的离线推理,在集群场景下,Spark框架会进行数据的水平的拆分和合并,在单机场景下,平台会实现数据拆分和合并,用户无需在封装脚本中进行处理。