相关特性

最近更新时间: 2019-11-26 15:30:16

数据集管理：异构数据管理，可以将外部的异构数据源添加为抽象的数据集，并且提供统一的程序接口SDK对异构数据进行读写，用于数据挖掘任务和离线推理任务。
模型开发：提供可视化建模和Jupyter notebook两种方式进行模型开发，支持主流数据挖掘框架，sklearn、lightGBM、XGBoost、Spark MLlib，以及主流的数据挖掘算法，SVM、逻辑回归、线性回归、决策树、随机森林、协同过滤满足多种数据挖掘需求。
模型管理：通过平台训练的模型可以自动进行模型管理，用户可以对相同实验下的模型进行对比，并把任意模型发布为实时推理服务和离线推理服务。模型信息包括：模型序列化文件、模型封装程序（Model.py）、模型训练脚本（Train.py）、模型的超参数信息、模型的指标以及模型校验信息等。
推理服务：平台的管理的模型可以通过推理服务，发布为对外的推理服务，包含实时在线推理和离线推理服务。实时推理服务支持自动扩缩容，通过水平扩展支持高并发实时访问。离线推理服务支持TB级数据的离线推理，在集群场景下，Spark框架会进行数据的水平的拆分和合并，在单机场景下，平台会实现数据拆分和合并，用户无需在封装脚本中进行处理。