词汇表

最近更新时间: 2019-10-28 07:25:26

名词 解释
实验 为了一个目的而进行数据挖掘任务称为实验,一个实验可以使用多种不同的算法或者同一个算法的不同参数组合来实现。
数据集 数据集是对于数据表的抽象,对应于一个对象存储文件或者数据库的一张数据表,数据挖掘组件提供数据读写SDK对数据集进行读写操作。
SDK 数据挖掘组件提供的软件开发工具,可以用代码来实现数据挖掘多种功能。
模型开发环境 开发模型的编程环境,数据挖掘模块提供Jupyternotebook作为模型开发环境。
模型 数据挖掘算法从训练数据中学习到目标函数。在数据挖掘组件中,模型包含模型序列化文件或模型权重文件、模型类文件、模型报告文件、模型超参数、模型指标及模型校验文件等文件。
推理服务 使用数据挖掘模型对数据样本进行预测的服务,包含实时推理服务和离线推理服务。
镜像 Docker镜像是一个文件,由多个层构成,用于在Docker容器内运行代码。镜像本质上是依赖于宿主机OSkernel,用于构建完整可执行应用的命令。数据挖掘组件中,利用Docker镜像来构建不同的模型开发环境。
资源 资源是指与模型构建相关的资源,包含数据集、Notebook、工作流和推理服务等。
模型类文件 模型类文件即Model.py,用于封装模型文件夹,将模型文件夹发布为实时推理和离线推理。
模型指标 用于评估模型效果的指标,根据模型的任务不同可以用不同的指标对模型进行评估,对于分类任务通常用准确率、召回率、AUC等指标;对于回归任务则会选用R方,RSME作为评估指标。