吴恩达的二八定律:80%的数据+20%的模型=更好的机器学习
MLOps是什么?
MLOps的最重要任务是提供高质量数据。 标签的一致性也很重要。检验标签是否有自己所管辖的明确界限,即使标签的定义是好的,缺乏一致性也会导致模型效果不佳。 系统地改善baseline模型上的数据质量要比追求具有低质量数据的最新模型要好。 如果训练期间出现错误,那么应当采取以数据为中心的方法。 如果以数据为中心,对于较小的数据集(<10,000个样本),则数据容量上存在很大的改进空间。 当使用较小的数据集时,提高数据质量的工具和服务至关重要。
往期精彩:
求个在看
评论