pytorch如何实现加载语音类的数据集?很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。
pytorch对一下常用的公开数据集有很方便的API接口,但是当我们需要使用自己的数据集训练神经网络时,就需要自定义数据集,在pytorch中,提供了一些类,方便我们定义自己的数据集合
第一步
自定义的 Dataset 都需要继承 torch.utils.data.Dataset 类,并且重写它的两个成员方法:
from torch.utils.data import Dataset class AudioDataset(Dataset): def __init__(self, ...): """类的初始化""" pass def __getitem__(self, item): """每次怎么读数据,返回数据和标签""" return data, label def __len__(self): """返回整个数据集的长度""" return total