杜丫丫学英语为您分享以下优质知识
其实只要知道这些数据的相关文件,就可以替换成自己的数据了。
最大的问题是,这些数据分别是用来做什么的。
SWB系列都是用来训练UBM/i-vector extractor的
SRE是in-domain data,用来训练LDA/PLDA
剩下的,比如sre10里头用的是2010年SRE的evalution dataset,用于train speaker model和test
跑声纹sre的例子,除了spk2utt,utt2spk这些常规的文件外,还涉及到trials文件,这个是声纹识别(说话人识别)特有的,简单来说,就是告诉系统,哪段语音是说话人X说的,哪段语音不是。
先写这么多,具体的可以私信。