怎样区分MP3文件中存储的内容?例如,区分歌曲和一般录音。
首先,实在不知到应该把这个话题放在那个区域。先道歉了。
假设MP3文件内容可能是的歌曲(song),也有可能是一般的录音(voice).
这两种不同的内容都用MP3格式存储。
想问一下,怎样才能把这两种不同的内容区分开来?突破点在哪里?!
有这方面信息或者知识的朋友,希望能给点建议。
------解决方案--------------------做一次FFT,看频段,人声集中在100Hz~1000Hz之间,音乐就要分散得多。
设定一个阀值,看100Hz~1000Hz之间的比率,超过某个值就判定为人声,否则就判定为音乐。至于这个值是多少才合适,就要做实验了
------解决方案--------------------找到人声的特征值,然后分析,符合的都是人发出的声音。当然,歌曲和对话的区分,没见过这方面的资料,不知道怎么玩。。。。。。