LALAL.AI有一个新的仙后座算法,会让您大吃一惊

很难在没有实际词干的情况下分离歌曲的不同部分,但是有一个名为LALAL.AI的工具可以很好地处理整个过程。它以最小的努力将声音在人声和器乐之间进行分割,而无需音频工程技能。

尽管LALAL.AI已经非常强大,但由于引入了称为仙后座的新神经网络体系结构,它最近迈出了一大步。它采用了服务的上一代神经网络Rocknet,并在几乎所有方面都使其变得更好。

LALAL.AI的仙后座带来了什么?

简单地说:仙后座可显着减少音频伪影,从而改善分割效果。 LALAL.AI的全部目的是将声乐和乐器从轨道中拉出并分离开,因此具有可以提高能力的功能真是太棒了。

使用新的神经网络,LALAL.AI将花费更长的时间来生成分割轨道,但这对于质量的大幅提高而言是一个小的折衷。

那有什么不同呢?基本上,仍可在LALAL.AI上使用的Rocknet仅考虑幅度分量,而忽略了相位分量。较新的仙后座神经网络会考虑输入信号的相位分量,并为输出信号生成相位。通过此过程,分割的音轨将包含较少的音频伪像。

简而言之,新算法对歌曲进行了更深入的分析,以创建更好的分割效果。

为了证明其服务更有效,LALAL.AI对Spleeter,OpenUnmix和Extended Unmix进行了测试。它还将结果与自己的Rocknet神经网络进行了比较。您可以在LALAL.AI的博客上查看测试的全部结果,但基本上,仙后座在各种随机选择的流派(例如爵士乐,软摇滚,流行音乐等)中的大多数类别中均胜过所有其他类别。

有趣的是,Rocknet在人声通道上的表现仍然更好。仙后座从乐器到人声的渗透程度略高。但是,LALAL.AI指出数字并不能总说明问题,有时声音质量实际上可能与测试显示的有所不同。

这是该公司在此事上所说的话:

尽管就声音的形式指标而言,仙后座落后于Rocknet,但无论是乐器部分,还是特别是被仙后座分离的声音茎,听起来都比Rocknet更自然,更柔和,而没有其他解决方案所特有的金属声音的人工制品。

我为自己测试了结果,但确实发现仙后座神经网络确实可以产生更清晰的音频分割。声乐几乎没有从乐器中渗入,这正是您想要从LALAL.AI之类的工具中获得的

话虽如此,Rocknet的效果仍然相当不错,并且绝对可用于将人声与乐器分离。

您如何尝试LALAL.AI的新仙后座功能?

如果您想尝试一下新的神经网络,可以转到LALAL.AI并确保在上载歌曲时,在屏幕底部附近选中了“使用新算法”框。

您也可以选择算法用于分割轨道的攻击程度。 “正常”对大多数曲目都有益,但是您可以尝试“轻微”和“激进”,看看是什么为您创建了更好的曲目。