Rocaloid

项目历史


 起点

  Rocaloid的开发始于2011年4月,那时作者@Sleepwalking还是个中二的初中生。正如它的名字,Rocaloid最初的设计目的是让基于Vocaloid歌声合成软件的虚拟歌手初音未来唱出中文歌。

  这里不会描述具体的实现方式。总之,从一开始Rocaloid就是个艰巨甚至有些不现实的任务。也许当时作者自己也把它当作一张空头支票了。作者当时只是略懂编程,从未接触过信号处理,仅凭摸索写出了一个基于拼接的语音合成引擎,名曰CVE(CyberVoice Engine)

  作者是个学生,迫于学业压力,花了一年才断断续续地完成初音的中文音源库。待万事俱备,已至2012年8月。


 九月

  2012年的9月凝聚了许多欢乐和痛苦。月初,Rocaloid初代首次成功合成一曲《夕日坂》,然而效果不堪入耳。作者用尽浑身解数,七次重制此曲并改进合成软件。无奈作者水平有限,十月初,希望耗尽,将初代最终版本发布于iVocaloid


 涅磐

  两个月后,作者重新分析了初代的失败,决定开发第二代Rocaloid,取名Rocaloid Renaissance,即“复兴”、“重生”之意。

  •  2012年12月,重写CVE。
  •  2013年1月,开始构建第二代初音中文音源库。
  •  2013年3月,第二次重写CVE。
  •  2013年4月,编写发音参数转换器。
  •  2013年5月,第二代音源库初步完成。

  Rocaloid Renaissance的表现相比初代虽有显著提高,可仍不算自然。五月底,希望再次耗尽。作者为寻求帮助,将Rocaloid开源于Github,望高人能够指点二三。


 复出

  虽然6月初在b站的投稿迎来了不少点击,Github上我们的代码仓库还是冷冷清清。七月初,作者和@万致远把Rocaloid用C++重写了一遍,但是这个版本马上就被废弃掉了。

  作者认识到自身知识的不足,整个七月都在自学信号处理。理解能力有限,只习得一点皮毛,倒是开拓了眼界,便有了开发下一代——Rocaloid3的打算。暑假里又经过一些摸索,设计出一个新的算法。作者还考虑了使用初音作音库的版权问题,并发现至此Rocaloid已不必拘泥于特定音库的合成。于是Rocaloid项目的目标转为通用的跨语言歌声合成

  暑假里作者写了一个简陋的音频信号处理库,九月初完成Rocaloid3的设计并开始编写。不久后@Tuxzz加入开发,我们也算有了个开发组。12月,新合成引擎CVE3完成,同时Rocaloid的第一个自己的音源库也录制完成了,在此感谢@二言的耐心配合和@AKI的指导工作。


 新起点

  CVE3完成后,我们结合新音源库对其进行了一系列测试。

每次重写Rocaloid,我们都抱着“至少不会比上个版本差”的期望。

  CVE3的发挥很不稳定,某些词句的发音较上一代进步了很多;另一些词句则发挥逊色,甚至不及上一代。

  经过讨论后,我们决定放弃CVE3的开发,编写新的引擎CVE3.5,并对整个项目进行重构。

  我们认识到,Rocaloid是个长期的项目。要早日实现她,需要汇聚更多的力量。