利用客户端终端机的音乐内容制作系统的制作方法

xiaoxiao2020-7-22 62

利用客户端终端机的音乐内容制作系统的制作方法
【专利摘要】本发明涉及利用客户端终端机的音乐内容制作系统，尤其涉及一种利用电脑语音合成技术生成音乐元音内容的技术，以在线状态或在云电脑、嵌入式（Embedded）终端机等客户端终端机上，输入任意歌词和音阶、音长、唱法等多种音乐信息时，把显示音阶相应韵律的声音，按相应音长发声，合成相应声音，传达到客户端终端机的利用客户端终端机的音乐内容制作系统。
【专利说明】利用客户端终端机的音乐内容制作系统
【技术领域】
[0001]本发明涉及利用客户端终端机的音乐内容制作系统，尤其涉及一种利用电脑语音合成技术生成音乐元音内容的技术，以在线状态或在云电脑、嵌入式(Embedded)终端机等客户端终端机上，输入任意歌词和音阶、音长、唱法等多种音乐信息时，把显示音阶相应韵律的声音，按相应音长发声，合成相应声音，传达到客户端终端机的利用客户端终端机的音乐内容制作系统。
【背景技术】
[0002]现有的语音合成技术只是以输入的文本文字简单地输出相应语音，提供ARS(自动应答服务)、语音向导、导航语音向导等单纯信息传达功能。
[0003]因此，要求一种文字语音合成技术，模仿人类所有类型嗓音，适用于歌曲、作曲、配音、智能机器人等服务。
[0004]而现有音乐用语音合成技术用于PC环境时，其歌词编辑与语音合成等生成音乐的一系列过程全部进行在一个系统。
[0005]但手机或智能手机环境，在线及云电脑环境下，由于CPU性能的限制、内存的限制，很难迅速处理语音合成所需大容量DB，多址连接时，性能只能受影响。
[0006]为了解决这些问题，本发明提供一种具有客户端-服务器结构的音乐语音合成系统。

【发明内容】

[0007]发明的课题
[0008]本发明是为了解决上述问题而提出的发明，其目的在于在在线、手机、PDA、智能手机等多种嵌入式终端机客户端环境下，利用歌词文字语音合成(TTS:text to speech)，按任意歌词和音阶、音长，输出合成歌曲，或者合成相应于背景音乐和歌词的歌曲，向客户端环境传送。
[0009]本发明的另一目的在于提供一种音乐语音合成方法，加工任意歌词、音阶、音乐效果、背景音乐、拍子/节奏等音乐所必须的因素，制作成数码内容形式，按各种语言特征，对相应于歌词的文本进行分析，合成歌词和音乐，表现各种音乐效果。
[0010]本发明的另一目的在于独立构成语音合成传送服务器，通过语音合成服务器，迅速生成音乐语音合成信息,并把合成信息传达到客户端终端机,解决性能下降的问题。
[0011]实施方案
[0012]本发明提供一种利用客户端终端机的音乐内容制作系统，其包括编辑歌词及音源，播放与钢琴键位置对应的音，编辑元音效果(effect)或把相当于元音的歌手音源及声道(track)编辑成音乐信息，发送到语音合成服务器，播放由语音合成服务器加工的音乐的客户端终端机；获得所述客户端终端机发送的音乐信息，提取与歌词相应的音源，进行合成及加工的语音合成服务器；把所述语音合成服务器生成的音乐发送到客户端终端机的语音合成传送服务器。
[0013]发明效果
[0014]本发明的有益效果是该利用客户端终端机的音乐内容制作系统可让任何人通过移动环境轻松编辑音乐内容，获得根据此合成的音乐语音，可通过在线、离线状态流通由个人创作的内容，可通过手机李勇铃声、彩铃等音乐内容应用补充服务，可用于各种形式便携设备的音乐播放、语音向导，可让ARS (自动应答系统)、导航(地图引导装置)以类似真人声音的语气提供语音服务，能让人工智能机器人装置说话语气及唱歌生硬更接近真人。
[0015]另外，在制作电视剧、动画片领域，可代替配音演员，配音更加自然，更加接近真人。
[0016]由于单独构成语音合成传送服务器，可迅速把语音合成服务器合成的音乐合成信息传达到客户端终端机，解决性能下降的问题，可为多个客户同时提供音源服务。
【专利附图】

【附图说明】
[0017]图1为本发明一实施例的利用客户端终端机的音乐内容制作系统整体结构图。
[0018]图2为本发明一实施例的利用客户端终端机的首乐内各制作系统客户端终端机框图。
[0019]图3为本发明一实施例的利用客户端终端机的音乐内容制作系统语音合成服务器框图。
[0020]图4为本发明一实施例的利用客户端终端机的音乐内容制作系统语音合成传送服务器框图。
[0021]图5为本发明一实施例的利用客户端终端机的音乐内容制作系统客户端终端机输出的制作程序画面。
[0022]符号说明
[0023]100:语音合成服务器
[0024]200:客户端终端机
[0025]300:语音合成传送服务器。
【具体实施方式】
[0026]本发明涉及一种利用客户端终端机的音乐内容制作系统，其特征在于:包括编辑歌词及音源，播放与钢琴键位置对应的音，编辑元音效果(effect)或把相当于元音的歌手音源及声道(track)编辑成音乐信息，发送到语音合成服务器，播放由语音合成服务器加工的音乐的客户端终端机；获得所述客户端终端机发送的音乐信息，提取与歌词相应的音源，进行合成及加工的语音合成服务器；把所述语音合成服务器生成的音乐发送到客户端终端机的语音合成传送服务器。
[0027]所述客户端终端机包括编辑歌词的歌词编辑部；编辑音源的音源编辑部；编辑元音效果的元音效果编辑部；选择相当于元音的歌手音源，编辑各种声道的歌手及声道编辑部；从语音合成传送服务器接收由语音合成服务器合成的信号，进行播放的播放部。
[0028]作为另一结构，所述客户端终端机包括编辑歌词的歌词编辑部；编辑音源的音源编辑部；播放与钢琴键位置相应的声音的虚拟钢琴乐器部；编辑元音效果的元音效果编辑部；选择相当于元音的歌手音源，编辑各种声道的歌手及声道编辑部；从语音合成传送服务器接收由语音合成服务器合成的信号，进行播放的播放部。
[0029]所述语音合成服务器包括获取由客户端终端机传送的歌词、歌手、声道、音阶、音长、拍子、节奏、音乐效果的音乐信息获得部；分析由上述音乐信息获得部获得的歌词文章，根据语言特征，转换成所定义的形式的文句分析部；把由上述文句分析部分析的数据，转换成音素基础的发音转换部；对由所述文句分析部及发音转换部分析出的相当于歌词的最优音素，按提前定义的规则，选择最优音素的最优音素选择部；从所述音乐信息获得部获取歌手信息，根据该信息，从音源数据库选择即符合由所述最优音素选择部选择的因素，又符合所述歌手信息的音源的音源选择部；根据歌词文章特征，获得由所述最优音素选择部选择的因素，连接各最优音素，对此进行合成时，控制长度和音高(pitch)的韵律控制部；获得由所述韵律控制部合成的歌词文章，根据通过所述音乐信息获得部获得的音阶、音长、拍子、节奏，调配所获得的歌词文章的语音转换部；获得由所述语音转换部转换的语音，根据通过所述音乐信息获得部获得的音乐效果，为所述已转换的语音调配音色的音色转换部；对通过所述音乐信息获得部获得的背景音乐信息与通过所述音色转换部转换的音色，进行合成的歌曲及背景音乐合成部。
[0030]所述音乐信息获得部包括获得歌词信息的歌词信息获得部；从存储于音源数据库的背景音乐音源中，获得所选背景音乐音源信息的背景音乐信息获得部；获得由使用者调节的元音效果信息的元音效果获得部；获得歌手信息的歌手信息获得部。
[0031]另外还包括获得由使用者通过从虚拟钢琴乐器选择的钢琴键位置信息的钢琴键位置获得部。
[0032]所述语音合成传送服务器包括把多台客户端终端机音乐合成请求，按依次或并列方式进行管理，以此让多台客户端终端机同时连接语音合成服务器，发出语音合成请求的客户端多址连接管理部；为了在有限的网络环境中有效传送音乐数据，对音乐数据进行压缩的音乐数据压缩处理部；根据客户端终端机音乐合成请求，把合成的音乐信息传送给客户端终端机的音乐数据传送部；为了给移动通信公司铃声服务、彩铃服务提供语音合成基础音乐内容，向外部系统传送该音乐内容的附加服务界面处理部。
[0033]在此，对本发明利用客户端终端机的音乐内容制作系统，通过实施例进行详细说明。
[0034]图1为本发明一实施例的利用客户端终端机的音乐内容制作系统整体结构图。
[0035]如图1所示，本发明利用客户端终端机的音乐内容制作系统整体上包括客户端终端机，语音合成服务器，语音合成传送服务器及把这些连接的网络。
[0036]客户端终端机编辑歌词及音源，播放与钢琴键位置对应的音，编辑元音效果(effect)或把相当于元音的歌手音源及声道(track)编辑成音乐信息，发送到语音合成服务器，播放由语音合成服务器加工的音乐。语音合成服务器获得所述客户端终端机发送的音乐信息，提取与歌词相应的音源，进行合成及加工。语音合成传送服务器把所述语音合成服务器生成的音乐发送到客户端终端机。
[0037]图2为本发明一实施例的利用客户端终端机的音乐内容制作系统客户端终端机框图。
[0038]如图2所示，所述客户端终端机200包括编辑歌词的歌词编辑部210 ;编辑音源的音源编辑部220 ;编辑元音效果的元音效果编辑部240 ;选择相当于元音的歌手音源，编辑各种声道的歌手及声道编辑部250 ;从语音合成传送服务器接收由语音合成服务器合成的信号，进行播放的播放部260。
[0039]另外，根据需要还可以额外包括播放与钢琴键位置相应音调的虚拟钢琴乐器部230。
[0040]为了执行所述编辑功能，如图5所示，使用者的客户端终端机上载有使用本发明系统所需制作程序。
[0041]这里，所述制作程序在屏幕上显示用于编辑歌词的歌词编辑领域410，用于编辑背景音乐的背景音乐编辑领域420，用于使用者操作钢琴键的虚拟钢琴键领域430，用于使用者编辑元音效果的元音效果编辑领域440，用于编辑歌手或声道的歌手设置领域450，用于使用者选择文件、编辑、音频、视图、操作、声道、歌词、设置、唱法、帮助等的设置领域460。从而使用者可以按自己的意愿进行编辑。
[0042]所述歌词编辑领域410可以输入语言最小单位(音节)，标记个音节的音，并标记发
音记号。
[0043]各音节具有相应的音阶(Pitch),音长(Length)属性。
[0044]所述背景音乐编辑领域420可以输入、编辑WAV、MP3等现有音源。
[0045]所述虚拟钢琴乐器领域430提供相当于钢琴乐器的功能，可以播放对应于各钢琴键位置的音。
[0046]所述歌手设置领域450可以选择与元音相应的歌手音源，提供编辑各种效果的功能，执打各种类型的歌手唱歌的功能。
[0047]所述设置领域460可以设置唱法、设置编辑基本单位音标、编辑画面选项等。
[0048]所述各领域通过用于编辑歌词的歌词编辑部210、用于编辑音源的音源编辑部220、用于编辑元音效果的元音效果编辑部240、选择相应于元音的歌手音源、用于编辑各种声道的歌手及声道编辑部250提供，所述编辑部编辑的信息由中央控制部(图略)接收，传送到语音合成传送服务器。
[0049]这里，所述语音合成传送服务器300包括把多台客户端终端机音乐合成请求，按依次或并列方式进行管理，以此让多台客户端终端机同时连接语音合成服务器，发出语音合成请求的客户端多址连接管理部310 ;为了在有限的网络环境中有效传送音乐数据，对音乐数据进行压缩的音乐数据压缩处理部320 ;根据客户端终端机音乐合成请求，把合成的音乐信息传送给客户端终端机的音乐数据传送部330 ;为了给移动通信公司铃声服务、彩铃服务提供语音合成基础音乐内容，向外部系统传送该音乐内容的附加服务界面处理部340。
[0050]所述客户端多址连接管理部310把多台客户端终端机的音乐合成请求，按依次或并列方式进行管理，以此让多台客户端终端机同时连接语音合成服务器，发出语音合成请求。
[0051]即，按客户端终端机连接的时间顺序，进行顺序管理，依次处理。
[0052]音乐数据压缩处理部320是为了在有限的网络环境中有效传送音乐数据，对音乐数据进行压缩的部分，接收来自所述客户端终端机的音乐合成请求数据，进行压缩。语音合成服务器具有解码的解码部。[0053]音乐数据传送部330根据客户端终端机音乐合成请求，把合成的音乐信息传送给客户端终端机。
[0054]另外，语音合成服务器把合成的音乐信息传向客户端终端机时，也利用所述音乐数据传送部。
[0055]附加服务界面处理部340为了给移动通信公司铃声服务、彩铃服务提供基于语音合成的音乐内容，向外部系统传送该音乐内容，把各客户端创作的音乐内容向网络上流通。
[0056]所述外部系统是用于接收本发明语音合成服务器提供的音乐内容的系统，比如可以是提供铃声服务的移动通信公司服务器，提供彩铃服务的移动通信公司服务器。
[0057]图3为本发明一实施例的利用客户端终端机的音乐内容制作系统语音合成服务器框图。
[0058]所述语音合成服务器100包括获取由客户端终端机传送的歌词、歌手、声道、音阶、音长、拍子、节奏、音乐效果的音乐信息获得部110 ;分析由上述音乐信息获得部获得的歌词文章，根据语言特征，转换成所定义的形式的文句分析部120 ;把由上述文句分析部分析的数据，转换成音素基础的发音转换部130 ;对由所述文句分析部及发音转换部分析出的相当于歌词的最优音素，按提前定义的规则，选择最优音素的最优音素选择部140 ;从所述音乐信息获得部获取歌手信息，根据该信息，从音源数据库选择即符合由所述最优音素选择部选择的因素，又符合所述歌手信息的音源的音源选择部150 ;根据歌词文章特征，获得由所述最优音素选择部选择的因素，连接各最优音素，对此进行合成时，控制长度和音高(pitch)的韵律控制部160 ;获得由所述韵律控制部合成的歌词文章，根据通过所述音乐信息获得部获得的音阶、音长、拍子、节奏，调配所获得的歌词文章的语音转换部170 ;获得由所述语音转换部转换的语音，根据通过所述音乐信息获得部获得的音乐效果，为所述已转换的语音调配音色的音色转换部180 ;对通过所述音乐信息获得部获得的背景音乐信息与通过所述音色转换部转换的音色，进行合成的歌曲及背景音乐合成部190。
[0059]所述音乐信息获得部110为了播放音乐获取由客户端终端机传送的歌词、歌手、声道、音阶、音长、拍子、节奏、音乐效果。
[0060]即如图5所示，为了让制作者利用文字语音合成制作音乐内容，本发明的客户端终端机上载有音乐内容制作程序，显示在屏幕上。
[0061]把所述歌词、歌手、声道、音阶、音长、拍子、节奏、音乐效果信息等存储在音乐信息数据库195中，进行管理，参考所述客户端选择的播放音乐所需信息，由音乐信息获得部获得音乐信息数据库195中的相应信息。
[0062]为了让使用者选择制作音乐内容所需各种动作模式，在使用者终端机屏幕上显示制作程序，使用者根据显示屏上的内容，选择歌词、歌手、声道、音阶、音长、拍子、节奏、音乐效果、唱法等时，该选择的信息被传送到语音合成服务器，由音乐信息获得部110获得。
[0063]这是，所述文句分析部120分析由上述音乐信息获得部获得的歌词文章，根据语言特征，转换成所定义的形式。
[0064]语言特征方面，韩语的语句包括主语、谓语、动词、助词、副词等，有罗列规律。这就是语言特征。英语、汉语等所有语言也都具有各自的特征。
[0065]所述定义的形式意味着划分为语言形态素，而形态素是语言的具有意义的最小单位。[0066]如“东海水与白头山”，分为形态素时如下。即“东海水”+ “与”+ “白头山”。
[0067]而按形态素分割后，对文章进行分析，比如“东海水”=名词，“与”=连词，“白头山”=名词。如此，把句子中的单词分割为名词、动词、连词、形容词等。
[0068]S卩，如果选择的歌词是汉语，则按汉语的特征，按定义的形态进行转换。
[0069]所述文句分析部分析的数据，由发音转换部130接收，以音素为准进行转换，通过最优因素选择部140对所述文句分析部及发音转换部分析的歌词，按事先定义的规则，选择相应的最佳音素。
[0070]所述发音转换部，以因素为准进行转换，把分割完的文章，按汉语阅读规则，按发音形式转换。
[0071]比如，“东海水”唱出来会发音成“东(一声)海(二声)水(三声)”，把其分割成音素基础的话变化成 “ du+ong+ong+hai+shu i+i ”。
[0072]所述最优因素选择部140如果分析的歌词是东海水，则把最优因素比如选为“ du+ong+ong+hai+shui+i”。
[0073]音源选择部150从所述音乐信息获得部获取歌手信息，根据该信息，从音源数据库选择即符合由所述最优音素选择部选择的因素，又符合所述歌手信息的音源。
[0074]S卩，如果作为歌手选择了少女时代，则从音源数据库选择相应于少女时代的音源。
[0075]歌手信息之外，还可以提供声道信息，因此如果使用者还选择了声道，则还可以提供相应声道信息。
[0076]所述韵律控制部160根据歌词文章特征，获得由所述最优音素选择部选择的因素，连接各最优音素，对此进行合成时，控制长度和音高(pitch)。
[0077]所述文章特征意味着声调转变规律等语言规则。
[0078]所述长度意味着歌词相应的音长，即意味着1、2、3拍，音高意味着歌词的音阶，即意味着“哆来咪发嗖拉西哆”这种音乐定义的音高。
[0079]即，为了按文章的特征，自然发声，连接因素进行合成时，起控制长度和音高的作用。
[0080]所述语音转换部170获得由所述韵律控制部合成的歌词文章，根据通过所述音乐信息获得部获得的音阶、音长、拍子、节奏，调配所获得的歌词文章。
[0081]S卩，把相应于歌词的音源，按音阶、音长、拍子、节奏转变语音，比如把相应于“东”的音源，以“嗖”音阶、I拍音长、4/4拍子、120节奏，播放音源。
[0082]所述音阶意味着音高，为了让使用者便于选择音高，本发明提供虚拟钢琴乐器功倉泛。
[0083]所述音长意味着音的长度，提供乐谱等音符，让使用者易于编辑音长。
[0084]基本提供的音符有I分音符(I)、2分音符(1/2 )、4分音符(1/4 )、8分音符(1/8)、16分音符(1/16)、32分音符(1/32)、64分音符(1/64)。
[0085]所述拍子是音乐的拍子单位，有1/2拍、1/4拍、1/8拍等。
[0086]相当于分母的数字为(1、2、4、8、16、32、64)，相当于分子的数字为(I?256)。
[0087]所述节奏意味着音乐播放速度，通常提供(20?300)，数字越小速度越慢，数字越大意味着速度越快。通常一拍长度速度定为120。
[0088]所述音色转换部180获得由所述语音转换部转换的语音，根据通过所述音乐信息获得部获得的音乐效果，为所述已转换的语音调配音色。
[0089]比如给“东”这一音源给以颤音等音乐效果时，音色会发生变化。
[0090]所述音乐效果及唱法可以最大限度地表现音乐效果，而这种音乐效果会支持人的自然发生方法，以如下方式改变音色。
[0091]如图5所示，制作程序为客户端终端机提供VEL (velocity)、DYN (dynamics)、BRE (Breathiness)、BRI (Brightness)、CLE (Clearness)、OPE (Opening)、GEN (GenderFactor)、P0R (Portamento Timing)、PIT (Pitch Bend)、PBS (Pitch Bend Sensitivity)、VIB (Vibration)等。
[0092]所述VEL (velocity)为起音值，值越高母音越短，起因感觉越高。所述DYN(dynamics)的值越高，力度越强，控制歌手的力度(声音的大小、柔和程度)。
[0093]所述BRE (Breathiness)的值越高,气息越强,所述BRI (Brightness)是增减声音高的频率成分，值越高声音月亮，值越低声音越深，越温和。
[0094]所述CLE (Clearness)类似BRI，但原理不同。即，值越高越声音越尖锐、清澈，值越低声音越深沉、越低。
[0095]所述OPE(Opening)模拟的是按开口的状态换音调的样子,越高越鲜明，越低越混沌。
[0096]所述GEN (Gender Factor)是广泛改变歌手个性的参数,越高越有男人味,越低越有女人味。
[0097]所述POR (Portamento Timing)是调整变换音高重点的参数，所述PIT (PitchBend)调节与音高相关的EQ滑动,所述PBS (Pitch Bend Sensitivity)执行与调节音高相关的感度或感性参数调节，所述VIB (Vibration)调节音的震颤。
[0098]唱法意味着唱歌方式，对元音的音源，利用元音音效等技法进行加工，实现多样唱法。
[0099]比如女性声音，男性声音，小孩声音，机器人声音，流行歌曲，古典歌曲等提供唱歌技法。
[0100]所述歌曲及背景音乐合成部190对通过所述音乐信息获得部获得的背景音乐信息与通过所述音色转换部转换的音色，进行合成。
[0101]如，播放“东海水与白头山”这一音源时，合成相应歌曲的背景音乐(通常以乐器演奏的音乐)。
[0102]即，在所述转换的最终音色上，合成背景音乐，输出完整的音乐。
[0103]所述用于获得音乐信息的音乐信息获得部110包括获得歌词信息的歌词信息获得部(图略)；从存储于音源数据库的背景音乐音源中，获得所选背景音乐音源信息的背景音乐信息获得部(图略);获得由使用者调节的元音效果信息的元音效果获得部(图略);获得歌手信息的歌手信息获得部(图略)。
[0104]还可以根据需要额外包括获得由使用者通过从虚拟钢琴乐器选择的钢琴键位置信息的钢琴键位置获得部(图略)。
[0105]所述钢琴键位置信息，事先定义与钢琴键的各键音高相应的频率。
[0106]通过这种结构及操作，任何人都可以在移动环境下轻松编辑音乐内容，获得合成好的语音，可把个人创作的内容流通到在线、离线环境中，用于手机的铃声、彩铃等音乐内容的应用上。还可以用于多种形式便携设备的音乐播放及语音向导，可为ARS(自动应答系统)、导航仪提供高度仿真真人版语音向导服务，可让人工智能机器人说话声音及歌喉高度近似于真人。
[0107]最后应说明的是:以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
[0108]产业利用可行性
[0109]本发明通过这种结构及操作，可让任何人都可以在移动环境下轻松编辑音乐内容，获得合成好的语音，可把个人创作的内容流通到在线、离线环境中，用于手机的铃声、彩铃等音乐内容的应用上。因此音乐内容制作领域上应用前景非常宽。
【权利要求】
1.一种利用客户端终端机的音乐内容制作系统，其特征在于:包括编辑歌词及音源，播放与钢琴键位置对应的音，编辑元音效果(effect)或把相当于元音的歌手音源及声道(track)编辑成音乐信息，发送到语音合成服务器，播放由语音合成服务器加工的音乐的客户端终端机；获得所述客户端终端机发送的音乐信息，提取与歌词相应的音源，进行合成及加工的语音合成服务器；把所述语音合成服务器生成的音乐发送到客户端终端机的语音合成传送服务器。
2.根据权利要求1所述的利用客户端终端机的音乐内容制作系统，其特征在于: 所述客户端终端机包括编辑歌词的歌词编辑部；编辑音源的音源编辑部；编辑元音效果的元音效果编辑部；选择相当于元音的歌手音源，编辑各种声道的歌手及声道编辑部；从语音合成传送服务器接收由语音合成服务器合成的信号，进行播放的播放部。
3.根据权利要求1所述的利用客户端终端机的音乐内容制作系统，其特征在于: 所述客户端终端机包括编辑歌词的歌词编辑部；编辑音源的音源编辑部；播放与钢琴键位置相应的声音的虚拟钢琴乐器部；编辑元音效果的元音效果编辑部；选择相当于元音的歌手音源，编辑各种声道的歌手及声道编辑部；从语音合成传送服务器接收由语音合成服务器合成的信号，进行播放的播放部。
4.根据权利要求1所述的利用客户端终端机的音乐内容制作系统，其特征在于: 所述语音合成服务器包括获取由客户端终端机传送的歌词、歌手、声道、音阶、音长、拍子、节奏、音乐效果的音乐信息获得部；分析由上述音乐信息获得部获得的歌词文章，根据语言特征，转换成所定义的形式的文句分析部；把由上述文句分析部分析的数据，转换成音素基础的发音转换部；对由所述文句分析部及发音转换部分析出的相当于歌词的最优音素，按提前定义的规贝U，选择最优音素的最优音素选择部；从所述音乐信息获得部获取歌手信息，根据该信息，从音源数据库选择即符合由所述最优音素选择部选择的因素，又符合所述歌手信息的音源的音源选择部；根据歌词文章特征，获得由所述最优音素选择部选择的因素，连接各最优音素，对此进行合成时，控制长度和音高(pitch)的韵律控制部；获得由所述韵律控制部合成的歌词文章，根据通过所述音乐信息获得部获得的音阶、音长、拍子、节奏，调配所获得的歌词文章的语音转换部；获得由所述语音转换部转换的语音，根据通过所述音乐信息获得部获得的音乐效果，为所述已转换的语音调配音色的音色转换部；对通过所述音乐信息获得部获得的背景音乐信息与通过所述音色转换部转换的音色，进行合成的歌曲及背景音乐合成部。
5.根据权利要求4所述的利用客户端终端机的音乐内容制作系统，其特征在于:所述音乐信息获得部包括获得歌词信息的歌词信息获得部；从存储于音源数据库的背景音乐音源中，获得所选背景音乐音源信息的背景音乐信息获得部; 获得由使用者调节的元音效果信息的元音效果获得部；获得歌手信息的歌手信息获得部。
6.根据权利要求4所述的利用客户端终端机的音乐内容制作系统，其特征在于: 还包括获得由使用者通过从虚拟钢琴乐器选择的钢琴键位置信息的钢琴键位置获得部。
7.根据权利要求1所述的利用客户端终端机的音乐内容制作系统，其特征在于: 所述语音合成传送服务器包括把多台客户端终端机音乐合成请求，按依次或并列方式进行管理，以此让多台客户端终端机同时连接语音合成服务器，发出语音合成请求的客户端多址连接管理部；为了在有限的网络环境中有效传送音乐数据，对音乐数据进行压缩的音乐数据压缩处理部；根据客户端终端机音乐合成请求，把合成的音乐信息传送给客户端终端机的音乐数据传送部；为了给移动通信公司铃声服务、彩铃服务提供语音合成基础音乐内容，向外部系统传送该音乐内容的附加服务界面处理部。
【文档编号】G06Q50/10GK103503015SQ201280020843
【公开日】2014年1月8日申请日期:2012年4月17日优先权日:2011年4月28日
【发明者】廉宗学, 姜元模申请人:天锦丝有限公司

2012-2014专利技术

最新回复(0)