音频信号输出方法、装置、终端及系统的制作方法

xiaoxiao2021-2-23 116

音频信号输出方法、装置、终端及系统的制作方法
【技术领域】
[0001]本发明涉及通信领域，具体而言，涉及一种音频信号输出方法、装置、终端及系统。
【背景技术】
[0002]高清晰度多媒体接口(HighDefinit1n Multimedia Interface,简称为 HDMI),是一种数字化视频/音频接口技术，是适合影像传输的专用型数字化接口，其可同时传送音频和影像信号，最高数据传输速度为18Gbps。同时无需在信号传送前进行数/模或者模/数转换。
[0003]卡拉0K是一种伴奏系统，演唱者可以在预先录制的音乐伴奏下参与唱歌，卡拉0K能通过声音处理使演唱者的声音得带美化，当与音乐伴奏混音结合后，就变成了浑然一体的立体声歌曲，这种娱乐方式，能给大众带来极其愉悦的感受。卡拉0K功能对于音频的实时性要求较高，一般要求延时低于30ms，专业级设备更达到10ms以内。
[0004]目前智能终端的高清音视频接口基本都是以HDMI为标准，但是相关技术中的终端产品中，音频经过采集、处理、播放，延时超过200ms。这就给卡拉0K功能在基于智能设备上的应用造成了很大约束。目前业内通用做法是先录后听，即系统先将声音录制、处理，然后播放出来，这样可以规避这个问题，但用户不能边唱边听，降低了用户体验。
[0005]针对相关技术中存在的音频输出时延大，用户体验低的问题，目前尚未提出有效的解决方案。

【发明内容】

[0006]本发明提供了一种音频信号输出方法、装置、终端及系统，以至少解决相关技术中存在的音频输出时延大，用户体验低的问题。
[0007]根据本发明的一个方面，提供了一种音频信号输出方法，包括:接收背景音乐信号；将所述背景音乐信号中的第一音频信号传输至数字信号处理器DSP ;接收由所述DSPS回的对所述第一音频信号和第二音频信号进行混音后得到的第三音频信号，其中，所述第二音频信号为从话筒接收的音频信号；输出所述第三音频信号。
[0008]优选地，当所述背景音乐信号中包括第一音频信号和视频信号的情况下，在将所述背景音乐信号中的第一音频信号传输至数字信号处理器DSP之前，还包括:对所述背景音乐信号进行剥离获得所述第一音频信号和所述视频信号。
[0009]优选地，在接收由所述DSP返回的对所述第一音频信号和第二音频信号进行混音后得到的所述第三音频信号之后，还包括:将所述第三音频信号和所述视频信号进行混合获得音视频信号；输出所述音视频信号。
[0010]优选地，所述背景音乐信号、所述第一音频信号、所述第三音频信号、所述视频信号和所述音视频信号均是以高清晰度多媒体接口 HDMI信号的形式进行传输的。
[0011]根据本发明的另一方面，提供了一种音频信号输出装置，包括:第一接收模块，用于接收背景音乐信号；传输模块，用于将所述背景音乐信号中的第一音频信号传输至数字信号处理器DSP ;第二接收模块，用于接收由所述DSP返回的对所述第一音频信号和第二音频信号进行混音后得到的第三音频信号，其中，所述第二音频信号为从话筒接收的音频信号；第一输出模块，用于输出所述第三音频信号。
[0012]优选地，当所述背景音乐信号中包括第一音频信号和视频信号的情况下，所述音频信号输出装置还包括:剥离模块，用于对所述背景音乐信号进行剥离获得所述第一音频信号和所述视频信号。
[0013]优选地，所述音频信号输出装置还包括，混合模块，用于将所述第三音频信号和所述视频信号进行混合获得音视频信号；第二输出模块，用于输出混合后的所述音视频信号。
[0014]优选地，所述背景音乐信号、所述第一音频信号、所述第三音频信号、所述视频信号和所述音视频信号均是以高清晰度多媒体接口 HDMI信号的形式进行传输的。
[0015]根据本发明的再一方面，提供了一种终端，包括上述任一项所述的装置。
[0016]根据本发明的又一方面，提供了一种系统，包括话筒、耳机、显示器，还包括上述所述的终端，其中，所述话筒和耳机均与所述终端连接，所述终端与所述显示器连接。
[0017]通过本发明，采用接收背景音乐信号；将所述背景音乐信号中的第一音频信号传输至数字信号处理器DSP;接收由所述DSP返回的对所述第一音频信号和第二音频信号进行混音后得到的第三音频信号，其中，所述第二音频信号为从话筒接收的的音频信号；输出所述第三音频信号，解决了相关技术中存在的音频输出时延大，用户体验低的问题，进而达到了减少音频输出时延，提高用户体验的效果。
【附图说明】
[0018]此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中:
[0019]图1是根据本发明实施例的音频信号输出方法的流程图；
[0020]图2是根据本发明实施例的音频信号输出装置的结构框图；
[0021]图3是根据本发明实施例的音频信号输出装置的优选结构框图一；
[0022]图4是根据本发明实施例的音频信号输出装置的优选结构框图二；
[0023]图5是根据本发明实施例的终端的结构框图；
[0024]图6是根据本发明实施例的系统结构框图；
[0025]图7是根据本发明实施例的整体框架图；
[0026]图8是根据本发明实施例的终端内部的HDMI信号传输原理图；
[0027]图9是根据本发明实施例的HDMI信号处理模块的信号处理图；
[0028]图10为根据本发明实施例的整体流程图。
【具体实施方式】
[0029]下文中将参考附图并结合实施例来详细说明本发明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。
[0030]在本实施例中提供了一种音频信号输出方法，图1是根据本发明实施例的音频信号输出方法的流程图，如图1所示，该流程包括如下步骤:
[0031]步骤S102，接收背景音乐信号；
[0032]步骤S104，将背景音乐信号中的第一音频信号传输至数字信号处理器DSP ；
[0033]步骤S106，接收由DSP返回的对第一音频信号和第二音频信号进行混音后得到的第三音频信号，其中，该第二音频信号为从话筒接收的音频信号；
[0034]步骤S108，输出第三音频信号。
[0035]通过上述步骤，接收背景音乐信号；将背景音乐信号中的第一音频信号传输至数字信号处理器DSP ;接收由DSP返回的对第一音频信号和第二音频信号进行混音后得到的第三音频信号，其中，该第二音频信号为从话筒接收的音频信号；输出第三音频信号，实现了利用单独的DSP处理混音，减少混音后的音频的输出时延，解决了相关技术中存在的音频输出时延大，用户体验低的问题，进而达到了减少音频输出时延，提高用户体验的效果。
[0036]在一个可选的实施例中，在背景音乐信号中包括第一音频信号和视频信号的情况下，在将背景音乐信号中的第一音频信号传输至数字信号处理器DSP之前，还包括:对背景音乐信号进行剥离获得第一音频信号和视频信号。在对背景音乐信号进行剥离后会将剥离得到的第一音频信号传输至DSP模块，从而实现音频的混音。
[0037]其中，在接收由DSP返回的对第一音频信号和第二音频信号进行混音后得到的第三音频信号之后，还包括:将第三音频信号和视频信号进行混合获得音视频信号；输出该音视频信号。其中的视频信号是从背景音乐中剥离出的视频信号，在对音频信号进行混合后再进行音频视频的混合，从而实现背景音乐和话筒音的完美结合。
[0038]在一个优选地实施例中，背景音乐信号、第一音频信号、第三音频信号、视频信号和音视频信号均是以高清晰度多媒体接口 HDMI信号的形式进行传输的。也就是说音频信号混音、背景音乐信号剥离以及音频信号视频信号的混合均是利用HDMI处理模块进行处理的，从而可以有效的减少声首时延，提闻用户体验。
[0039]在本实施例中还提供了一种音频信号输出装置，该装置用于实现上述实施例及优选实施方式，已经进行过说明的不再赘述。如以下所使用的，术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。
[0040]图2是根据本发明实施例的音频信号输出装置的结构框图，如图2所示，该装置包括第一接收模块22，传输模块24，第二接收模块26和第一输出模块28。下面对该装置进行说明。
[0041]第一接收模块22，用于接收背景音乐信号；传输模块24，连接至上述第一接收模块22，用于将背景音乐信号中的第一音频信号传输至数字信号处理器DSP ;第二接收模块26，连接至上述传输模块24，用于接收由DSP返回的对第一音频信号和第二音频信号进行混音后得到的第三音频信号，其中，该第二音频信号为从话筒接收的音频信号；第一输出模块28，连接至上述第二接收模块26，用于输出第三音频信号。
[0042]图3是根据本发明实施例的音频信号输出装置的优选结构框图一，如图3所示，该装置除包括图2所示的所有模块外，还包括剥离模块32，下面对该装置进行说明。
[0043]剥离模块32，连接至上述第一接收模块22和传输模块24，用于当背景音乐信号中包括第一音频信号和视频信号的情况下，对背景音乐信号进行剥离获得第一音频信号和视频信号。
[0044]图4是根据本发明实施例的音频信号输出装置的优选结构框图二，如图4所示，该装置除包括图3所示的所有模块外，还包括混合模块42和第二输出模块44。下面对该装置进行说明。
[0045]混合模块42，连接至上述第二接收模块26，用于将第三音频信号和视频信号进行混合获得音视频信号；第二输出模块44，连接至上述混合模块42，用于输出混合后的视频信号。
[0046]图5是根据本发明实施例的终端的结构框图，如图5所示，该终端50包括上述任一项的音频信号输出装置52。
[0047]图6是根据本发明实施例的系统结构框图，如图6所示，该系统包括话筒62，耳机64，显示器66以及终端50，其中，话筒62和耳机64均与终端50连接，该终端50还与显示器66连接。
[0048]为了解决相关技术中存在的音频输出时延大，用户体验低的问题，本发明实施例中还提供了一种基于HDMI信号处理的卡拉0K系统方案，该实施例的实现可以体现在以下两个方面:
[0049]在HDMI信号上实现卡拉0K混音，可以使用户随时随地的体验歌曲带来的愉悦；
[0050]使用HDMI处理模块进行音视频的剥离和整合，一个单独的DSP处理混音，可以使语音延迟控制在20ms以内，使背景音和话筒音的完美结合。
[0051]下面对该实施例中的技术方案进行描述。
[0052]微处理器通过I2C总线控制DSP和HDMI处理模块，DSP芯片主要处理音频的混音，HDMI处理模块主要进行音频的剥离和整合。
[0053]卡拉0K有两路音频，背景音由微处理器通过HDMI输出，经过HDMI处理模块剥离音频后传入DSP中，语音由话筒经过编译码器(coder-Decoder，简称为CODEC)转换为数字音频信号后传入DSP中，两路音频信号在DSP中进行混音，完成后分别输出给耳机和HDMI处理模块，最终将三原色RGB视频与音频信号整合后输出完整的HDMI信号，通过电视等显示装置播放。
[0054]HDMI接口是新一代的数字高清音/视频接口，可以同时传送音频和视频信号，其广泛用于手机、机顶盒、DVD播放机、电脑、数字电视等。该装置是基于HDMI信号进行处理的，输入输出均为标准HDMI信号，所以应用范围广阔。
[0055]通过该实施例可以在HDMI信号上实现卡拉0K混音，可以使用户随时随地的体验歌曲带来的愉悦；并且，在该实施例中使用HDMI处理模块进行音视频的剥离和整合，一个单独的DSP处理混音，可以使语音延迟控制在20ms以内，使背景音和话筒音的完美结合。
[0056]下面结合附图对本发明实施例进行说明。
[0057]图7是根据本发明实施例的整体框架图，如图7所示，由话筒62输入的音频和终端内部的背景音混合后，一路输出到耳机64，一路输出到外部显示装置72 (同上述显示器66)，这样既可以通过耳机，也可以通过外部放音装置将卡拉0K的效果展现出来。实现了在终端产品中使用卡拉0K的目的。
[0058]图8是根据本发明实施例的终端内部的HDMI信号传输原理图，如图8所7K,微处理器82通过I2C总线控制DSP音频处理芯片84和HDMI处理模块86，DSP芯片主要处理音频的混音，HDMI处理模块主要进行音频的剥离和整合，其中在HDMI接收器862中进行音频的剥离，在HDMI发送器864中进行音频的整合。C0DEC88进行音频数字信号和模拟信号的转换。微处理器通过HDMI总线将音视频信号传输给HDMI处理模块。HDMI处理模块、DSP芯片以及CODEC之间都是通过I2S总线传输音频信号。
[0059]图9是根据本发明实施例的HDMI信号处理模块的信号处理图，如图9所示，数字信号采样模块92 (同上述第一接收模块22)在检测到输入端有HDMI信号后，对输入信号进行采样，并将采样到的数据流传输给音/视频剥离模块94 (同上述剥离模块32)，音/视频剥离模块对数据流进行分离处理，音频数据传输给音频输出模块96 (同上述传输模块24)，转换成I2S音频流后输出，视频数据传输给音/视频混合模块98 (同上述混合模块42)。音频输入模块910会将处理后的I2S音频信号转换成音频数据传输给音/视频混合模块98，在其中进行音频和视频数据的同步混合，完成后发送给HDMI信号发送模块912 (同上述第一输出模块28和第二输出模块44)，封装成完整的HDMI信号输出。
[0060]图10为根据本发明实施例的整体流程图，如图10所示，该流程包括如下步骤:
[0061]步骤S1002，卡拉0K有两路音频，背景音由微处理器通过HDMI输出；
[0062]步骤S1004，背景音经过HDMI处理模块86剥离音频后传入DSP中；
[0063]步骤S1006，话筒将接收的人声后传输至编译码器CODEC中进行处理；
[0064]步骤S1008，话筒音由话筒经过CODEC转换为数字音频信号后传入DSP芯片中；
[0065]步骤S1010，两路音频信号在DSP中进行混音，完成后分两路输出，一路通过I2S总线传输给CODEC，一路通过I2S总线传输给HDMI处理模块；
[0066]步骤S1012，CODEC将处理后的音频信号转换为模拟信号后通过耳机播放；
[0067]步骤S1014，HDMI处理模块将之前剥离出来的RGB视频信号与DSP输送过来的音频信号进行整合，然后输出完整的HDMI信号，通过电视等显示装置播放。
[0068]以上应用场景只是举例，其他应用在不违反本专利发明精神的前提下，涉及此类操作的方法仍然属于本专利保护范围之内。
[0069]在HDMI信号中上加入卡拉0K系统，将会给整个系统带来亮点，通过本发明实施例中的技术方案可以有效解决HDMI信号混音传输时的声音延迟问题,从而提高了用户体验。
[0070]显然，本领域的技术人员应该明白，上述的本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。
[0071]以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。
【主权项】
1.一种音频信号输出方法，其特征在于，包括: 接收背景音乐信号；将所述背景音乐信号中的第一音频信号传输至数字信号处理器DSP ；接收由所述DSP返回的对所述第一音频信号和第二音频信号进行混音后得到的第三音频信号，其中，所述第二音频信号为从话筒接收的音频信号；输出所述第三音频信号。2.根据权利要求1所述的方法，其特征在于，当所述背景音乐信号中包括第一音频信号和视频信号的情况下，在将所述背景音乐信号中的第一音频信号传输至数字信号处理器DSP之前,还包括: 对所述背景音乐信号进行剥离获得所述第一音频信号和所述视频信号。3.根据权利要求2所述的方法，其特征在于，在接收由所述DSP返回的对所述第一音频信号和第二音频信号进行混音后得到的所述第三音频信号之后，还包括: 将所述第三音频信号和所述视频信号进行混合获得音视频信号；输出所述音视频信号。4.根据权利要求3所述的方法，其特征在于，所述背景音乐信号、所述第一音频信号、所述第三音频信号、所述视频信号和所述音视频信号均是以高清晰度多媒体接口 HDMI信号的形式进行传输的。5.一种音频信号输出装置，其特征在于，包括: 第一接收模块，用于接收背景音乐信号；传输模块，用于将所述背景音乐信号中的第一音频信号传输至数字信号处理器DSP ；第二接收模块，用于接收由所述DSP返回的对所述第一音频信号和第二音频信号进行混音后得到的第三音频信号，其中，所述第二音频信号为从话筒接收的音频信号；第一输出模块，用于输出所述第三音频信号。6.根据权利要求5所述的装置，其特征在于，当所述背景音乐信号中包括第一音频信号和视频信号的情况下，还包括: 剥离模块，用于对所述背景音乐信号进行剥离获得所述第一音频信号和所述视频信号。7.根据权利要求6所述的装置，其特征在于，还包括: 混合模块，用于将所述第三音频信号和所述视频信号进行混合获得音视频信号；第二输出模块，用于输出混合后的所述音视频信号。8.根据权利要求7所述的装置，其特征在于，所述背景音乐信号、所述第一音频信号、所述第三音频信号、所述视频信号和所述音视频信号均是以高清晰度多媒体接口 HDMI信号的形式进行传输的。9.一种终端，其特征在于，包括权利要求5至8中任一项所述的装置。10.一种系统，包括话筒、耳机、显示器，其特征在于，还包括如权利要求9所示的终端，其中，所述话筒和耳机均与所述终端连接，所述终端与所述显示器连接。
【专利摘要】本发明提供了一种音频信号输出方法、装置、终端及系统，其中，该方法包括：将背景音乐信号中的第一音频信号传输至数字信号处理器DSP；接收由DSP返回的对第一音频信号和第二音频信号进行混音后得到的第三音频信号，其中，该第二音频信号为从话筒接收的音频信号；输出第三音频信号。通过本发明，解决了相关技术中存在的音频输出时延大，用户体验低的问题，进而达到了减少音频输出时延，提高用户体验的效果。
【IPC分类】G10L19/00, H04N5/262
【公开号】CN105491302
【申请号】CN201410471799
【发明人】李阳
【申请人】中兴通讯股份有限公司
【公开日】2016年4月13日
【申请日】2014年9月16日
【公告号】WO2015131591A1

2012-2014专利技术

最新回复(0)