显示设备以及用于控制显示设备的方法
【技术领域】
[0001]与示例性实施例一致的方法和设备涉及一种显示设备以及用于控制显示设备的方法,更具体地,涉及一种可根据与用户的语音相关的信号被控制的显示设备以及用于控制这样的显示设备的方法。
【背景技术】
[0002]随着电子技术的发展,各种显示设备已被开发和分布,并被配备多种功能以便达到用户的期望。具体地,电视机(TV)可连接到互联网,并可提供基于互联网的服务,并且用户可经由TV观看多个数字广播频道。
[0003]近年来,使用语音识别的技术已被发展以便更容易且更直观地控制显示设备。具体而言,TV能够识别用户语音并执行与用户的语音相应的功能,诸如,控制音量或者改变频道。
[0004]然而,能够识别用户的语音的现有技术的显示设备仅仅提供与识别出的语音相应的功能,而对通过与用户通信来提供交互信息有限制。
【发明内容】
[0005]技术问题
[0006]一个或更多个示例性实施例可克服以上缺点以及以上未描述的其他缺点。然而,应理解一个或更多个示例性实施例不需要克服上述缺点,并可不克服上述问题中的任何问题。
[0007]一个或更多个示例性实施例提供一种显示设备以及用于控制所述显示设备的方法,其中,所述显示设备在用户的话语意图与显示设备的功能的执行和对内容的搜索之中的至少一个相关时,输出与显示设备的功能的执行和对内容的搜索之中的所述至少一个相应的附加问题作为系统响应。技术方案
[0008]根据示例性实施例的一方面,提供了一种显示设备,其中,所述显示设备包括:输出单元;语音采集器,被配置为采集与用户的语音相关的信号;第一通信单元,被配置为将采集到的与用户的语音相关的信号发送到第一服务器,并从第一服务器接收与用户的语音相应的文本信息;第二通信单元,被配置为将接收到的文本信息发送到第二服务器;控制器,当与文本信息相应的响应信息从第二服务器被接收到时,被配置为基于响应信息控制输出单元输出与用户的话语意图相应的系统响应,其中,当用户的话语意图与显示设备的功能的执行和对内容的搜索中的至少一个相关时,系统响应包括与显示设备的功能的执行和对内容的搜索中的所述至少一个相关的附加问题。
[0009]当用户的话语意图与显示设备的功能的执行相关时,附加问题可与确认是否执行该功能相关。
[0010]当用户的话语意图与显示设备的功能的执行相关并且在执行该功能之前需要执行先前功能时,附加问题可与先前功能的执行相关。[0011 ] 当用户的话语意图与对内容的搜索相关时,附加问题可与对内容的搜索的可能结果相关。
[0012]当对内容的搜索与关于第一特定内容的广播时间的询问相关时,附加问题可与以下搜索操作中的至少一个相关:对第一特定内容的搜索以及对与第一特定内容相似的第二特定内容的搜索。
[0013]当对内容的搜索与对和第一特定内容有关的人的搜索相关时,附加问题可与对和所述人相关的第二特定内容的搜索相关。
[0014]根据另一示例性实施例的一方面,提供了一种用于控制显示设备的方法,其中,所述方法包括:采集与用户的语音相关的信号;将采集到的与用户的语音相关的信号发送到第一服务器,并从第一服务器接收与用户的语音相应的文本信息;将接收到的文本信息发送到第二服务器;当与文本信息相应的响应信息从第二服务器被接收到时,基于响应信息输出与用户的话语意图相应的系统响应,其中,当用户的话语意图与显示设备的功能的执行和对内容的搜索中的至少一个相关时,系统响应包括与显示设备的功能的执行和对内容的搜索中的所述至少一个相关的附加问题。
[0015]当用户的话语意图与显示设备的功能的执行相关时,附加问题可与确认是否执行该功能相关。
[0016]当用户的话语意图与显示设备功能的执行相关并且在执行该功能之前需要执行先前功能时,附加问题可与先前功能的执行相关。
[0017]当用户的话语意图与对内容的搜索相关时,附加问题可与对内容的搜索的可能结果相关。
[0018]当对内容的搜索与关于第一特定内容的广播时间的询问相关时,附加问题可与以下搜索操作中的至少一个相关:对第一特定内容的搜索以及对与第一特定内容相似的第二特定内容的搜索。
[0019]当对内容的搜索与对和第一特定内容有关的人的搜索相关时,附加问题可与对和该人相关的第二特定内容的搜索相关。
[0020]有益效果
[0021]根据各种示例性实施例,由于用户通过回答附加问题与显示设备继续进行通信,因此用户可获得最符合他们各自的意图的结果。
【附图说明】
[0022]通过参照附图详细描述示例性实施例,以上和/或其他方面将变得更加清楚,其中:
[0023]图1是示出根据示例性实施例的交互系统的示图;
[0024]图2是示出根据示例性实施例的显示设备的框图;
[0025]图3是示出图2的显示设备的详细配置的框图;
[0026]图4是示出图1的第一服务器的框图;
[0027]图5是示出图1的第二服务器的框图;
[0028]图6A、图 6B、图 6C、图 7A、图 7B、图 7C、图 7D、图 8A、图 8B、图 8C、图 8D、图 9A、图9B、图9C和图9D是示出根据各种示例性实施例的从显示设备输出的系统响应的各个示例的不图;
[0029]图10是示出根据示例性实施例的用于控制显示设备的方法的流程图。
[0030]最佳实施方式
【具体实施方式】
[0031]在下文中,将参照附图更详细地描述示例性实施例。
[0032]在下面的描述中,相同的标号在它们出现在不同的附图中时用于表示相同的元件。提供在描述中限定的事项(诸如,详细的结构和元件)以帮助全面理解示例性实施例。因此,明显的是:可在没有这些具体限定的事项的情况下实施示例性实施例。此外,因为现有技术中公知的功能或元件将用不必要的细节模糊示例性实施例,所以不对现有技术中公知的功能或元件进行详细描述。
[0033]图1是示出根据示例性实施例的交互系统的示图。如图1所示,交互系统1000包括显示设备100、第一服务器200和第二服务器300。
[0034]可通过使用适配为对显示设备100进行控制的远程控制器(未示出)来控制显示设备100。具体地,显示设备100可执行与从远程控制器(未示出)接收到的远程控制信号相应的功能。例如,当通过使用图1中示出的TV实现显示设备100时,显示设备100可基于接收到的远程控制信号来执行诸如例如电源开/关切换、改变频道和/或改变音量的功會K。
[0035]此外,显示设备100可执行与用户的语音相应的各种操作中的任何一个或多个操作。
[0036]具体地,显示设备100可执行与用户的语音相应的功能,或者可输出与用户的语音相应的系统响应。
[0037]为实现这一点,显示设备100将采集到的与用户的语音相关的信号(诸如,例如包括与用户的语音相关的信息的信号)发送到第一服务器200。当第一服务器200从显示设备100接收到与用户的语音相关的信号时,第一服务器200将接收到的与用户的语音相关的信号转换为文本信息(即,文本),并将该文本信息发送到显示设备100。
[0038]显示设备100将从第一服务器200接收到的文本信息发送到第二服务器300。当第二服务器300从显示设备100接收到文本信息时,第二服务器300产生与接收到的文本信息相应的响应信息,并将响应信息发送到显示设备100。
[0039]显示设备100可基于从第二服务器300接收到的响应信息来执行各种操作。
[0040]这里公开的响应信息可包括以下项中的至少一个:用于控制显示设备100执行特定功能的控制命令、用于控制显示设备100输出系统响应的控制命令以及与从显示设备100输出的系统响应相关的系统响应信息。
[0041]具体地,显示设备100可执行与用户的语音相关的功能。具体而言,显示设备100可执行可由显示设备100提供的功能之中的与用户的语音相应的功能。例如,当与用户的语音相关的包括与“请切换到号0(频道号)”相关的信息的信号被输入时,显示设备100可基于从第二服务器300接收到的控制命令将当前频道改变到频道O。在这种情况下,第二服务器300可将用于将频道改变到频道O的控制命令发送到显示设备100。
[0042]此外,显示设备100可输出与用户的语音相应的系统响应。系统响应可以以语音和用户界面(UI)屏幕之中的至少一种格式被输出。
[0043]例如,当与用户的语音相关的包括与询问特定广播节目的广播时间相关的信息的信号被输入时,显示设备100可基于从第二服务器300接收到的系统响应信息,以语音和Π屏幕之中的至少一种格式输出特定广播节目的广播时间。在这种情况下,第二服务器300可将以文本格式表示的系统响应信息发送到显示设备100。
[0044]此外,显示设备100可基于从第二服务器300接收到的控制命令,以语音和UI屏幕之中的至少一种格式输出特定广播节目的广播时间。在这种情况下,第二服务器300可将用于控制显示设备100输出用户所询问的广播节目的广播时间的控制命令发送到显示设备100。
[0045]当用户的话语意图与显示设备100的功能的执行和对内容的搜索中的至少一个相关时,显示设备100可基于用户的话语意图输出与功能的执行和对内容的搜索相关的附加问题,作为系统响应。具体而言,显示设备100可输出附加问题作为对用户的语音的系统响应,以便执行用户想要的功能或者输出用户想要的系统响应。
[0046]例如,假设用户的话语意图与显示设备100的功能的执行相关。在这种情况下,显示设备100可输出与接收对于是否执行该功能的确认相关的附加问题作为系统响应,或者显示设备100可在为了执行相应功能而有必要执行在先的功能时,输出与在先的功能相关的附加问题。
[0047]作为另一示例,当用户的话语意图与对内容的搜索相关时,显示设备100可输出与搜索内容的可能的结果和/或期望的结果相关的附加问题,作为系统响应。
[0048]除了这些,显示设备100还可输出各种附加问题中的任何一个或多个问题作为系统响应。以下将参照附图描述显示设备100输出附加问题的详细示例性实施例。
[0049]因此,由于用户可通过回答附加问题来继续与显示设备100通信,因此用户可获得针对他们的各个意图而被优化的结果。
[0050]尽管图1的显示设备100是TV,但这仅是示例。具体而言,可通过使用各种电子设备(诸如,移动电话、台式个人计算机(PC)、膝上型计算机、导航系统和TV)来实现显示设备100。
[0051]此外,尽管图1中第一服务器200和第二服务器300是单独的服务器,但这仅是示例。具体而言,可实现包括第一服务器200和第二服务器300两者的单个交互式服务器。
[0052]图2是示出根据示例性实施例的显示设备的框图。如图2中所示,显示设备100包括输出单元110、语音采集器120、第一通信单元130、第二通信单元140和控制器150。
[0053]输出单元110输出语音和图像中的至少一个。具体而言,输出单元110可以以语音和图形UI (GUI)之中的至少一种格式,输出与关于经由语音采集器120采集到的用户语音的信号相应的系统响应。
[0054]为实现这一点,输出单元110可包括显示器(未示出)和音频输出单元(未示出)。
[0055]具体而言,显示器(未示出)可提供可由显示设备100提供的各种图像中的任何一个或更多个图像。具体而言,显示器(未示出)可配置包括文本、图像、图标和GUI中的至少一个的Π屏幕,并可将与用户的语音相应的系统响应显示在Π屏幕上。可通过使用液晶显示器(IXD)、有机发光显示器(OLED)和等离子显示面板(PDP)中的至少一个来实现显示器(未示出)。
[0056]音频输出单元(未示出)可以以语音格式输出与用户的语音相应的系统响应。可通过使用输出端口(诸如例如插孔或扬声器)来实现音频输出单元(未示出)。
[0057]输出单元110可输出各种内容。所述内容可包括广播内容、视频点播(VOD)内容和DVD内容。具体而言,显示器(未示出)可输出构成内容的图像,音频输出单元可输出构成内容的声音。
[0058]语音采集器120采集与用户的语音相关的信号。例如,语音采集器120可通过使用用于采集与用户的语音相关的信号的麦克风来实现,并可以集成形式被嵌入在显示设备100中,或者可作为独立形式与显示设备100分离。如果语音采集器120通过独立形式被实现,则语音采集器120可具有可由用户的手握持的形状,或者可被放置在桌子或书桌上,或者可经由有线或无线网络与显示设备100连接,并可将采集到的与用户的语音相关的信号发送到显示设备100。
[0059]语音采集器120可确定采集到的信号是否与用户的语音相关,并可从采集到的信号滤除噪声(例如,空调或吸尘器的声音或者音乐的声音)。
[0060]例如,当与模拟形式的用户语音相关的信息被输入时,语音采集器120对输入的与用户的语音相关的信息进行采样,并将采样的结果转换为数字信号。语音采集器120计算转换后的数字信号的能量,并确定数字信号的能量是否大于或等于预定值。
[0061]如果数字信号的能量大于或等于预定值,则语音采集器120从数字信号去除噪声分量,并将数字信号发送到第一通信单元130。噪声分量包括可能在普通家庭环境中产生的不期望的噪声,并可包括空调的声音、吸尘器的声音和音乐的声音中的至少一种声音。相反,如果数字信号的能量小于预定值,则语音采集器120等待另一输入而不单独对该数字信号进行处理。
[0062]因此,由于整个音频处理操作不会由除了用户的语音之外的其他声音激活,因此可防止不必要的功耗。
[0063]第一通信单元130与第一服务器200 (见图1)进行通信。具体地,第一通信单元130可将与用户的语音相关的信号发送到第一服务器200,并可从第一服务器200接收与用户的语音相应的文本信息。第一通信单元130可被实现为例如发送器/接收器、收发器和/或被配置为发送信号和接收信号的任何装置或组件。
[0064]第二通信单元140与第二服务器300 (见图1)进行通信。具体地,第二通信单元140可将接收到的文本信息发送到第二服务器300,并可从第二服务器300接收与文本信息相应的响应信息。第二通信单元140可被实现为例如发送器/接收器、收发器和/或被配置为发送信号和接收信号的任何装置或组件。
[0065]为了实现这一点,第一通信单元130和第二通信单元140可通过使用各种通信方法中的任何一种或多种通信方法与第一服务器200和第二服务器300进行通信。
[0066]例如,第一通信单元130和第二通信单元140可通过使用有线/无线局域网络(LAN)、广域网(WAN)、以太网、蓝牙、Zigbee、通用串行总线(USB)、IEEE 1394和无线保真(W1-Fi)中的至少一种来分别与第一服务器200和第二服务器300进行通信。为了实现这一点,第一通信单元130和第二通信单元140可包括与每种通信方法相应的芯片和/或输入端口。例如,如果通过使用有线LAN方法来执行通信,则第一通信单元130和第二通信单元140中的每个可包括有线LAN卡(未示出)和输入端口。
[0067]尽管在上述示例性实施例中显示设备100包括单独的通信单元130和通信单元140以与第一服务器200和第二服务器300进行通信,但这仅是示例。也就是说,显示设备100可经由单个通信模块与第一服务器200和第二服务器300进行通信。
[0068]此外,尽管在上述示例性实施例中第一通信单元130和第二通信单元140与第一服务器200和第二服务器300进行通信,但这仅是示例。也就是说,第一通信单元130和第二通信单元140中的一个或两个可连接到网络服务器(未示出)并可执行网络浏览,或者可连接到提供VOD服务的内容提供商服务器并可搜索VOD内容。
[0069]控制器150控制显示设备100的总体操作。具体而言,控制器150可控制输出单元110、语音采集器120、第一通信单元130和第二通信单元140的操作。控制器150可包括存储用于控制中央处理器(CPU)和显示设备100的模块和数据的只读存储器(ROM)和随机存取存储器(RAM)。
[0070]具体地,控制器150可控制语音采集器120采集与用户的语音相关的信号,并控制第一通信单元130将采集到的与用户的语音相关的信号发送到第一服务器200。当从第一服务器200接收到与用户的语音相
应的文本信息时,控制器150可控制第二通信单元140将接收到的文本信息发送到第二服务器300。
[0071]此外,当从第二服务器接收到与文本信息相应的响应信息时,控制器150可基于响应信息来执行各种操作。
[0072]具体地,控制器150可基于响应信息来执行与用户的话语意图相应的功能。
[0073]这里公开的响应信息可包括用于控制显示设备100的功能的控制命令。具体地,所述控制命令可包括用于执行可在显示设备100中执行的功能之中的与用户的语音相应的功能的控制命令。因此,控制器150可基于从第二服务器300接收到的控制命令,控制显示设备100的元件以执行与用户的语音相应的功能。
[0074]例如,当通过使用TV实现的显示设备100采集到与用户的语音相关且包含与“请切换到号O (频道号)”相关的信息的信号时,第二服务器300可确定“请切换到号0(频道号)”的话语意图与将频道改变到号0(频道号)相关,并可基于确定的话语意图将用于将频道改变到号0(频道号)的控制命令发送到显示设备100。因此,控制器150可基于接收到的控制命令将频道改变到号0(频道号),并可输出在改变后的频道上提供的内容。
[0075]然而,这仅是示例。控制器150可基于采集到的与用户的语音相关的信号,控制显示设备100的元件执行各种操作(诸如,例如,打开/关闭或者控制音量)中的一个或多个操作。
[0076]此外,控制器150可基于响应信息控制输出与用户的话语意图相应的系统响应。
[0077]这里公开的响应信息可包括系统响应信息,其中,系统响应信息用于将与用户的语音相应的系统响应输出在显示设备100上。在这种情况下,响应信息还可包括用于输出与用户的语音相应的系统响应的控制命令。
[0078]具体地,系统响应信息可以是响应于用户的语音从显示设备100输出的文本格式的系统响应。
[0079]因此,控制器150可通过使用接收到的系统响应信息,控制输出单元110输出与用户的语音相应的系统响应。
[0080]例如,控制器150可配置包括构成接收到的系统响应信息的文本的UI屏幕,并可经由显示器(未示出)输出Π屏幕。此外,控制器150可通过使用文本到语音(TTS)引擎将文本格式的系统响应信息转换为声音,并可通过音频输出单元(未示出)输出该声音。TTS引擎是用于将文本转换为语音信号的模块。控制器150可通过使用现有技术中公开的各种TTS算法中的任何一种或多种算法来将文本格式的系统响应信息转换为语音信号。
[0081]例如,当通过使用TV实现的显示设备100采集到与用户的语音相关且包括与“何时播放OOO (广播节目名称)? ”相关的信息的信号时,第二服务器300可确定“何时播放000 (广播节目名称)? ”的话语意图与关于000 (广播节目名称)的广播时间的询问有关,并可基于确定的话语意图,以文本格式表示包括与“你询问的000(广播节目名称)的广播时间是O点(广播时间)”相关的信息的响应,并可将该响应发送到显示设备100。
[0082]在这种情况下,控制器150可将以文本格式表示的响应“你询问的000(广播节目名称)的广播时间是O点(广播时间)”转换为语音信号并可经由音频输出单元(未示出)输出该语音信号,或者可配置包括文本“你询问的000(广播节目名称)的广播时间是O点(广播时间)”的UI屏幕并可经由显示器(未示出)输出该UI屏幕。
[0083]如上所述,控制器150可执行与用户的语音相应的功能,或者可输出与用户的语音相应的系统响应。
[0084]当与用户的语音相关的信号包括与执行不可在显示设备100中执行的功能的意图相关的信息时,显示设备100可输出与用户的语音相应的系统响应而不执行单独的功會K。
[0085]例如,假设通过使用不支持视频通讯功能的TV实现显示设备100。在这种情况下,当显示设备100采集到与包括关于“请呼叫XXX”的信息的用户的语音相关的信号时,第二服务器300可将用于执行视频通讯功能的控制命令发送到显示设备100。然而,由于显示设备100不支持与该控制命令相应的功能,因此控制器150可不识别从第二服务器300接收到的该控制命令。在这种情况下,控制器150可以以语音信号和Π屏幕之中的至少一种格式输出包括与“不支持这个功能”相关的信息的系统响应。
[0086]尽管在上述示例性实施例中第二服务器300将文本格式的系统响应信息发送到显示设备100以使得显示设备100输出系统响应,但这仅是示例。
[0087]具体而言,第二服务器300可将构成将从显示设备100输出的系统响应的语音数据或者构成该系统响应的语音数据中的一些语音数据发送到显示设备100。此外,第二服务器300可将用于使用预先存储在显示设备100中的数据来输出系统响应的控制命令发送到显示设备100。
[0088]因此,控制器150可进行控制以基于从第二服务器200接收到的响应信息的格式输出系统响应。
[0089]具体地,当构成系统响应的语音数据或所述语音数据中的一些语音数据被接收到时,控制器150可将数据处理为可由输出单元110输出的格式,并可以以语音信号和Π屏幕之中的至少一种格式输出该数据。
[0090]此外,基于用于通过使用预先存储在显示设备100中的数据来输出系统响应的控制命令,控制器150可从预先存储在显示设备100中的数据搜索与该控制命令匹配的数据,并可将搜索到的数据处理为语音信号和Π屏幕之中的至少一种格式,并输出该数据。为了实现这一点,显示设备100可存储用于提供系统响应和相关数据的UI屏幕。
[0091]例如,显示设备100可存储与完整的语句格式相关的数据,诸如,例如,“不支持这个功能”。
[0092]此外,显示设备100可存储构成系统响应的数据中的一些数据,诸如,例如与“你询问的〈广播节目名称 > 的播放时间是〈播放时间 >”相关的数据。在这种情况下,可从第二服务器300接收用于完成系统响应的信息。例如,控制器150可通过使用从第二服务器300接收到的广播节目名称或频道号来完成系统响应,并随后可以以语音信号和UI屏幕之中的至少一种格式输出系统响应,诸如,例如,“你询问的OOO(广播节目名称)的广播时间是O点”。
[0093]当用户的话语意图与显示设备100的功能的执行和对内容的搜索中的至少一个相关时,控制器150可输出关于与用户的话语意图相应的功能的执行和对内容的搜索中的至少一个的附加问题。在这种情况下,控制器150可使用从第二服务器300接收到的响应信息。
[0094]以下将参照图6A、图6B、图6C、图7A、图7B、图7C、图7D、图8A、图8B、图8C、图8D、图9A、图9B、图9C和图9D详细地对此进行描述。
[0095]图3是示出图2中所示的显示设备的详细配置的框图。参照图3,除了图2中示出的元件之外,显示设备100还可包括存储器160、接收器170、信号处理器180、远程控制信号接收器191、输入单元193和接口 195。这些元件可由控制器195控制。与图2中的那些元件相同的元件具有相同的功能,因此省略对其的冗余的描述。
[0096]存储器160是存储对于操作显示设备100来说可能是必要的各种程序中的任何一个或多个程序的存储介质,并可通过使用存储器和硬盘驱动器(HDD)来实现。例如,存储器160可包括ROM和RAM,其中,ROM用于存储用于执行操作的程序,RAM用于临时存储由于操作的执行而产生的数据。存储器160还可包括用于存储各种参考数据的电可擦除和可编程ROM (EEPROM)。
[0097]接收器170接收各种内容。具体地,接收器170可经由广播网络从发送广播节目的广播站接收内容,或者通过使用互联网从发送内容文件的网络服务器接收内容。
[0098]在内容从广播站被接收的情况下,接收器170可包括调谐器(未示出)、解调器(未示出)和均衡器。相反,在内容从诸如例如网络服务器的源被接收的情况下,接收器170可通过使用网络接口卡被实现。
[0099]如上所述,根据示例性实施例,可以以各种形式中的任何一种或多种形式来实现接收器170。
[0100]信号处理器180对经由接收器170和接口 195中的至少一个接收到的内容执行信号处理功能,使得内容经由输出单元110被输出。
[0101]具体地,信号处理器180可通过对构成内容的图像执行至少一种信号处理功能(诸如解码、缩放和帧变换),将内容转换为可经由显示器111输出的格式。此外,信号处理器180可通过对构成内容的音频数据执行至少一种信号处理功能(诸如解码),将内容转换为可经由音频输出单元122输出的格式。
[0102]远程控制信号接收器191接收经由外部远程控制器输入的远程控制信号。控制器150可基于由远程控制信号接收器191接收到的远程控制信号来执行各种功能中的任何一个或更多个功能。例如,控制器150可基于由远程控制信号接收器191接收到的控制信号来执行诸如打开/关闭、改变频道和控制音量的功能。
[0103]输入单元193接收各种用户命令。控制器150可执行与输入到输入单元193的用户命令相应的功能。例如,控制器150可基于输入到输入单元193的用户命令来执行诸如打开/关闭、改变频道和控制音量的功能。
[0104]为实现这一点,可通过使用输入面板来实现输入单元193。输入面板可以是触摸板、键盘和触摸屏幕之中的至少一个,其中,所述键盘配备有各种功能键、数字键、专用键和字符键。
[0105]接口 195与外部设备(未示出)进行通信。可通过使用各种类型的电子设备中的任何一个或多个来实现外部设备(未示出)。
[0106]例如,如果显示设备100通过使用TV来实现,则可通过使用连接到显示设备100并执行它们各自的功能的各种类型的电子设备(诸如,机顶盒、声音设备、游戏机、DVD播放器和蓝光盘播放器)中的任何一个或多个来实现外部设备(未示出)。
[0107]例如,接口 195可通过使用有线通信方法(诸如,例如HDMI或USB)或无线通信方法(诸如,例如蓝牙或Zigbee)来与外部设备(未示出)进行通信。为实现这一点,接口195可包括与每个通信方法相应的芯片和/或输入端口。例如,在接口 195按照HDMI通信方法与外部设备(未示出)进行通信的情况下,接口 195可包括HDMI端口。
[0108]控制器150可将用户偏好信息存储在存储器160中。用户偏好信息可包括与用户已经频繁观看过的广播节目相关的信息。
[0109]具体地,每当通电命令或频道改变命令被接收到时,控制器150可基于电子节目指南(EPG)信息来确定经由接收器170切换的频道上提供的广播节目,并可将与在通电命令和频道改变命令被接收到的时刻、确定的广播节目的标题、确定的广播节目的体裁、确定的广播节目的频道号和确定的广播节目的频道名称中的至少一个相关的信息存储在存储器160中。
[0110]控制器150可分析存储的信息,并可将用户已经观看超过预定次数的内容确定为用户已经频繁观看的广播节目。控制器150可将与用户已经频繁观看过的广播节目相关的信息存储在存储器160中,并且/或者可控制第二通信单元140将该信息发送到第二服务器 300。
[0111]尽管图3中示出了包括在显示设备100中的各种元件,但显示设备100不必包括所述元件,并且不限于这些元件。具体而言,可基于显示设备100的种类省略这些元件中的一些元件或添加新元件,或者可用其他元件来代替这些元件。
[0112]图4是示出图1的第一服务器的框图。如图4所示,第一服务器200包括通信单元210和控制器220。
[0113]通信单元210与显示设备100进行通信。具体地,通信单元210可从显示设备100接收与用户的语音相关的信号,并可将与用户的语音相关的文本信息发送到显示设备100。为实现这一点,通信单元210可包括各种通信模块中的任何一个或多个模块。
[0114]控制器220可控制第一服务器200的总体操作。具体而言,当从显示设备100接收到与用户的语音相关的信号时,控制器200可产生与用户的语音相应的文本信息,并可控制通信单元210将文本信息发送到显示设备100。
[0115]具体地,控制器220可通过使用语音到文本(STT)引擎来产生与用户的语音相应的文本信息。STT引擎是用于将语音信号转换为文本的模块,并可通过使用现有技术中公开的各种STT算法中的任何一种或多种算法来将语音信号转换为文本。
[0116]例如,控制器220通过从接收到的与用户的语音相关的信号检测由用户发出的语音的开始和结束,来确定语音部分。具体地,控制器220计算接收到的语音信号的能量,基于计算出的能量对语音信号的能量级进行分类,并通过使用动态编程来检测语音部分。控制器220可通过基于声学模型从检测到的语音部分检测音素(即,语音的最小单位)来产生音素数据,并可通过将隐马尔可夫模型(HMM)应用到产生的音素数据来将与用户的语音相关的信号转换为文本。
[0117]图5是示出图1的第二服务器的框图。如图5所示,第二服务器300包括通信单元310、存储器320和控制器330。
[0118]通信单元310与显示设备100进行通信。具体地,通信单元310可从显示设备100接收文本信息,并可将与文本信息相应的响应信息发送到显示设备100。为实现这一点,通信单元310可包括各种通信模块中的任何一个或多个模块。
[0119]存储器320存储用于产生与从显示设备100接收到的文本信息相应的响应信息的多种信息。
[0120]具体地,存储器320基于服务领域存储对话模式。可基于由用户发出的语音的主题将服务领域划分为例如“广播”、“视频点播(VOD) ”、“设备控制”、“应用管理”和“信息提供(天气、股票或新闻)”。然而,这仅是示例,并且可通过除了上述主题之外的各种主题来划分服务领域。上述主题可被整合。例如,与广播内容相关的广播服务领域和设备控制领域可构成单个领域。
[0121]更具体地,存储器320可包括用于每个服务领域的语料数据库。可通过存储示例语句和对示例语句的响应来实现语料数据库。
[0122]具体地,存储器320可存储用于每个服务领域的多个示例语句以及对示例语句中的每个语句的响应。此外,存储器320可用与解释示例语句相关的信息和与该示例语句相应的响应来标记每个示例语句,并可存储标记后的示例语句。
[0123]例如,假设示例语句“何时播放000(广播节目名称)? ”被存储用于广播服务领域。
[0124]在这种情况下,存储器320可将与解释示例语句“何时播放000(广播节目名称)? ”相关的信息标记在相应的示例语句上,并可存储该示例语句。具体地,存储器320可用指示“ OOO (广播节目名称)”表示广播节目名称的信息、指示“何时”表示对广播时间的询问的信息以及指示“ ? ”表示示例语句是问句的信息,来对示例语句“000 (广播节目名称)何时播放? ”进行标记,并可存储标记后的示例语句。此外,存储器320可用指示在诸如例如“何时播放?? ”的格式的句子之后需要广播节目相关词语的信息来标记示例语句,并可存储标记后的示例语句。广播节目相关词语可包括广播节目名称、演员表和导演中的至少一个。
[0125]存储器320可将对“何时播放000(广播节目名称)? ”的响应标记在相应的示例语句上,并可存储标记后的示例语句。具体而言,存储器320可将“你询问的〈广播节目名称 > 的广播时间是〈广播时间 >”标记在示例语句上,作为对“何时播放000 (广播节目名称)? ”的响应,并可存储标记后的示例语句。
[0126]作为另一示例,假设示例语句“请切换到号0(频道号)”被存储用于设备控制服务领域。
[0127]在这种情况下,存储器320可将与解释示例语句“请切换到号0(频道号)”相关的信息标记在相应的示例语句上,并可存储标记后的示例语句。具体地,存储器320可用指示“号0(频道号)”表示频道号的信息、指示“切换到”表示频道调整命令的信息以及指示“请”表示示例语句的类型是请求语句的信息,来标记示例语句“请切换到号O(频道号)”,并可存储标记后的示例语句。此外,存储器320可用指示在具有诸如例如“请收看?”的格式的示例语句之后需要广播节目相关词语的信息来标记示例语句,并可存储标记后的示例语句。广播节目相关词语可以是频道号、频道名称、广播节目名称、演员表和导演中的至少—个°
[0128]作为另一示例,存储器320可为每个服务领域存储诸如“是”、“好的”、“否”和“不行”的示例语句。在这种情况下,存储器320可用指示
与解释每个示例语句相关的信息来标记每个示例语句,并可存储标记后的示例语句。
[0129]具体而言,存储器320可用指示“是”和“好的”是肯定的语句并且“否”和“不行”是否定的语句的信息来标记示例语句,并可存储标记后的示例语句。
[0130]此外,存储器320可将用于控制显示设备100的控制命令标记在每个示例语句上,并可存储标记后的示例语句。具体而言,存储器320可用用于控制显示设备100的控制命令来标记与用于控制显示设备100的用户的语音相应的示例语句,并可存储标记后的示例语句。例如,存储器320可用用于将显示设备100的频道改变到号O的控制命令来标记示例语句“请切换到号O (频道号)”,并可存储标记后的示例语句。这里公开的控制命令可以是脚本格式的系统命令。
[0131]对示例语句的响应可包括附加问题。在这种情况下,存储器320可用附加问题的意思来标记每个附加问题,并可存储标记后的附加问题,并且可用用于控制显示设备100的控制命令来标记附加问题,并可存储标记后的附加问题。
[0132]例如,假设示例语句“初始化设置”被存储用于设备控制领域。
[0133]在这种情况下,存储器320可用与解释示例语句“初始化设置”相关的信息来标记示例语句,并可存储标记后的示例语句。具体而言,存储器320可用指示以下内容的信息来标记示例语句“初始化设置”并可存储标记后的示例语句:“设置”表示显示设备100的设置状态、“初始化”是与初始化显示设备100的设置状态相关的请求以及示例语句的类型是请求语句。
[0134]此外,存储器320可用附加问题“你想要初始化所有设置? ”来标记示例语句“初始化设置”,并可存储标记后的示例语句。此外,存储器320可存储指示“你想要初始化所有设置? ”的意思是询问是否初始化显示设备100的所有设置状态的信息,并可用用于初始化显示设备100的所有设置状态的控制命令来标记示例语句。
[0135]作为另一示例,假设示例语句“请适当地调高音量”被存储用于设备控制领域。
[0136]在这种情况下,存储器320可用与解释示例语句“请适当地调高音量”相关的信息来标记示例语句,并可存储标记后的示例语句。具体地,存储器320可用以下信息来标记示例语句“请适当地调高音量”并可存储标记后的示例语句:指示“音量”表示显示设备100的音量的信息、指示“调高”和“适当地”表示将音量增大到预定音量级(例如,10)的请求的信息、以及指示“请”表示示例语句的类型是请求语句的信息。
[0137]存储器320可用用于将显示设备100的音量增大到预定音量级(例如,10)的控制命令来标记示例语句“请适当地调高音量”,并可存储标记后的示例语句。
[0138]存储器320可用诸如例如“音量已被调节到10,可以吗? ”的附加问题来标记示例语句“请适当地调高音量”,并可存储标记后的示例语句。存储器320可用问题“音量已被调节到10,可以吗? ”的意思来标记附加问题,并可存储标记后的附加问题。具体地,存储器320可存储指示以下内容的信息:问题“音量已被调节到10,可以吗? ”的意思是要询问是否同意显示设备100的音量已被增加到10。
[0139]如上所述,存储器320可存储示例语句、响应和附加问题。在这种情况下,存储器320可基于构成示例语句、响应和附加问题的每个词语的意思和属性,用与解释示例语句相关的信息以及附加问题的意思来标记示例语句、响应和附加问题。
[0140]此外,存储器320可结合上述方法存储各种示例语句、对示例语句的各种响应以及与示例语句相关的各种附加问题。在这种情况下,存储器320可用用于控制显示设备100的控制命令来标记附加问题,并可存储标记后的附加问题。
[0141]例如,存储器320可存储诸如例如“我将停止观看TV(显示设备100的名称)”的示例语句用于设备控制领域,并可用与解释相应示例语句相关的信息以及诸如例如“你想要关闭电源? ”的附加问题来标记该示例语句,并可存储标记后的示例语句。此时,存储器320可存储指示附加问题“你想要关闭电源? ”的意思是要询问是否关闭显示设备100的电源的信息,并可存储用于关闭显示设备100的电源的控制命令。
[0142]作为另一示例,存储器320可存储诸如例如“我想观看TV(显示设备100的名称)直到O点为止”的示例语句用于设备控制领域,并可用与解释相应的示例语句相关的信息以及诸如例如“你想在O点停止观看TV ? ”的附加问题来标记该示例语句,并可存储标记后的示例语句。此时,存储器320可存储指示“你想在O点停止观看TV ? ”的意思与询问是否在O点关闭显示设备相关的信息,并可存储用于关闭显示设备100的电源的控制命令。
[0143]作为另一示例,存储器320可存储诸如例如“请设置O点的提醒”的示例语句用于设备控制领域,并可用与解释相应的示例语句相关的信息以及诸如例如“你应该首先设置当前时间。你想设置当前时间? ”的附加问题来标记该示例语句,并可存储标记后的示例语句。在这种情况下,存储器320可存储指示“你应该首先设置当前时间。你想设置当前时间? ”的意思是要询问是否设置显示设备的时间的信息,并可存储用于显示显示设备100的时间设置菜单的控制命令。
[0144]作为另一示例,存储器320可存储用于广播服务领域的诸如例如“000(广播节目名称)在00(日期)的什么时间开始? ”的示例语句以及与解释相应示例语句相关的信息。在这种情况下,存储器320可用指示在具有诸如例如“000(广播节目名称)在?的什么时间开始?”的格式的示例语句的中间需要广播日期相关词语(例如,现在或明天)或省略广播日期相关词语的信息来标记相应示例语句,并可存储标记后的示例语句。
[0145]在这种情况下,存储器320可用各种附加问题来标记示例语句“000(广播节目名称)在00(日期)的什么时间开始? ”。
[0146]首先,存储器320可用诸如例如“它在0(广播时间)点开始。你想要设置提醒? ”的附加问题来标记相应的示例语句,并可存储标记后的示例语句。在这种情况下,存储器320可存储指示“它在0(广播时间)点开始。你想要设置提醒? ”的意思是要询问是否设置000(广播节目名称)的提醒的信息,并可存储用于设置O点的显示设备100的提醒的控制命令。
[0147]在这种情况下,存储器320可用诸如例如“你想要安排记录? ”的另一附加问题来标记附加问题“它在0(广播时间)点开始。你想要设置提醒?”,并可存储标记后的语句。在这种情况下,存储器320可存储指示“你要用安排记录? ”的意思是要询问是否安排对000 (广播节目名称)的记录的信息,并可存储用于控制显示设备100安排000 (广播节目名称)的记录的控制命令。
[0148]其次,存储器320可用诸如例如“今天不播放000。你想要我找出它何时播放? ”的附加问题来标记相应的示例语句,并可存储标记后的示例语句。在这种情况下,存储器320可存储指示“今天不播放000。你想要我找出它何时播放? ”的意思是要询问是否搜索000(广播节目名称)的广播时间的信息。在这种情况下,存储器320可响应于与响应于该附加问题接收到的用户的语音相关的信号,用诸如例如“000 (广播节目名称)的广播时间是〈广播时间 >”的响应来标记示例语句,并可存储标记后的示例语句。
[0149]第三,存储器320可用诸如例如“今天不播放000。你想要我找到另一广播节目?”的附加问题来标记相应的示例语句,并可存储标记后的示例语句。在这种情况下,存储器320可存储指示“今天不播放000。你想要我找到另一广播节目? ”的意思是要询问是否搜索与000(广播节目名称)的体裁相同的另一节目的广播时间的信息。在这种情况下,存储器320可使用诸如例如“〈广播节目名称 > 将在〈广播时间 > 播放”的响应作为对与响应于附加问题接收到的用户的语音相关的信号的响应,来标记相应的示例语句。
[0150]第四,存储器320可用诸如例如“它在00(小时)前已经开始。你想要改变频道? ”的附加问题来标记相应的示例语句,并可存储标记的示例语句。在这种情况下,存储器320可存储指示“它在00(小时)前已经开始。你想要改变频道?”的意思是要询问是否将频道改变到提供000 (广播节目名称)的频道的信息,并可存储用于控制显示设备100将频道改变到提供000 (广播节目名称)的频道的控制命令。
[0151]如上所述,存储器320可用多个附加问题来标记一个示例语句,并可存储标记后的示例语句。
[0152]作为另一示例,存储器320可存储诸如例如“从什么年龄开始的儿童允许观看000 (广播节目名称)? ”的示例语句用于设备控制领域,并可用与解释相应的示例语句相关的信息以及附加问题“年龄在0(年龄)或以上的人允许观看它。你想要观看它?”来标记该示例语句,并可存储标记后的示例语句。在这种情况下,存储器320可存储指示“年龄在0(年龄)或以上的人允许观看它。你想要观看它? ”的意思是要询问是否将频道改变到提供000(广播节目名称)的频道的信息,并可存储用于控制显示设备100将频道改变到提供000 (广播节目名称)的频道的控制命令。
[0153]作为另一示例,存储器320可存储诸如例如“谁是000(广播节目名称)的导演? ”的示例语句,并可用与解释示例语句相关的信息以及诸如例如“导演是000(导演的姓名)。你想要我找出由000导演的其他作品? ”的附加问题来标记该示例语句,并可存储标记后的示例语句。在这种情况下,存储器320可存储指示“导演是000(导演的姓名)。你想要我找出由000导演的其他作品? ”的意思是要询问是否搜索由000(导演的姓名)导演的广播节目的信息。此外,存储器320可用响应“〈广播节目名称〉”来标记示例语句,其中,响应“〈广播节目名称〉”作为对与响应于该附加问题接收到的用户的语音相关的信号的响应。
[0154]作为另一示例,存储器320可存储诸如例如“请让我知道000(广播节目名称)何时开始”的示例语句用于广播服务领域,并可用与解释该示例语句相关的信息以及诸如例如“000(广播节目名称)现在开始。你想要改变频道? ”的附加问题来标记该示例语句,并可存储标记后的示例语句。在这种情况下,存储器320可存储指示“000(广播节目名称)现在开始。你想要改变频道? ”的意思是要询问是否将频道改变到提供000(广播节目名称)的频道的信息,并可存储用于控制显示设备将频道改变到提供000 (广播节目名称)的频道的控制命令。
[0155]作为另一示例,存储器320可存储诸如例如“请在000( —周当中的一天)切换到我最喜欢的节目之一”的示例语句用于广播服务领域,并可用与解释该示例语句相关的信息以及诸如例如“000(广播节目名称)将在0(广播时间)播放。你想要设置提醒? ”和“000(广播节目)正在播放。你先要改变频道? ”的附加问题来标记该示例语句,并可存储标记后的示例语句。
[0156]在这种情况下,存储器320可存储指示“000 (广播节目名称)将在O (广播时间)播放。你想要设置提醒? ”的意思是要询问是否为000(广播节目名称)设置提醒的信息,并可存储用于控制显示设备100设置O点的提醒的控制命令。此外,存储器320可存储指示“000(广播节目)正在播放。你想要改变频道? ”的意思是要询问是否将频道改变到提供000(广播名称)的频道的信息,并可存储用于将显示设备100的频道改变到提供000(广播节目)的频道的控制命令。
[0157]作为另一示例,存储器320可存储诸如例如“00(体裁)现在在00(频道名称)上? ”的示例语句用于广播服务领域,并可用与解释该示例语句相关的信息以及诸如例如“〈广播节目 > 现在在00(频道名称)上。你想要找到00(体裁)? ”的附加问题来标记该示例语句。在这种情况下,存储器320可存储指示“〈广播节目 > 现在在00(频道名称)上。你想要找到00(体裁)? ”的意思是要询问是否搜索00(体裁)的广播节目的信息。
[0158]作为另一示例,存储器320可存储诸如例如“请为我显示记录的广播节目的名称的列表”的示例语句,并可用与解释该示例语句相关的信息以及诸如例如“记录的广播节目如下。你想要观看哪一个? ”的附加问题来标记该示例语句,并可存储标记后的示例语句。在这种情况下,存储器320可存储指示“记录的广播节目如下。你想要观看哪一个? ”的意思是要询问用户想要观看记录的广播节目之中的哪一个的信息,并可存储用于输出来自于列表的第O个广播节目的控制命令。
[0159]作为另一示例,存储器320可存储诸如例如“为什么000(广播节目名称)如此无聊? ”的示例语句用于广播服务领域,并可用与解释该示例语句相关的信息以及诸如例如“它可能因为刚刚开始是无聊的。你想要改变频道? ”的附加问题来标记该示例语句,并可存储标记后的示例语句。在这种情况下,存储器320可存储指示“它可能因为刚刚开始是无聊的。你想要改变频道? ”的意思是要询问是否改变频道的信息,并可存储用于控制显示设备100将频道改变到O(频道号)的控制命令。
[0160]如上所述,存储器320可存储各种示例语句、响应和附加问题中的任何一个或更多个。
[0161]控制器330控制第二服务器300的整体操作。具体而言,当从显示设备100接收到与用户语音相应的文本信息时,控制器330可产生与接收到的文本信息相应的响应信息,并可控制通信单元310将产生的响应信息发送到显示设备100。
[0162]具体地,控制器330分析文本信息并确定包括在与用户的语音相关的信号中的话语意图,并且产生与确定的话语意图相应的响应信息并控制通信单元310将响应信息发送到显示设备100。
[0163]为此,控制器330检测包含与接收到的文本信息相匹配的对话模式的语料数据库,并可确定与用户的语音相关的信号所属的服务领域。
[0164]具体地,控制器330将接收到的文本信息与为每个服务领域存储的示例语句进行比较,并将与接收到的文本信息相匹配的示例语句所属的服务领域确定为与用户的语音相关的信号所属的服务领域。
[0165]例如,当从显示设备100接收到诸如例如“何时播放000(广播节目名称)? ”、“请切换到号O (频道号)”或“请适当地调高音量”的文本时,控制器320确定与由显示设备100采集到的用户的语音相关的信号属于广播服务领域。然而,这仅是示例。当接收到与存储在存储器320中的各种示例语句中的任何示例语句相匹配的文本信息时,控制器320可确定与用户的语音相关的信号属于匹配的示例语句所在的各自的服务领域。
[0166]如果不存在与接收到的文本信息相匹配的示例语句,则控制器330可统计地确定与用户的语音相关的信号所属的领域。
[0167]例如,假设显示设备100采集到与用户的语音相关且包括与“请你切换到号0(频道号)? ”相关的信息的信号,并将与采集到的关于用户的语音的信号相应的文本发送到第二服务器300。在这种情况下,控制器330使用分类模型(诸如,隐马尔可夫模型(HMM)、条件随机场(CRF)和支持向量机(SVM))确定与用户的语音相关的信号与“请切换到号O”统计学上相似,并确定“请你切换到号0(频道号)?”属于广播服务领域。然而,这仅是示例,并且控制器330可通过确定包括在与用户的语音相关的信号中的信息是否与存储在存储器320中的各种示例语句中的任何示例语句统计学上相似,来确定与用户的语音相关的信号属于哪一个领域。
[0168]控制器330基于与用户的语音相关的信号所属的服务领域,从与用户的语音相关的信号提取对话行为、主要动作和成分槽(component slot)(或对象名称)。
[0169]对话行为是与语句的类型相关的分类参考,并指示用户的语音中使用的是陈述、请求和问题之中的哪种类型的语句。
[0170]主要动作是指示在基于对话的特定领域中相应的话语所期望的动作的有意义信息。例如,广播服务领域中的主要动作可包括打开/关闭TV、找到广播节目、找到广播节目时间和安排广播节目的记录中的至少一个。作为另一示例,设备控制领域中的主要动作可包括打开/关闭设备、重放和暂停中的至少一个。
[0171]成分槽是与出现在话语中的特定领域相关的对象信息,具体而言,是与指定特定领域想要的动作的意思相关的附加信息。
[0172]例如,广播服务领域中的成分槽可包括体裁、广播节目名称、广播时间、频道号、频道名称、演员表和制作者中的至少一个,设备控制领域中的成分槽可包括外部设备的名称和生产商中的至少一个。
[0173]控制器330通过使用提取出的对话行为、主要动作和成分槽来确定包括在与用
户的语音相关的信号中的话语意图,产生与确定的话语意图相应的响应信息,并可将响应信息发送到显示设备100。
[0174]这里公开的响应信息可包括用于控制显示设备100执行特定功能的控制命令。为此,控制器330可控制将标记在已被确定为与用户的语音相匹配的示例语句上的控制命令发送到显示设备100。此外,控制器330可产生与确定的话语意图相应的控制命令,并可控制将产生的控制命令发送到显示设备100。
[0175]响应信息可包括与从显示设备100输出的系统响应相关的系统响应信息。为此,控制器330可从存储器320提取与确定的会话意图相关的响应和附加问题,可将提取出的响应和附加问题转换为文本,并可将文本发送到显示设备100。具体而言,控制器330可提取标记在与用户的语音相匹配的示例语句上的响应和附加问题,可将提取出的响应和附加问题转换为文本,并可将文本发送到显示设备100。
[0176]在这种情况下,控制器330可进行控制以将用于控制显示设备100输出系统响应的控制命令发送到显示设备100。
[0177]在下文中,将详细描述可由控制器330执行的用于产生与用户的语音相应的响应信息的方法。
[0178]首先,控制器330使用标记在与用户的语音匹配的示例语句或被确定为统计学上与用户的语音相似的示例语句上的信息,从与用户的语音相关的信号提取对话行为、主要动作和成分槽,产生与用户的语音相应的响应信息,并将响应信息发送到显示设备100。
[0179]例如,假设从显示设备100接收到文本“何时播放OOO(广播节目名称)? ”。
[0180]在这种情况下,控制器330确定接收到的文本属于广播服务领域,使用标记在与接收到的广播服务领域中的文本相匹配的示例语句“何时播放000(广播节目名称)? ”上的信息,从与用户的语音相关的信号提取对话行为、主要动作和成分槽,并产生相应的响应信息。
[0181]具体而言,指示以下内容的信息可作为与解释存储在广播服务领域中的示例语句“何时播放000 (广播节目名称)? ”相关的信息而被标记在示例语句上:“000(广播节目名称)”表示广播节目、“何时”表示对广播时间的询问以及“ ? ”表示示例语句的类型是问题。
[0182]因此,参照标记在示例语句上的信息,控制器330可确定从显示设备100接收到的文本“何时播放000(广播节目名称)? ”的对话行为是问题、主要动作是询问广播时间以及成分槽是000 (广播节目时间)。因此,控制器330可确定用户的话语意图与询问000的广播时间相关。
[0183]此外,控制器330可从存储器320搜索被标记在存储于广播服务领域中的示例语句“何时播放000(广播节目名称)? ”上的响应,并可通过使用标记的响应来产生响应信息。
[0184]具体而言,控制器330可搜索标记在存储于广播服务领域中的示例语句“何时播放000 (广播节目名称)? ”上的诸如例如“你询问的〈广播节目名称〉的广播时间是〈广播时间 >”的响应,作为对用户的语音的响应。
[0185]在这种情况下,控制器330填写包括在搜索出的响应中的空白,并产生完整的语句。
[0186]例如,控制器330可在响应“你询问的〈广播节目名称〉的广播时间是〈广播时间>”中的空白〈广播节目名称〉中输入“000(广播节目名称)”。控制器330可从EPG信息搜索“000 (广播节目名称)”的广播时间,并可在另一空白〈广播时间 > 中输入搜索出的广播时间。因此,控制器330可通过以文本格式表示完整的语句“你询问的000 (广播节目名称)的广播时间是星期六的0(广播时间)点”来产生响应信息,并可将产生的响应信息发送到显示设备100。
[0187]因此,显示设备100可基于从第二服务器300接收到的响应信息,以语音信号和Π屏幕之中的至少一种格式输出“你询问的000 (广播节目名称)的广播时间是星期六7点”。
[0188]作为另一示例,假设从显示设备100接收到文本“请切换到号0(频道号)”。
[0189]在这种情况下,控制器330可确定接收到的文本属于广播服务领域,并可通过使用标记在与接收到的广播服务领域中的文本“请切换到号0(频道号)”相匹配的示例语句上的信息,来从与用户的语音相关的信号提取对话行为、主要动作和成分槽,并可产生相应的响应信息。
[0190]具体而言,指示以下内容的信息作为与解释存储在广播服务领域中的示例语句“请切换到号O(频道号)”相关的信息而被标记在该示例语句上:“号0(频道号)”表示频道号、“切换到”表示广播调整命令以及“请”表示示例语句是问题。因此,参照该信息,控制器330可确定从显示设备100接收到的文本“请切换到号0(频道号)”的对话行为是请求,主要动作是广播调整命令以及成分槽是号0(频道号)。因此,控制器330可确定用户的话语意图与切换到号O的请求相关。
[0191]此外,控制器330可从存储器320搜索标记在存储于广播服务领域中的示例语句“请切换到号0(频道号)”上的控制命令,并可控制将搜索到的控制命令发送到显示设备100具体而言,控制器330可将用于将显示设备100的频道改变到号O的控制命令发送到显示设备100。
[0192]因此,显示设备100可基于从第二服务器300接收到的响应信息将频道改变到号O。
[0193]尽管在以上示例中控制器330基于标记在示例语句上的控制命令来产生用于执行显示设备100的功能的控制命令,但这仅是示例。
[0194]具体而言,控制器330可基于确定的话语意图产生控制命令,并可将控制命令发送到显示设备100。例如,当确定用户的话语意图与切换到号O的请求相关时,控制器330可产生用于将频道改变到号O的控制命令,并可将控制命令发送到显示设备100。
[0195]尽管在以上示例中控制器330将与输出系统响应相关的系统响应信息发送到显示设备,但这仅是示例。
[0196]具体而言,如果显示设备100预先存储了构成系统响应的数据,则控制器330可将用于输出相应数据的控制命令作为系统响应发送到显示设备100。此外,如果显示设备100预先存储可构成系统响应的数据中的一些数据,则控制器330可仅将与输出完整的系统响应相关的信息发送到显示设备100。
[0197]例如,如果显示设备100预先存储了诸如例如“你询问的〈广播节目名称〉的广播时间是〈广播时间 >”的响应,则控制器330可进行控制以将与用户询问的广播节目名称和广播时间相关的信息发送到显示设备100,使得显示设备100将存储的响应制作成完整的语句。在这种情况下,控制器330可将用于输出预先存储在显示设备100中的响应的单独的控制命令发送到显示设备100。
[0198]因此,显示设备100可在预先存储的响应中输入从第二服务器300接收到的信息,并可输出“你询问的OOO(广播节目名称)的广播时间是星期六的O点”作为系统响应。
[0199]尽管在以上示例性实施例中控制器330通过使用标记在上述示例语句上的信息来提取对话行为、主要动作和成分槽,但这仅是示例。具体而言,控制器330可通过使用最大熵分类器(MaxEnt)来从与用户的语音相关的信号提取对话行为和主要动作,并可通过使用条件随机场(CRF)来提取成分槽。
[0200]然而,这不应被视为限制。控制器330可通过使用各种已知方法中的任何一种或多种方法来从与用户的语音相关的信号提取对话行为、主要动作和成分槽。
[0201]如果在与确定的话语意图相应的响应信息产生时,基于确定的话语意图存在与用户的语音相应的附加问题,则控制器330可通过使用附加问题来产生响应信息。
[0202]当针对附加问题接收到与用户的语音相关的文本信息,则控制器330可基于附加问题产生与接收到的文本信息相应的响应信息,并可将响应信息发送到显示设备100。
[0203]在这种情况下,当控制器330不确定包括在当前接收到的与用户的语音相关的信号中的用户的话语意图时,控制器330可参考先前接收到的与用户的语音相关的信号来确定包括在当前接收到的与用户的语音相关的信号中的用户的话语意图。具体地,当控制器330基于先前接收到的与用户的语音相关的信号所属的服务领域,不确定包括在当前接收到的与用户的语音相关的信号中的用户的话语意图时,控制器330可参考先前接收到的与用户的语音相关的信号来确定包括在当前接收到的与用户的语音相关的信号中的用户的话语意图。
[0204]具体地,当用户的话语意图与显示设备100的功能的执行相关时,控制器330可产生与确认是否执行显示设备100的功能相关的附加问题,并可将与在显示设备100上输出附加问题相关的响应信息发送到显示设备100。在这种情况下,控制器330可确定标记在与用户的语音相匹配的示例语句上的附加问题,可产生与输出附加问题相关的响应信息,并可将响应信息发送到显示设备100。
[0205]例如,当确定直接执行与用户的语音(诸如,例如“我将停止观看TV”、“我想要观看TV直到10点为止”或“初始化设置”)相应的功能存在风险时,控制器330可产生与输出附加问题相关的响应信息作为系统响应,并可将响应信息发送到显示设备100。
[0206]在下文中,假设从显示设备100接收到与“我将停止观看TV”、“我想要观看TV直到10点为止”或“初始化设置”相应的文本信息。
[0207]在这种情况下,使用存储在存储器320中的示例语句以及与解释示例语句相关的信息,控制器330可确定:“我将停止观看TV”的话语意图与关闭显示设备100的电源的请求相关,并且“我想要观看TV直到10点为止”的话语意图与在10点关闭显示设备100的电源的请求相关。此外,通过使用存储的示例语句以及与解释示例语句相关的信息,控制器330可确定“初始化设置”的话语意图与初始化显示设备100的设置状态的请求相关。
[0208]然而,由于关闭显示设备100的电源或者初始化显示设备100的设置状态存在风险,因此控制器330可在发送用于执行相应功能的控制命令之前产生与输出附加问题相关的响应信息,并可发送响应信息。
[0209]具体地,控制器330可以以文本格式表示标记在“我将停止观看TV”上的附加问题“你想要关闭电源? ”、标记在“我想要观看TV直到10点为止”上的附加问题“你想要在10点停止观看TV ? ”或标记在“初始化设置”上的附加问题“你想要初始化所有设置? ”,并可将附件问题发送到显示设备100。因此,显示设备100可基于从第二服务器300接收到的响应信息,将“你想要关闭电源? ”、“你想要在10点停止观看TV ? ”或“你想要初始化所有设置? ”输出为语音信号,或者可输出包括“你想要关闭电源? ”、“你想要在10点停止观看TV ? ”或“你想要初始化所有设置? ”的UI屏幕。
[0210]随后,控制器330可基于与响应于附加问题接收到的用户的语音相关的信号,将用于控制显示设备100的功能的控制命令发送到显示设备100。在这种情况下,控制器330可基于附加问题的意思确定接收到的与用户的语音相关的信号的话语意图,并可将标记在附加问题上的控制命令发送到显示设备,使得显示设备100的功能被控制。
[0211]例如,当响应于附加问题“你想要关闭电源? ”接收到诸如例如“是”的文本信息,则控制器330可确定话语意图与关闭显示设备100的电源的请求相关,并可将用于关闭显示设备100的电源的控制命令发送到显示设备100。因此,显示设备100可基于从第二服务器300接收到的响应信息,关闭显示设备100的电源。
[0212]作为另一示例,当响应于附加问题“你想要在10点停止观看TV ? ”接收到诸如例如“是”的文本信息时,控制器330可确定话语意图与在10点关闭显示设备100的电源的请求相关,并可将用于在10点关闭显示设备100的电源的控制命令发送到显示设备100。因此,显示设备100可基于从第二服务器300接收到的响应信息在10点关闭电源。
[0213]作为另一示例,当响应于附加问题“你想要初始化所有设置? ”接收到诸如例如“是”的文本信息时,控制器330可确定话语意图与初始化显示设备100的所有设置状态的请求相关,并可将用于初始化显示设备100的所有设置状态的控制命令发送到显示设备100。因此,显示设备100可基于从第二服务器300接收到的响应信息初始化所有设置状态。
[0214]当确定用户任意量化了模棱两可的语音(诸如,例如“适当地调高音量”)时,控制器330可产生与输出附加问题相关的响应信息作为系统响应,并可将响应信息发送到显示设备100。
[0215]具体地,当从显示设备接收到与“适当地调高音量”相应的文本信息时,控制器330可通过使用存储在存储器320中的示例语句以及与解释相应示例语句相关的信息,确定“适当地调高音量”的话语意图与将音量调高到预定音量级(例如,10)的请求相关,并可将用于将显示设备100的音量增大到预定音量级(例如,10)的控制命令发送到显示设备100。因此,显示设备100可基于从第二服务器300接收到的响应信息,将音量增大到预定音量级(例如,10)。
[0216]控制器330可以以文本格式表示与确认用户是否想要将音量调高到预定音量级相关的附加问题(诸如,例如“音量已被调节大到10,可以吗? ”),并可将附加问题发送到显示设备100。随后,当诸如例如“是”的文本信息被接收到时,控制器330可确定话语意图与对调节后的音量级10令人满意的确认相关。
[0217]相反,当用户的话语意图与显示设备100的功能的执行相关(其中,在执行显示设备的该功能之前需要执行先前功能)时,控制器330可产生与先前功能相关的附加问题,并可将与在显示设备100上输出附加问题相关的响应信息发送到显示设备100。
[0218]例如,当在响应于“请设置O点(点钟)的提醒”设置提醒之前有必要执行设置当前时间的先前功能时,控制器3 3 O可产生与输出附加问题相关的响应信息作为系统响应,并可将响应信息发送到显示设备100。
[0219]具体地,当从显示设备100接收到与“请设置O点(点钟)的提醒”相应的文本信息时,控制器330可使用存储在存储器320中的示例语句以及与解释相应语句相关的信息,确定“请设置O点(点钟)的提醒”的话语意图与请求显示设备100设置O点(点钟)的提醒相关。
[0220]在这种情况下,控制器330可确定在设置提醒之前显示设备有必要设置当前的时间,并可以以文本格式表示附加问题(诸如,例如“你应该首先设置当前的时间。你想要设置当前的时间? ”),并可将附加问题发送到显示设备100。因此,显示设备100可基于从第二服务器300接收到的响应信息将“你应该首先设置当前的时间。你想要设置当前的时间? ”输出为语音信号,并可输出包括“你应该首先设置当前的时间。你想要设置当前的时间? ”的UI屏幕。
[0221]随后,当诸如例如“是”的文本信息被接收到时,控制器330可确定话语意图与设置显示设备100的时间的请求相关,并可将用于在显示设备100上显示时间设置菜单的控制命令发送到显示设备100。因此,显示设备200可基于从第二服务器300接收到的响应信息显示时间设置菜单。
[0222]另外,当用户的话语意图与对内容的搜索相关时,控制器330可产生基于对内容的搜索结果预期的附加问题和/或与搜索的可能的结果相关的附加问题,并可将与在显示设备100上输出附加问题相关的响应信息发送到显示设备100。
[0223]例如,当从显示设备100接收到与“何时开始000(广播节目名称)? ”相应的文本信息时,控制器330可通过使用存储在存储器320中的示例语句以及与解释相应示例语句相关信息,确定“何时开始000(广播节目名称)? ”的话语意图与搜索000(广播节目名称)的广播时间的请求相关。在这种情况下,控制器330可参考EPG信息搜索000(广播节目名称)的广播时间O,并可以以文本格式表示诸如例如“它在O点(广播时间)开始。你想要设置提醒? ”的附加问题,并可将附加问题发送到显示设备100。
[0224]因此,显示设备100可基于从第二服务器300接收到的响应信息将“它在O点(广播时间)开始。你想要设置提醒? ”输出为语音信号,或者可输出包括“它在O点(广播时间)开始。你想要设置提醒? ”的UI屏幕。
[0225]随后,当诸如例如“是”的文本信息被接收到时,控制器330可确定话语意图与设置O点(广播时间)的显示设备100的提醒的请求相关,并可将用于设置O点(广播时间)的显示设备100的提醒的控制命令发送到显示设备100。因此,显示设备100可基于从第二服务器300接收
到的响应信息设置O点的提醒。
[0226]然而,当诸如例如“否”的文本信息被接收到时,控制器330可确定话语意图与拒绝设置O点(广播时间)显示设备100的提醒相关。在这种情况下,控制器330可将与输出标记在附加问题上的另一附加问题相关的响应信息发送到显示设备100。例如,控制器330可以以文本格式表示标记在附加问题“它在O点(广播时间)开始。你想要设置提醒? ”上的诸如例如“需要安排记录? ”的另一附加问题,并可将该另一附加问题发送到显示设备100。因此,显示设备100可基于从第二服务器300接收到的响应信息将“需要安排记录? ”输出为语音信号,或者可输出包括“需要安排记录? ”的UI屏幕。
[0227]随后,当诸如例如“是”的文本信息被接收时,控制器330可确定话语意图与安排在O点(广播时间)记录的请求相关,并可将用于安排在O点(广播时间)开始的OOO (广播节目名称)的记录的控制命令发送到显示设备100。因此,显示设备100可基于从第二服务器300接收到的响应信息来安排在O点(广播时间)开始的000 (广播节目名称)的记录。
[0228]如上所述,当用户的话语意图与对特定广播节目的广播时间的询问相关并且一个特定的广播节目被相应地搜索时,控制器330可产生与设置提醒和安排记录相关的附加问题,并可将附加问题发送到显示设备100。
[0229]作为另一示例,当从显示设备100接收到诸如例如“今天何时开始000(广播节目)? ”的文本信息时,控制器330可通过使用存储在存储器320中的示例语句以及与解释相应示例语句相关的信息,确定“今天何时开始000(广播节目)? ”的话语意图与搜索今天的000(广播节目)的广播时间的请求相关。在这种情况下,控制器330可参考EPG信息查看000 (广播节目名称)是否在今天播放。
[0230]当作为查看结果确定000 (广播节目名称)将不在今天播放时,控制器330可以以文本格式表示诸如例如“000不在今天播放。你想要找出它何时播放? ”的附加问题,并可将附加问题发送到显示设备100。因此,显示设备100可基于从第二服务器300接收到的响应信息将“000不在今天播放。你想要找出它何时播放? ”输出为语音信号,或者可输出包括“000不在今天播放。你想要找出它何时播放? ”的UI屏幕。
[0231]随后,当诸如例如“是”的文本信息被接收到时,控制器330可确定话语意图与搜索在不同日期的000(广播节目名称)的广播时间的请求相关,并可参考EPG信息搜索000(广播节目名称)的广播时间。此外,控制器330可使用搜索到的广播时间以文本格式表示诸如例如“000(广播节目名称)的广播时间是O天的O点(广播时间)”的附加问题,并可将附加问题发送到显示设备100。因此,显示设备100可基于从第二服务器300接收到的响应信息,将“000(广播节目名称)的广播时间是O天的O点(广播时间)”输出为语音信号,或者可输出包括“000 (广播节目名称)的广播时间是O天的O点(广播时间)”的UI屏幕。
[0232]此外,当确定000(广播节目名称)将不在今天播放时,控制器330可以以文本格式表示诸如例如“000不在今天播放。你想要我找到另一广播节目? ”的附加问题,并可将附加问题发送到显示设备100。因此,显示设备100可基于从第二服务器300接收到的响应信息,将“000不在今天播放。你想要我找到另一广播节目? ”输出为语音信号,或者可输出包括“000不在今天播放。你想要我找到另一广播节目? ”的UI屏幕。
[0233]随后,当诸如例如“是”的文本信息被接收到时,控制器330可确定话语意图是否与搜索体裁与000 (广播节目名称)相同的广播节目的请求相关,可参考EPG信息搜索体裁与000 (广播节目名称)相同的广播节目,可以以文本格式表示诸如例如“ΛΛΛ将在Λ天的Λ点播放”的响应,并可将响应发送到显示设备100。因此,显示设备可基于从第二服务器300接收到的响应信息将“ΛΛΛ将在Λ天的Λ点播放”输出为语音信号,或者可输出包括“ΛΛΛ将在Λ天的Λ点播放”的UI屏幕。
[0234]如上所述,当对内容的搜索与询问第一特定内容的广播时间相关时,控制器330可产生与对第一特定内容的广播时间的搜索和对与第一特定内容相似的第二特定内容的搜索中的至少一个相关的附加问题,并可将附加问题发送到显示设备100。具体而言,当用户的话语意图与询问在指定的特定日期的特定广播节目相关时,控制器330可产生与对特定广播节目的广播时间的搜索和对与特定广播节目相似的广播节目的搜索中的至少一个相关的附加问题,并可将附加问题发送到显示设备100。
[0235]在这种情况下,控制器330可首先产生与对特定广播节目的广播时间的搜索相关的附加问题,并且当从显示设备100接收到具有否定意思的文本信息时,控制器330可产生与对相似广播节目的搜索相关的附加问题,并可将附加问题发送到显示设备100。
[0236]作为另一示例,当从显示设备100接收到与“何时开始000(广播节目)? ”相应的文本信息时,控制器330可确定“何时开始000(广播节目)? ”的话语意图与对000(广播节目名称)的广播时间的搜索的请求相关,并可参考EPG信息来搜索OOO (广播节目名称)的广播时间。当作为搜索结果确定000 (广播节目名称)正在播放时,控制器330可将诸如例如“它在00 (点钟)之前开始播放。你想要改变频道? ”的附加问题转换为文本格式,并可将该文本发送到显示设备100。
[0237]因此,显示设备100可基于从第二服务器300接收到的响应信息将“它在00 (点钟)之前开始播放。你想要改变频道? ”输出为语音信号,或者可输出包括“它在00(点钟)之前开始播放。你想要改变频道? ”的Π屏幕。
[0238]随后,当诸如例如“是”的文本信息被接收到时,控制器330可确定话语意图与将当前频道改变到提供000 (广播节目名称)的频道的请求相关,并可将用于将当前频道改变到提供000(广播节目名称)的频道的控制命令发送到显示设备100。因此,显示设备100可基于从第二服务器300接收到的响应信息将当前频道改变到提供000(广播节目名称)的频道。
[0239]如上所述,当对内容的搜索与对特定内容的广播时间的询问相关并且搜索的内容正在播放时,控制器330可产生与对是否将当前频道改变到提供特定内容的频道的询问相关的附加问题,并可将附加问题发送到显示设备100。
[0240]作为另一示例,当从显示设备100接收到与“从什么年龄开始的儿童允许观看000 (广播节目名称)? ”的文本信息时,控制器330可通过使用存储在存储器320中的示例语句以及与解释相应示例语句相关的信息,确定“从什么年龄开始的儿童允许观看000 (广播节目名称)? ”的话语意图与搜索000(广播节目名称)的等级的请求相关。在这种情况下,控制器330可参考EPG信息来搜索000 (广播节目名称)的等级,并可以以文本格式表示诸如例如“允许年龄0(岁)或以上的人观看广播节目。你想观看它? ”的附加问题,并可将附加问题发送到显示设备100。
[0241]因此,显示设备100可基于从服务器300接收到的响应信息将“允许年龄O (岁)或以上的人观看广播节目。你想观看它? ”输出为语音信号,或者可输出包括“允许年龄0(岁)或以上的人观看广播节目。你想观看它? ”的Π屏幕。
[0242]随后,当诸如例如“是”的文本信息被接收到时,控制器330可确定话语意图与将当前频道改变到提供000 (广播节目名称)的频道的请求相关,并可将用于将频道改变到提供000(广播节目名称)的频道的控制命令发送到显示设备100。因此,显示设备100可基于从第二服务器300接收到的响应信息将频道改变到提供000 (广播节目名称)的频道。
[0243]如上所述,当对内容的搜索与特定内容的等级有关时,控制器330可产生与询问是否将频道改变到提供特定内容的频道相关的附加问题,并可将附加问题发送到显示设备100具体而言,如果特定内容的等级指示19岁以下的青少年不能观看该特定内容,贝Ij控制器330可产生与对是否将频道改变到提供该特定内容的频道的询问相关的附加问题,并可将附加问题发送到显示设备100。
[0244]作为另一示例,当从显示设备100接收到与“谁是000(广播节目名称)的导演? ”的文本信息时,控制器330可通过使用存储在存储器320中的示例语句以及与解释相应示例语句相关的信息,确定“谁是000(广播节目名称)的导演? ”的话语意图与搜索000(广播节目名称)的导演的请求相关。在这种情况下,控制器330可参考EPG信息搜索000 (广播节目名称)的导演,可以以文本格式表示诸如例如“000(广播节目名称)的导演是000(搜索到的导演的姓名)。你想要找出由000导演的其他作品? ”的附加问题,并可将附加问题发送到显示设备100。因此,显示设备100可基于从第二服务器300接收到的响应信息将“000(广播节目名称)的导演是000(搜索到的导演的姓名)。你想要找出由000导演的其他作品? ”输出为语音信号,或者可输出包括“000(广播节目名称)的导演是000(搜索出的导演的姓名)。你想要找出由000导演的其他作品? ”的UI屏幕。
[0245]随后,当诸如例如“是”的文本信息被接收到时,控制器330可确定话语意图与搜索由000 (搜索到的导演的姓名)导演的广播节目的请求相关,并可参考EPG信息来搜索由000(搜索到的导演的姓名)导演的广播节目。此外,控制器330可以以文本格式表示诸如例如“ΛΛΛ (搜索到的广播节目名称)”的响应,并可将该响应发送到显示设备100。因此,显示设备100可基于从第二服务器300接收到的响应信息将“ΛΛΛ (搜索到的广播节目名称)”输出为语音信号,或者可输出包括“ΛΛΛ (搜索到的广播节目名称)”的UI屏蒂。
[0246]如上所述,当对内容的搜索与对和特定内容有关的人的搜索相关时,控制器330可产生与对是否搜索与这个人相关的另一内容的询问相关的附加问题,并可将附加问题发送到显示设备100。在这种情况下,如果基于话语意图搜索到一个人,则控制器330可产生与对是否搜索和这个人相关的另一内容的询问相关的附加问题,并可将附加问题发送到显示设备100。
[0247]作为另一示例,当从显示设备100接收到与“请让我知道000 (广播节目名称)何时开始”相应的文本信息时,控制器330可通过使用存储在存储器320中的示例语句以及与解释示例语句相关的信息,确定“请让我知道000(广播节目名称)何时开始”的话语意图与对搜索000(广播节目名称)的广播时间并设置提醒的请求相关。在这种情况下,控制器330可参考EPG信息来搜索000(广播节目名称)的广播时间,可在广播时间已经到来时以文本格式表示诸如例如“000(广播节目名称)开始。你想改变频道?”的附加问题,并可将附加问题发送到显示设备100。因此,显示设备100可基于从第二服务器300接收到的响应信息将“000(广播节目名称)开始。你想改变频道? ”输出为语音信号,或者可输出包括“000(广播节目名称)开始。你想改变频道? ”的Π屏幕。
[0248]随后,当诸如例如“是”的文本信息被接收到时,控制器330可确定话语意图与将频道改变到提供000(广播节目名称)的频道的请求相关,并可将用于将频道改变到提供000(广播节目名称)的频道的控制命令发送到显示设备100。因此,显示设备100可基于从第二服务器300接收到的响应信息来将频道改变到提供OOO (广播节目名称)的频道。
[0249]作为另一示例,当从显示设备100接收到与“请在000(天)切换到我最喜欢的广播节目之一”相应的文本信息时,控制器330可通过使用存储在存储器320中的示例语句以及与解释相应示例语句相关的信息,确定话语意图与搜索用户在000(天)频繁观看的广播节目的广播时间的请求相关。另外,与用户已经频繁观看的广播节目相关的信息(例如,广播节目名称)可被预先存储在存储器320中,或者可从显示设备100接收。
[0250]因此,控制器330可参考EPG信息来搜索用户已频繁观看的广播节目的广播时间,可将诸如例如“000(广播节目名称)将在0(广播时间)播放。你想设置提醒? ”的附加问题转换为文本格式,并可将附加问题发送到显示设备100。因此,显示设备100可基于从第二服务器300接收到的响应信息将“000 (广播节目名称)将在O (广播时间)播放。你想设置提醒? ”输出为语音信号,或者可输出包括“000(广播节目名称)将在O(广播时间)播放。你想设置提醒? ”的Π屏幕。
[0251]随后,当诸如例如“是”的文本信息被接收到时,控制器330可确定话语意图与设置000(广播节目名称)的提醒的请求相关,并可将用于设置000(广播节目名称)的提醒的控制命令发送到显示设备100。因此,显示设备100可基于从第二服务器300接收到的响应信息来设置000(广播节目名称)的提醒。
[0252]此外,控制器330可参考EPG信息来搜索用户已频繁观看的广播节目的广播时间,可将诸如例如“000(广播节目名称)正在播放。你想改变频道? ”的附加问题转换为文本格式,并可将附加问题发送到显示设备100。因此,显示设备100可基于从第二服务器300接收到的响应信息将“000(广播节目名称)正在播放。你想改变频道? ”输出为语音信号,并可输出包括“000(广播节目名称)正在播放。你想改变频道? ”的Π屏幕。
[0253]随后,当诸如例如“是”的文本信息被接收到时,控制器330可确定话语意图与将频道改变到提供000(广播节目名称)的频道的请求相关,并可将用于将频道改变到提供000(广播节目名称)的频道的控制命令发送到显示设备100。因此,显示设备100可基于从第二服务器300接收到的响应信息将频道改变到提供000 (广播节目名称)的频道。
[0254]如上所述,当对内容的搜索与对用户已频繁观看的内容的搜索相关时,控制器330可产生与询问是否设置提醒或改变频道相关的附加问题,并可将附加问题发送到显示设备100在这种情况下,控制器330可在搜索到的内容的广播时间已到关于当前时间的预定时间之内时产生与设置提醒相关的附加问题,或者可在内容正在播放时产生与改变频道相关的附加问题。
[0255]作为另一示例,当从显示设备100接收到与“在00(频道名称)上现在正在播放00(体裁)? ”相应的文本信息时,控制器330可通过使用存储在存储器320中的示例语句以及与解释相应示例语句相关的信息,确定“在00(频道名称)上现在正在播放00(体裁)?”的话语意图与询问00(体裁)的广播节目是否正在00(频道号)上播放相关。在这种情况下,控制器330可参考EPG信息确定00(体裁)的广播节目是否正在00(频道号)上播放。
[0256]当作为确定结果确定00 (体裁)的广播节目未在00 (频道名称)上播放时,控制器330可搜索正在00 (频道名称)上播放的广播节目,可以以文本格式表示诸如例如“000 (搜索到的广播节目名称)现在正在00(频道号)上播放。你想要我找到00(体裁)?”的附加问题,并可将附加问题发送到显示设备100。因此,显示设备100可基于从第二服务器300接收到的响应信息将“000 (搜索到的广播节目名称)现在正在00 (频道号)上播放。你想要我找到00(体裁)? ”输出为语音信号,或者可输出包括“000 (搜索到的广播节目名称)现在正在00(频道号)上播放。你想要我找到00(体裁)? ”的UI屏幕。
[0257]随后,当诸如例如“是”的文本信息被接收到时,控制器330可确定用户的话语意图与请求搜索00(体裁)的广播节目相关,并可参考EPG信息搜索00(体裁)的广播节目。控制器330可以以文本格式表示诸如例如“ΛΛΛ (另外搜索到的广播节目名称)”的响应,并可将响应发送到显示设备100。因此,显示设备100可基于从第二服务器300接收到的响应将“ΛΛΛ (另外搜索到的广播节目名称)”输出为语音信号,或者可输出包括"ΔΔΔ (另外搜索到的广播节目名称)”的UI屏幕。
[0258]如上所述,当用户的话语意图指示特定情况(具体而言,话语意图与对在指定时间在指定频道上的特定内容的搜索相关,但作为搜索结果未找到与话语意图相匹配的内容)时,控制器330可产生与执行对另一内容的另一搜索相关的附加问题,并可将附加问题发送到显示设备100。
[0259]作为另一示例,当从显示设备100接收到与“请为我显示记录的广播的列表”相应的文本信息时,控制器330可通过使用存储在存储器320中的示例语句以及与解释相应示例语句相关的信息,确定“请为我显示记录的广播的列表”的话语意图与请求输出记录的广播的列表相
关。控制器330可产生用于控制显示设备100输出记录的广播节目的列表的控制命令,并可以以文本格式表示诸如例如“记录的广播节目如下。你想要观看哪一个? ”的附加问题,并可将附加问题发送到显示设备100。因此,显示设备100可基于从第二服务器300接收到的响应信息将“记录的广播节目如下。你想要观看哪一个? ”输出为语音信号,或者可输出包括“记录的广播节目如下。你想要观看哪一个? ”的Π屏幕。此外,显示设备100可输出记录的广播节目的列表。
[0260]随后,当诸如例如“第三”的文本信息被接收到时,控制器330可确定话语意图与请求重放列表中的第三个广播节目相关,并可将用于重放列表中的第三个广播节目的控制命令发送到显示设备100。因此,显示设备100可基于从第二服务器300接收到的响应信息来重放记录的广播节目列表中的第三个广播节目。
[0261]作为另一示例,当从显示设备100接收到与“为什么000(广播节目名称)如此无聊? ”相应的文本信息时,控制器330可通过使用存储在存储器320中的示例语句以及与解释相应示例语句相关的信息,确定“为什么000(广播节目名称)如此无聊? ”的话语意图与将频道改变到另一广播节目相关。在这种情况下,控制器330可将诸如例如“它可能因为刚刚开始是无聊的。你想改变频道? ”的附加问题转换为文本格式,并可将附加问题发送到显示设备100。因此,显示设备100可基于从第二服务器300接收到的响应信息,将“它可能因为刚刚开始是无聊的。你想改变频道? ”输出为语音信号,或者可输出包括“它可能因为刚刚开始是无聊的。你想改变频道? ”的UI屏幕。
[0262]随后,当与“请将频道改变到号O (频道号)”相应的文本信息被接收到时,控制器330可确定话语意图与将频道改变到号O (频道号)相关,并可将用于将频道改变到号O (频道号)的控制命令发送到显示设备100。因此,显示设备100可基于从第二服务器300接收到的响应信息将频道改变到号0(频道号)。
[0263]如上所述,当用户清楚地识别出他或她正在观看什么广播节目时,控制器330可产生与询问是否观看另一广播节目相关的附加问题,并可将附加问题发送到显示设备100。在这种情况下,如果用户当前正在观看的广播节目未被播放达广播节目的总运行时间的预定暂停时间量时,控制器330可产生上述附加问题,并可将附加问题发送到显示设备100。
[0264]如上所述,第二服务器300可基于对用户的话语意图的确定来产生附加问题,可将附加问题发送到显示设备100,并且显示设备100可输出从第二服务器300接收到的附加问题作为系统响应。第二服务器300可分析包括在对于附加问题的用户的语音中的话语意图,并可执行与话语意图相应的功能,或者可控制显示设备100执行与话语意图相应的功會K。
[0265]尽管在上述示例性实施例中第二服务器300以文本格式表示对用户的语音的响应以及附加问题并将响应和附加问题发送到显示设备100,但这仅是示例。第二服务器300可将与对用户语音的响应相关的信息以及附加问题发送到显示设备100,使得显示设备100以各种形式中的任何一种或多种形式输出系统响应。
[0266]在下文中,将参照图6A、图6B、图6C、图7A、图7B、图7C、图7D、图8A、图8B、图8C、图8D、图9A、图9B、图9C和图9D描述各种示例性实施例。图6A、图6B、图6C、图7A、图7B、图7C、图7D、图8A、图8B、图8C、图8D、图9A、图9B、图9C和图9D是示出显示设备100基于用户的话语意图输出附加问题作为系统响应的各种示例的示图。
[0267]首先,当用户的话语意图与显示设备100的功能的执行相关时,系统响应可包括与确认是否执行该功能相关的附加问题。
[0268]例如,假设如图6A所示用户说出“初始化设置”。在这种情况下,控制器150可基于从第二服务器300接收到的响应信息输出包括“你想初始化所有设置? ”的UI屏幕610,如图6B所示。
[0269]随后,当如图6C所示用户说出“是”时,控制器150可基于从第二服务器300接收到的响应信息来初始化显示设备100的所有设置。所述设置可包括可在显示设备100中设置的任何设置或所有设置,诸如,例如,最喜欢的频道和/或屏幕设置。
[0270]尽管在图6A、6B和6C中示出的示例中用户说出“初始化设置”,但这仅是示例。具体而言,当用户的话语意图与显示设备100的功能的执行(诸如,例如,“我将停止观看TV”和/或“我想要观看TV直到10点为止”)相关时,控制器150可基于从第二服务器300接收到的响应信息,输出与确认是否执行该功能相关的附加问题作为系统响应。
[0271]此外,当用户的话语意图与显示设备的功能(其中,在执行该功能之前需要执行先前功能)的执行相关时,系统响应可包括与先前功能相关的附加问题。具体而言,当用户的话语意图与显示设备100的功能的执行相关(诸如,例如“请设置7点的提醒”)并且在执行设置提醒的功能之前有必要执行先前功能时,控制器150可输出与先前功能相关的附加问题作为系统响应。
[0272]控制器150可基于再次从第二服务器300接收到的响应信息,执行与响应于附加问题(诸如,例如“我将停止观看TV”、“我想要观看TV直到10点为止”和“请设置7点的提醒”)接收到的用户的语音相应的功能。以上已参照图5对此进行过描述,并且省略冗余的解释。
[0273]当用户的话语意图与对内容的搜索相关时,系统响应可包括与搜索内容的预期结果相关的附加问题和/或与可能的搜索结果相关的附加问题。
[0274]具体地,如果用户的话语意图与询问第一特定内容的广播时间相关,则系统响应可包括与对第一特定内容的广播时间的搜索和对与第一特定内容相似的第二特定内容的搜索中的至少一个相关的附加问题。
[0275]例如,假设如图7A所示用户说出“今天什么时间播放000(广播节目名称)? ”。在这种情况下,控制器150可基于从第二服务器300接收到的响应信息,输出包括文本“今天不播放000。你想要我找出它何时播放? ”的UI屏幕710作为系统响应,如图7B所示。
[0276]随后,当用户如图7C所示说出“是”时,控制器150可基于从第二服务器300接收到的响应信息,输出包括文本“000将在O天的O点播放”的UI屏幕作为系统响应,如图7D所示。
[0277]作为另一示例,假设如图8A所示用户说出“今天何时播放000(广播节目名称)? ”。在这种情况下,控制器150可基于从第二服务器300接收到的响应信息,输出包括文本“今天不播放000。你想要我找到另一广播节目? ”的UI屏幕作为系统响应,如图SB所示。
[0278]随后,当用户如图SC所示说出“是”时,控制器150可基于从第二服务器300接收到的响应信息,输出包括文本“ΛΛΛ将在Λ天的Λ点播放。”的Π屏幕820作为系统响应,如图8D所示。
[0279]此外,如果对内容的搜索与对和第一特定内容相关的人的搜索相关,则系统响应可包括与询问对和这个人相关的第二特定内容的搜索相关的附加问题。
[0280]例如,假设如图9Α所示用户说出“谁是ΛΛΛ的导演? ”。在这种情况下,控制器150可基于从第二服务器300接收到的响应信息,输出包括文本“00(搜索到的导演的姓名)。你想要我找到由00导演的其他作品? ”的UI屏幕910作为系统响应,如图9Β所示。
[0281]随后,当用户如图9C说出“是”时,控制器150可基于从第二服务器300接收到的响应信息,输出包括文本“ΛΛΛ (搜索到的广播节目名称)”的UI屏幕920作为系统响应,如图9D所示。
[0282]尽管在图7Α、图7Β、图7C、图7D、图8Α、图8Β、图8C、图8D、图9Α、图9Β、图9C和图9D中假设用户说出“今天何时播放000 (广播节目名称)? ”或“谁是000 (广播节目名称)的导演?”,但这仅是示例。具体而言,当用户的话语意图与对内容的搜索相关(诸如,例如,“请在000(天)切换到我最喜欢的广播节目之一”或“00(体裁)在00(频道名称)上? ”)时,控制器150可基于从第二服务器300接收到的响应信息,输出与确认是否执行该功能相关的附加问题作为系统响应。此外,控制器150可基于再次从第二服务器300接收到的响应信息,执行与响应于附加问题接收到的用户的语音相应的功能。以上已参照图5对此进行了描述,因此省略冗余的解释。
[0283]图10是示出根据示例性实施例的用于控制显示设备的方法的流程图。
[0284]首先,在操作S1010,采集与用户的语音相关且包括由用户说出的语音信息的信号。
[0285]随后,在操作S1020,与用户的语音相关的信号被发送到第一服务器,并且与用户的语音相应的文本信息从第一服务器被接收到。
[0286]在操作S1030,接收到的文本信息被发送到第二服务器。
[0287]在操作S1040,当于文本信息相应的响应信息从第二服务器被接收到时,与用户的话语意图相应的系统响应基于响应信息被输出。在这种情况下,当用户的话语意图与显示设备的功能的执行和对内容的搜索中的至少一个相关时,基于用户的话语意图,系统响应包括与功能的执行和对内容的搜索中的至少一个相关的附加问题。
[0288]具体地,当用户的话语意图与显示设备的功能的执行相关时,系统响应可包括与确认是否执行该功能相关的附加问题。
[0289]此外,当用户的话语意图与显示设备的功能的执行(其中,在执行该功能之前需要执行先前功能)相关时,系统响应可包括与先前功能相关的附加问题。
[0290]此外,如果用户的话语意图与对内容的搜索相关,则系统响应可包括与预期结果和/或搜索内容的可能结果相关的附加问题。
[0291]具体地,当对内容的搜索与询问第一特定内容的广播时间相关时,系统响应可包括与以下搜索操作中的至少一个相关的附加问题:对第一特定内容的广播时间的搜索以及对与第一特定内容相似的内容(诸如,例如,体裁与第一特定内容相同的第二特定内容)的搜索。此外,如果对内容的搜索与对和第一特定内容相关的人的搜索相关,则系统响应可包括与对和这个人相关的另一内容的搜索(诸如,例如,对和这个人相关的第二特定内容的搜索)相关的附加问题。
[0292]由于以上已描述了用于输出显示设备的附加问题的方法和附加问题的详细示例,因此省略冗余的解释。
[0293]可提供存储用于执行根据示例性实施例的控制方法的程序的非暂时性计算机可读介质。所述程序可通过使用计算机运行。
[0294]非暂时性计算机可读介质指半永久性存储数据而不是短时间存储数据(诸如,寄存器、高速缓存器和内存)的可由设备读取的物理可实现的介质。具体地,上述各种应用或程序可存储在诸如,致密盘(⑶)、数字通用盘(DVD)、硬盘、蓝光盘、通用串行总线(USB)记忆棒、存储卡和只读存储器(ROM)的非暂时性计算机可读介质中,并且可被提供。
[0295]尽管显示设备和服务器的上述框图中未示出总线,但显示设备和服务器的元件可通过总线相互通信。此外,每个装置还可包括处理器(诸如,例如,中央处理器(CPU)和/或微处理器),以便执行上述操作。
[0296]上述示例性实施例和优点仅是示例,并不应被解释为限制本发明构思。示例性实施例可被容易地应用于其他类型的设备。此外,示例性实施例的描述意在说明,而不是限制权利要求的范围,并且许多替代、修改和改变对于本领域中的技术人员将是明显的。
【主权项】
1.一种显不设备,包括: 输出单元; 语音采集器,被配置为采集与用户的语音相关的信号; 第一通信单元,被配置为将采集到的与用户的语音相关的信号发送到第一服务器,并从第一服务器接收与用户的语音相应的文本信息; 第二通信单元,被配置为将接收到的文本信息发送到第二服务器; 控制器,被配置为当与文本信息相应的响应信息从第二服务器被接收到时,基于响应信息控制输出单元输出与用户的话语意图相应的系统响应,其中,当用户的话语意图与显示设备的功能的执行和对内容的搜索中的至少一个相关时,系统响应包括与显示设备的功能的执行和对内容的搜索中的所述至少一个相关的附加问题。2.如权利要求1所述的显示设备,其中,当用户的话语意图与显示设备的功能的执行相关时,附加问题与确认是否执行该功能相关。3.如权利要求1所述的显示设备,其中,当用户的话语意图与显示设备的功能的执行相关并且在执行该功能之前需要执行先前功能时,附加问题与先前功能的执行相关。4.如权利要求1所述的显示设备,其中,当用户的话语意图与对内容的搜索相关时,附加问题与对内容的搜索的可能结果相关。5.如权利要求4所述的显示设备,其中,当对内容的搜索与关于第一特定内容的广播时间的询问相关时,附加问题与以下搜索操作中的至少一个相关:对第一特定内容的广播时间的搜索以及对与第一特定内容相似的第二特定内容的搜索。6.如权利要求4所述的显示设备,其中,当对内容的搜索与对和第一特定内容有关的人的搜索相关时,附加问题与对和该人相关的第二特定内容的搜索相关。7.一种用于控制显示设备的方法,所述方法包括: 采集与用户的语音相关的信号; 将采集到的与用户的语音相关的信号发送到第一服务器,并从第一服务器接收与用户的语音相应的文本信息; 将接收到的文本信息发送到第二服务器; 当与文本信息相应的响应信息从第二服务器被接收到时,基于响应信息输出与用户的话语意图相应的系统响应, 其中,当用户的话语意图与显示设备的功能的执行和对内容的搜索中的至少一个相关时,系统响应包括与显示设备的功能的执行和对内容的搜索中的所述至少一个相关的附加冋题。8.如权利要求7所述的方法,其中,当用户的话语意图与显示设备的功能的执行相关时,附加问题与确认是否执行该功能相关。9.如权利要求7所述的方法,其中,当用户的话语意图与显示设备的功能的执行相关并且在执行该功能之前需要执行先前功能时,附加问题与先前功能的执行相关。10.如权利要求7所述的方法,其中,当用户的话语意图与对内容的搜索相关时,附加问题与对内容的搜索的可能结果相关。11.如权利要求10所述的方法,其中,当对内容的搜索与关于第一特定内容的广播时间的询问相关时,附加问题与以下搜索操作中的至少一个相关:对第一特定内容的广播时间的搜索以及对与第一特定内容相似的第二特定内容的搜索。12.如权利要求10所述的方法,其中,当对内容的搜索与对和第一特定内容有关的人的搜索相关时,附加问题与对和该人相关的第二特定内容的搜索相关。13.—种非暂时性计算机可读记录介质,所述非暂时性计算机可读记录介质上记录了能够由计算机执行的用于执行用于控制显示设备的方法的程序,所述方法包括: 采集与用户的语音相关的信号; 将采集到的与用户的语音相关的信号发送到第一服务器,并从第一服务器接收与用户的语音相应的文本信息; 将接收到的文本信息发送到第二服务器; 当与文本信息相应的响应信息从第二服务器被接收到时,基于响应信息输出与用户的话语意图相应的系统响应, 其中,当用户的话语意图与显示设备的功能的执行和对内容的搜索中的至少一个相关时,系统响应包括与显示设备的功能的执行和对内容的搜索中的所述至少一个相关的附加冋题。14.如权利要求13所述的非暂时性计算机可读记录介质,其中,当用户的话语意图与显示设备的功能的执行相关时,附加问题与确认是否执行该功能相关。15.如权利要求13所述的非暂时性计算机可读记录介质,其中,当用户的话语意图与显示设备的功能的执行相关并且在执行该功能之前需要执行先前功能时,附加问题与先前功能的执行相关。
【专利摘要】提供了一种显示设备。所述显示设备包括:输出单元;语音采集器,采集用户的语音;第一通信单元,将用户的语音发送到第一服务器,并从第一服务器接收与用户的语音相应的文本信息;第二通信单元,将接收到的文本信息发送到第二服务器;控制器,当与文本信息相应的响应信息被接收到时,基于响应信息控制输出单元输出与用户的话语意图相应的系统响应,并且当用户的话语意图与显示设备的功能的执行和对内容的搜索中的至少一个相关时,系统响应包括与显示设备的功能的执行和对内容的搜索中的所述至少一个相关的附加问题。
【IPC分类】G10L15/26, G06F3/16, H04N21/232, H04N21/4227
【公开号】CN104904227
【申请号】CN201480004205
【发明人】韩尚珍, 金在权, 朴恩姬, 俞素妍
【申请人】三星电子株式会社
【公开日】2015年9月9日
【申请日】2014年1月7日
【公告号】EP2941894A1, US20140195230, WO2014107101A1