用于传输多媒体信息流的系统和方法,例如用于远程教学的制作方法

xiaoxiao2020-6-26  18

专利名称:用于传输多媒体信息流的系统和方法,例如用于远程教学的制作方法
技术领域
本发明涉及多媒体信息流的传输,尤其是涉及它的创建和实现。
当然,“传输”这一术语在此处用作它的广义含义,以表示通过任何形式和方法实现的信息传递,例如包括将上述信息流记录在记录载体上,如硬盘、DVD-ROM或CD-ROM。
本发明的开发特别注重于它在远程教育技术方面的可能的应用。
背景技术
在本申请的技术领域内,现有技术揭示了基于实时浏览和延时浏览的课程的不同系统。
例如,为了实时浏览,通常借助于视频会议系统,或借助于所谓的“群电视(group TV)”技术,或者借助于各种不同的专有技术。
同样已知的还有用在CD或通过互联网的远程教育系统,它同样基于专有技术的使用或者HTML格式。
另外,文献WO-A-00/77678公开了使得电视/交互(IMP)型的高级多媒体平台用户可以识别和选择多个包含在一个编码视频会话(EVS)中的多个对象。通过已知系统,借助一个具有附加的互联网接入信息(IAI)类型的超级链接级的处理能力的图形用户接口,就可以访问用户所选择的对象。
文献WO-A-98/47084公开了一种用于说明和链接一个基于对象的视频信号的方法。该方法的基础是对与任何通用格式的视频序列相关的流结构。所述相关流包括在视频信号的每一帧内为某些对象记录的文本说明、语音注释、图片特性、URL链接和所谓的Java小应用程序。
最近,US-A-5 774 666(以及与之略有不同的EP-A-0 840 241)公开了在视频信号中用于超文本导航功能,用于浏览器类型的解决方法,为此目的它必须提供一个预处理或预定向功能。
实际上,至今没有基于标准技术的系统,如使得教师/发言人可以同时进行下列动作-在学生/听众成员出席的情况下中记录一个一般的教室课程/演讲,-在一个通过不同传输方式(以太网、卫星等)连接至“实时”授课教室的教室中远程授课,-以多媒体形式记录课程(音频和视频)和载体材料(幻灯片、来自投影仪的电视摄像机拍摄、包括录像机或个人计算机的任何外部资源等等),-在不必事后编辑课程的情况下,在记录会话中隐含地对课程进行索引,-在不需要教师、工程师或完成功能的外部实体参与的情况下执行上述功能。
同样,目前没有基于标准技术的系统,以使得学生可以同时完成下列功能-实时(流)或一段延时后(下载)浏览课程,-同样在实时课程中利用对图形界面和载体材料(例如当前的幻灯片、背景图像等)的控制浏览课程,-根据网络类型,在可选质量的情况下通过任意类型的网络(调制解调器、以太网、ISDN、卫星等)浏览课程,而内容相同。

发明内容
因此本发明的目的是通过使用标准(而不是专有)技术,使得可以同时执行所述功能,这样可以创建向任何人开放的业务(即“开放”类型),但具有管理这种访问权限的能力,以保护知识产权。
根据本发明,此目标的实现归功于一种具有后面权利要求所特别说明的特性的系统和方法。
并且,此目标的实现是通过可以载入到执行根据本发明的方法的数字处理器的存储器中。
在当前优选实施例中,根据本发明的解决方案提供了一个包括下列子系统的完整平台-多媒体内容和用户的管理(综合数据库),-访问权的管理(内容创建/更新一方和完成一方),-内容创建(如果需要,用保护格式来产生),-网络广播和记录,以及-完成。
使用MPEG-4标准(最好是,但是并不是强制的,为实现本发明而选择)具有很多优点。
首先,MPEG-4标准所允许的压缩比例将高质量的视频和音频信号压缩到窄带信道,如调制解调器信道。记录占据很少空间,减少了存储成本。
MPEG-4标准所提供的将视听信号细分成对称基本对象,即使在多个广播场景中也可以实现在学生部分的高等级交互。
高安全等级是由密钥安全来保证的,而不是算法和协议的安全。


现在将参考附图,以非限制性实例的形式说明本发明,其中图1示意性的示出了根据本发明的作为整体的一种可能的系统组织结构。
图2是一个表示在发送者或“教师”端(内容创建)看来根据本发明的系统的组织功能框图。
图3是一个表示在接收者或“学生”端(内容完成)看来根据本发明的系统的可能组织结构的附加功能框图。
具体实施例方式
根据前言,应该注意,尽管根据本发明的系统是考虑到它在远程教育技术方面的可能的优选应用而开发的,但它的可能应用是非常通用的,因此并不仅限于此后所参考的特定应用。
根据本发明的系统,在图1中全部表示为1,包括一组对教师T可用的教学材料资源,其全体表示为2。所述的教学材料资源例如包括用于获取教师T的声音的麦克风,用于获得他/她的图像的电视摄像机,电视广播,或以计算机系统可读的方式记录如记录在磁盘上的幻灯片(典型的如JPEG幻灯片)。所述的资源还包括至少一个设备(如鼠标、键盘等),该设备允许教师生成系统命令,所述命令例如与幻灯片变化、来自投影仪的信号表示等相对应。
这样资源就可以作为输出生成将要转换成数字形式的模拟信号(例如音频信号)以及在信源就已经是数字形式的信号(例如JPEG幻灯片的情况)。
附图标记3表示一个或多个数字处理器或计算机,用作控制台并且执行转化成数字格式的任务,如果必要,还承担对教学材料进行编码和压缩、以及可能的话进行保护的任务,随后生成将在各种网络(IP组播、卫星等)上传输或者存储的多媒体数字流。
附图标记4表示广义上的传输载体,根据用于此目的的任何已知技术(一个或多个网络,例如10/100 Mbit/s以太网、卫星、调制解调器、CD-ROM、硬盘等)来实现,并且对系统来说是透明的。
同样还提供一个或多个作为接收计算机5的计算机,每一个用于一个学生D1,...Dn,执行从网络或物理载体(硬盘、CD-ROM等)接收多媒体课程的任务,可能的话对所述课程解码、解压缩,并提供给最终用户,并且后者可以在本地与接收到的多媒体流进行交互。
图2的方框图示例性地显示了从教师端产生的数据的流程。
每一模块的特性,例如实现为数据处理产品,将在随后详细说明。
因为该方框图是功能类型,所以在可能的实施例中每一个方块可以由不同的硬件或软件模块来表示,或者相反,多个功能模块可以包括在一个具体实施模块中。
附图标记10特别表示一个教师界面(一般显示在个人计算机上),例如使教师选择课程使用哪种载体(例如,一般为JPEG幻灯片、或PowerPoint的连续屏幕),控制课程数据的质量(例如通过改变视频比特率),开始、暂停课程,根据不同视频文献的重要性改变显示给学生的布局(或学生的图形界面)等。
从功能的观点看,教师在界面10上发送的数据直接影响作为流产生器的表示为12的模块,以及基本数据的定时,如幻灯片的换页。
图2中的附图标记2指示了在图1的图中已考虑的数据源,而模块14和16分别是压缩器/编码器模块和安全保证功能。流发生器模块12所生成的多媒体流可以被直接在一个传输信道18上转发,或者向可以产生记录载体21(硬盘、DVD-ROM、CD-ROM、以例如MP4编码,MPEG4标准的文件存储格式)的记录器20发送。
更具体地,压缩器/编码器模块14是通过它将基本音频、视频、幻灯片等进行编码来生成各个比特流的模块。
所述编码器根据与提供的传输标准相兼容的格式来操作,并且——以一种优选的方式——执行参数编码功能,从而可以选择改变编码参数。
这使得例如可以选择性地从一个具有典型语音传输带宽的音频信号切换到具有高保真特性的音频信号,例如使学生听扩音听诊器的听诊信号。
然后各个编码器的输入接收命令以设置教师界面,这在适应不同的传输比特率(例如调制解调器、LAN或硬盘)和/或编码信源类型上特别有用。
模块12包括一个或多个执行以适应不同传输载体(如基于IP协议的LAN、卫星等)的对象格式发送多媒体内容的功能的模块。因此模块12的输出是一个交互式多媒体流。
记录器模块20可以显示在不同的站点或终端上,甚至与流发生器一起显示,以及在多个实例中显示。模块20的目的是获取组成课程的不同要素和以标准格式存储课程以在从固定载体如硬盘、CD-ROM等上或者通过适当的服务从网络上取得后可以浏览。
附图标记22表示一个具有模板功能的模块,它包含在一个或多个说明学生的图形界面和它与系统交互的不同能力(例如,放大和移动图像,不需要教师的情况下在幻灯片中导航等)的文本文件中。模块22包括特定语言格式的参数集,以适应教师的选择和课程的特点(例如,幻灯片数量、显示顺序等)。
例如,通过投影仪产生的图片,该语言提供了在学生界面上定义占用的尺寸和位置的能力,或者对于学生在教师传输的幻灯片之间导航的能力。
对上述投影仪图片所有这些全部独立于由教师最初指定的尺寸和位置,或者对于幻灯片,在他/她的课程中,独立于步调或独立于教师已经给出的/给出的/将给出的所述幻灯片。
这个可能性是存在的,因为多媒体流中发送给学生的,与上述投影仪图片和/或幻灯片相对应的对象都与各个说明和时空特性相关。所有这些对于教师修改包括在与多媒体流中的其它信息流相关的问题中的对象的时空位置都是可能的。
模板模块22的结构使得可以将指导功能从教师端转移到学生端,这样就不必借助于外部实体。
附图标记24指示一个双功能模块,具有作为一个模板处理器(或列举器)/场景和对象编码器(或解说器)来操作的功能。
单一功能块格式的说明考虑到了组成方块24的两个部分彼此关系紧密的事实。
处理器部分读取模块22提供的模板,并从接口10实时接收命令。这些是为了生成学生界面的即时更新(例如,改变图像的前景,显示一个特定幻灯片等)。
具有场景编码功能的部分接收上述即时更新,并以压缩格式将之编码,与参考标准兼容。
编码器将它的说明和时空特性(对象特性)与每一个对象(在此为一个单视频、一个幻灯片、一个音频等)相关;此特性直接使得独立于传输器的在特征对象上的交互成为可能。对象的说明根据参考标准来编码,并包括一个特别重要的元素,因为通过相关说明就可以从接收器传递到接收器。
最后,附图标记26表示一个附加模块,它与模块16协同工作,来完成课程的保护,如果提供(甚至至少组成课程的某些对象)以使得一个保护管理系统(未显示,自身已知)来控制访问并保护信息内容,例如使用加密密钥。
计算机或提供给学生D1...Dn的计算机5(图1)实质上对应于图3所示的结构。
在此情况下,附图标记30表示一个网络接收器,由一个或多个执行从各种传输载体32,如基于IP协议的LAN、卫星等,接收对象格式的多媒体内容的模块组成。接收器30的输出是一系列交互多媒体流,结构上与那些来自载体阅读器34的相似。
后面的模块34具有以下功能获取不同的包含来自物理载体36所支持的课程的成分,为学生的检索请求提供各种方法。此时模块34的输出也是一系列交互多媒体流,类似于网络接收器所输出的,但是是来自物理或记录载体36。
附图标记38和40表示执行与图2中的模块16和26有关的关键的互补功能的两个模块,即为了允许(这里也具有访问控制系统,但未示出)控制访问和保护内容的任意课程说明(或甚至只是包含该课程的一些对象)。
附图标记42表示一组解压缩器/译码器模块,通过这些模块,音频、视频、幻灯片等从由标准所指定的形式被实时解码为可被立即用于显示学生界面的格式,如44所示。
如上对解压缩器/译码器模块14的说明,解压缩器/译码器42还可以被有利地配置成工作于参数的方式下(通常根据发射器/学生端的编码参数的相应变化),从而例如允许音频信号的特定片断在通常具有声音音频信号特性的音频信号内进行高保真度特性的解码。
在模块组42和学生界面44之间插入了一个具有解释/合成功能的双功能块46。该功能块46用于执行实质上与块24在模块22的控制下所执行的功能相同或互补的功能。因此,块46也是一个双功能块,表示为一个元件是因为它所包含的两部分彼此之间非常相关。
解释器部分接收、解压缩并且解释学生界面44的即时更新(例如,改变一个视频前景,显示一个特定幻灯片等)。它还为每一对象(在上下文中,一个对象是一个视频、一个幻灯片及一个音频等)解释说明和时空特性,这样就能够独立作用于来自发射器的对象。对象的说明根据参考标准进行编码并构成本发明的一个重要部分,因为只有通过这种说明的方式,才可能实现从发射器到接收机方向的移动。
合成器部分接收对象的说明和界面44的更新以及学生的交互操作。在组合上述内容的基础上决定显示多少及什么译码基本对象,以及如何显示,并将其传到学生界面44。
通过界面44,每个学生D1,...Dn——全部独立于其他人——能够选择(自然在教师设定的限度内)显示什么课程载体。尤其是,每个学生D1,...Dn能够——再次强调全部独立于其他学生——从所有要被传输的幻灯片中选择显示哪些幻灯片,并回看之前阅览过的幻灯片,预览教师还未示出的一些幻灯片,中断课程(如果课程是在线的,这将导致丢失部分课程,除非被临时存储),结束显示,完全在教师模块22所允许的范围之内,根据不同视频器件的重要性改变视图的布局。
实质上,根据本发明的解决方案为学生提供了三种实现能力。
第一模式下(实时流),学生能够实时观看课程,即如由模板所允许的交互操作所给定的。从教师端,该流是由流发生器12通过读取来自模块16、26和10的实时流而直接产生的。从学生端,模块34在模块30激活期间显然保持未被激活。
第二模式(延迟流)允许学生在一个延迟后回顾课程,从预先存储的合适的服务器发出请求,不必等待课程被完全下载,而是可以立即开始观看。从教师端,该流是由流发生器12通过读取一个或多个来自一个大规模载体12a之前通过模块20存储的MP4文件而直接产生的。在学生端,这样的情况下模块34保持未被激活而模块30保持激活。
第三模式(下载)允许学生在一个延迟后观看课程,从一个适当的之前存储有该课程的服务器发出请求。此时必须等待课程被完全下载之后,才可能无需重新连接服务器的观看多次。
从教师端,该流是由从教师端,该流是由流发生器12通过读取一个或多个来自一个大规模载体12a之前通过模块20存储的MP4文件而直接产生的。从学生端,载体阅读器模块34是激活的,而网络接收器模块30保持未被激活。
在根据本发明的系统的实际开发情况中,预想的设备的典型使用包括四个独立于功能框图的计算机。
第一个计算机由教师T的个人计算机组成,通过该计算机,教师能够使用幻灯片,并通过教师界面10给出课程。
第二个计算机,例如一个内容创建个人计算机,是一个其上连接有由电视摄像机、麦克风及图3中给出的其它模块构成的资源的机器;这样的第二个计算机例如还包括模板模块22。
还可以使教师的计算机的功能由内容创建个人计算机来实现。
第三个计算机由一个服务器构成,例如是HTTP/MP4类型的,其上提供有记录的课程,通常是记录模块20。出于效率的原因,最好使该计算机独立于内容创建计算机。
作为第四个计算机,有接收计算机5,其数目等于学生的数目。每一个这样的计算机具有图3所示的功能。
关于流发生器的类型,多点流发生器的使用使得可以多点传输音频和视频内容及其他产生的信息。该类流发生器同时发送相同的信息给所有需要的接收器。
如果使用一个单点传输类型的流发生器,可能单点传输音频和视频内容及其他产生的信息。尤其是这类流发生器只给做出请求的接收器发送信息。
如果有对同一多媒体内容(同一课程)的新的请求,服务器为每一请求激活一个新的对话,允许不同的学生在不同的时间观看同一课程。特别地,这使得每一学生能够从课程的最初开始观看,并不受其他学生观看模式影响的独立观看。
第三种类型的流发生器以FTP/HTTP服务器为代表这样学生就能够开始搜索正在进行的或已记录的课程,并且参考(例如URL)-如上所述的多广播流,-如上所述的单广播流,-在下载过程结束时,在FTP下载或HTTP下载模式下可直接从FTP/HTTP服务器作为行进中的或可视的HTTP观看的MP4文件。
使用本发明的系统使教师T可以准备课程的典型方法利用通过PowerPoint或JPEG幻灯,以及其他要在上课期间提供的载体材料(在纸、录像带、个人计算机等的上面)。教师T可以用她/他自己的便携式个人计算机连接至编码站,或用一个载体如一个磁盘传递至幻灯片。为教师T提供了一个特定的用于对编码站进行远端控制或局端(预览、快进、次数等)控制的界面。编码站还提供实时发送和记录所获取的项目。
学生能够通过一个中间多媒体个人计算机与系统1相连,以这样的一种方式配置(例如通过插入式模块)以执行对应于图3的框图的功能。通过以太网、调制解调器或卫星接口(或任意其他方式),学生与能获取预先录制或正在进行的课程的机器连接,登录,选择他(她)感兴趣的课程,并能够立即开始观看(流)或下载。
为了安全性和保护内容,关于多少及什么流将被加密的任何决定都要参照保护管理系统此处说明的系统是为了应用实时算法而提供的,并用于传输数据至流发生器或记录器。
流发生器根据全部已知的方法从编码器接收数据,并发送这些数据,例如根据RTP协议。记录器20以标准化MP4的格式产生单个多媒体文件中的所有流。
概括来说,根据本发明的系统用于实现多媒体流在发射器3和至少一个接收器5之间的传输(词语“传输”的意义再次参考本说明书开始处所给出的定义)。多媒体流包括至少一个音频/视频流,与至少一个辅助信息流,如一个对应于投影仪产生的信号的视频流,一个对应于幻灯片等的流有关。对于至少某些包括在上述多媒体流中的对象与各说明和时空特性相关。因此接收器5或每一接收器5能够与所述的对象互相作用,独立于所述的发射器3改变其相对于其他流的时空位置。
自然,无需改变本发明的原理,只要不脱离由权利要求所定义的本发明的范围。其结构细节和具体实施方式

可以根据上面的说明及其中的图示在很大范围内进行修改。
权利要求
1.用于在至少一个发射器(3)和至少一个接收器(5)之间传输多媒体流的系统(1),其特征在于,所述的多媒体流包括至少一个具有至少一个与其相关的辅助信息流的音频/视频流,所述的音频/视频及辅助流包括各个对象,并且在所述的多媒体流中,至少一些所述对象与各说明和时空特性有关,这样至少一个接收器(5)能够与所述的对象互相作用,独立于所述的至少一个发射器(3)来修改它们在所述多媒体流中的视频流。
2.如权利要求1所述的系统,其特征在于,所述多媒体流包括至少一个连续音频/视频流和第二个视频流,如由投影仪产生的视频流。
3.如权利要求1或2所述的系统,其特征在于,所述辅助信息流包括至少一个所述辅助信息流的相对于所述音频/视频流的同步成分,这样所述的至少一个接收器(5)就能够选择性的改变所述辅助信息流相对于所述音频/视频流的同步。
4.如前面任一权利要求所述的系统,其特征在于,所述至少一个音频/视频流被进行MPEG-4编码。
5.如前面任一权利要求所述的系统,其特征在于,所述的辅助信息流传送对应于幻灯片的信息。
6.如权利要求5所述的系统,其特征在于,所述的辅助信息流根据从由JPEG格式和PowerPoint格式组成的组中选择的格式进行编码。
7.如权利要求3,5或6中所述的系统,其特征在于,所述的至少一个接收器(5)被配置成用于在所述辅助信息流的幻灯片中进行导航。
8.如前面任一权利要求所述的系统,其特征在于,在所述至少一个发射器(3)端,包括一个可用来选择至少一个从以下组中选择的参数的界面(10)-要使用的载体,-传输质量,-传输的开始、暂停及结束,-所述多媒体流的显示布局的改变。
9.如前面任一权利要求所述的系统,其特征在于,在所述至少一个发射器(3)端,包括一个具有模板功能(22)的模块,该模块包含至少一个具有对所述至少一个接收器(5)端的图像界面的说明的文本文件。
10.如权利要求9所述的系统,其特征在于,所述的模板功能(22)允许有选择性地修改相对于所述至少一个音频/视频流的所述至少一个辅助信息流的相关标准。
11.如权利要求1或10所述的系统,其特征在于,在所述至少一个发射器(3)端,包括一个场景编码器模块(24),能够使所述的说明和特性与每一所述对象相结合,所述的说明根据一个参考标准被编码。
12.如前面任一权利要求所述的系统,其特征在于,在所述至少一个发射器(3)端,包括至少一个模块(16,26),能够有选择性地反映由所述至少一个接收器所制约的对至少部分所述多媒体流的访问。
13.如前面任一权利要求所述的系统,其特征在于,在所述至少一个发射器(3)端,包括一个流发生器模块(12),能够产生以可实时观看的交互式多媒体流的形式的所述的多媒体流。
14.如前面任一权利要求所述的系统,其特征在于,在所述至少一个发射器(3)端,包括一个记录模块(20),用于为了允许进行延迟观看而在一个记录载体上记录所述的多媒体流。
15.如前面任一权利要求所述的系统,其特征在于,在所述的至少一个接收器(5)端,包括一个解释器/合成器模块(46),能够检测所述多媒体流中的所述对象的所述说明和特性,允许所述的至少一个接收器(5)独立于所述至少一个发射器(3)作用于所述对象。
16.如权利要求15所述的系统,其特征在于,所述的解释器/合成器模块用于接收所述至少一个发射器(3)端的所述对象的说明和界面/交互作用的任意更新。
17.如前面任一权利要求所述的系统,其特征在于,在所述至少一个接收器(5)端,包括一个接收器界面模块(44),能够允许有选择性的识别,其目的是为了表示所述多媒体流和至少一个从以下组中选择的参数-有选择性地显示所述辅助信息流的对象,-暂停时设置传输,-中断传输,-改变传输的可视内容。
18.如前面任一权利要求所述的系统,其特征在于,在所述至少一个接收器(5)端,包括至少一个保护模块(38,40),能够在所述的至少一个接收器中插入解密密钥时,影响在所述至少一个接收器端观看至少部分所述多媒体流。
19.如前面任一权利要求所述的系统,其特征在于,在所述至少一个接收器(5)端,包括一个网络接收器模块(30),用于实时接收所述的多媒体流。
20.如前面任一权利要求所述的系统,其特征在于,在所述至少一个接收器(5)端,包括一个模块载体阅读器模块(30),用于从各记录载体(12a)读取所述的多媒体流。
21.用于在至少一个发射器(3)和至少一个接收器(5)端之间传输多媒体流的方法,包括以下步骤-收集具有多个对象的多媒体流,-有选择性地将所述多媒体流的所述对象与分别表示将所述对象说明和表示为特性化对象的特性信息相关联,-发射所述的特性化对象,这样所述的至少一个接收器(5)能够独立于所述的至少一个发射器(3)的与所述特性化对象互相作用。
22.根据权利要求21所述的方法,其特征在于,所述选择性关联步骤包括步骤-将所述的对象与作为与所述的至少一个发射器(3)相关的方向函数的一种说明和/或一种空间/时间特性相关联。
23.根据权利要求22所述的方法,其特征在于,还包括步骤-解释所述的特性化对象;并且-有选择性地从所述至少一个发射器(3)中将所述方向函数送至所述的至少一个接收器(5)。
24.数据处理产品,可直接载入到数字处理器的内部存储器中,当该产品在一个数字处理器上运行时,包含用于执行权利要求21至23中的任一项所述方法的软件代码部分。
全文摘要
用于在至少一个发射器(3)和至少一个接收器(5)之间传输多媒体流的系统(1)。多媒体流包括具有至少一个与其相关的辅助信息流的音频/视频流。包含在多媒体流中的至少一些对象与各个说明和时空特性相关联,这样每个接收器(5)能够与所述的对象互相作用,独立于发射器(3)和其它接收器来改变它们相对于其他流的时空位置。最好应用于远程教育技术。
文档编号G09B5/06GK1561637SQ02819425
公开日2005年1月5日 申请日期2002年9月27日 优先权日2001年10月1日
发明者佩特里斯 吉安鲁卡·德, 莱阿 阿莱桑德洛·科斯塔, 基奥万尼·科达拉 申请人:意大利电信股份公司

最新回复(0)