闽南语语音播放的系统及其方法

xiaoxiao2020-6-26  33

专利名称:闽南语语音播放的系统及其方法
技术领域
本发明涉及一种语音播放系统及其方法,尤其是一种闽南语语音播放的系统及其 方法。
背景技术
方言是语言的变体,现代汉语有各种不同的方言,他们分布的区域很广,现代汉语 的七大方言之间的差异表现在语音、词汇、语法各个方面。先祖所遗留下来的文化资料中, 有许多古老、典雅、智慧的话语是以方言写成。就一度有百分之七十四的闽南语人口的台湾 而言,文化数据中所记录的闽南语足以反映历史的面貌、显现文化之美。不过因为长期以来闽南语不被重视,一直以来都没有正式学习闽南语的管道,因 此学习不易,再加上目前市场上存在的语言学习类产品多为外语语言,而方言性的产品 (包含闽南语等方言)反而几乎不存在,所以闽南语的学习大都得通过亲朋好友的耳濡目 染,所以若欲学习者周遭没有会听说闽南语的人,并无法学习闽南语,而即使欲学习者周遭 有会听说闽南语的人,但一般人在以闽南语交谈时,并不会特别断开每个字词来发音,所以 在闽南语具有较复杂的八个声调且多音字不少的情况下,不容易学习到标准的发音。综上所述,可知先前技术中长期以来一直存在学习听说闽南语并不容易的问题, 因此有必要提出改进的技术手段,来解决此问题。

发明内容
本发明为解决背景技术中存在的上述技术问题,而提出一种闽南语语音播放的系 统及其方法。本发明的技术解决方案是本发明为一种闽南语语音播放的系统,其特殊之处在 于该系统包含数据库,用来储存多个声音档案;输入模块,用来输入目标词句;词句分割 模块,用来将目标词句分割为字词;读取模块,用来从数据库中读取对应字词的闽南语拼音 数据,以及分别根据闽南语拼音数据从数据库中读取字词所属的声音档案;显示模块,用来 根据字词排列在目标词句中的顺序,排列显示闽南语拼音数据;播放模块,用来根据字词排 列于目标词句中的顺序,播放声音档案;判断单元,用来判断被播放模块播放的声音档案是 否为字词所属的最后一个声音档案,若被播放的声音档案为字词所属的最后一个声音档案 时,控制播放模块播放被播放的声音档案完成后,延迟特定时间,输入模块分别接入词句分 割模块和显示模块,词句分割模块、显示模块、数据库和判断单元分别和读取模块连接。上述数据库用来储存多个词组,词句分割模块根据词组分割目标词句为字词,字 词为目标词句中字数最大匹配于词组。上述读取模块用来根据字词的发音标记,读取对应发音标记的闽南语拼音数据。上述读取模块用来判断字词中的单字为多音字且单字未具有相对应的发音标记 后,读取单字预设对应的闽南语拼音数据。上述显示模块用来设置展示区域,并在展示区域中显示闽南语拼音数据。
一种闽南语语音播放的方法,其特殊之处在于该方法包含下列步骤1)输入目标词句;2)分割目标词句为字词;3)读取分别对应字词的闽南语拼音数据;4)读取分属字词的声音档案;5)根据字词排列于目标词句中的顺序,排列显示闽南语拼音数据;6)根据字词排列于目标词句中的顺序,依序播放声音档案,并在播放时判断被播 放的声音档案为字词所属的最后一个声音档案时,在被播放的声音档案播放完成后,延迟 特定时间再播放下一个声音档案。上述步骤2)中是根据预存的多个词组分割目标词句为字词,字词为目标词句中 字数最大匹配于词组。上述步骤幻中是根据字词中的发音标记,读取对应发音标记的闽南语拼音数据。上述步骤幻中是判断字词中的单字为多音字且单字未有相对应的发音标记后, 读取单字预设对应的闽南语拼音数据。上述步骤幻中还包含设置展示区域,并在展示区域中显示闽南语拼音数据。本发明提供的一种闽南语语音播放的系统及其方法,通过将属于闽南语的目标词 句分割为字词后,根据字词对应的闽南语拼音数据读取字词的声音档案,并在播放声音档 案时,延迟短暂时间来分隔各个字词,可以达成增加使用者的闽南语听说能力的技术功效。


图1为本发明闽南语语音播放的系统架构图;图2为本发明实施例闽南语的词组表;图3为本发明实施例声音档案的对应表;图4. 1为本发明实施例显示画面示意图;图4. 2为本发明实施例展示区域示意图;图5. 1为本发明闽南语语音播放的方法流程图;图5. 2为本发明读取闽南语拼音数据的细部方法流程图。其中,110-数据库,120-输入模块,130-词句分割模块,150-读取模块,160-显示 模块,170-播放模块,171-判断单元,300-词组表,310-词组字段,320-拼音字段,400-对 应表,500-显示画面,510-展示区域;
具体实施例方式台湾闽南语的音节结构和华语类似,分为“声母”、“韵母”以及“声调”三大部分,一 个“声母”、一个“韵母”以及一个“声调”组合后称为一个“音节”。根据先前技术资料,台湾 闽南语理论上有756个“声母”与“韵母”韵母」的组合,且有8个声调,分别为“阴平”、“阴 上”、“阴去,,、“阴Λ,,、“阳平”、“阳上”、“阳去”以及“阳入”。以下先以图1来说明本发明的系统运作。参见图1,本发明系统含有数据库110、 输入模块120、词句分割模块130、读取模块150、显示模块160以及播放模块170。数据库110负责储存台湾闽南语的字词,以及可以表示各字词发音的台湾闽南语拼音数据。参见图2,储存台湾闽南语的词组表300,词组表300中包含有词组字段310以 及拼音字段320。词组字段310记录闽南语的词组,拼音字段320记录词组的台湾闽南语 拼音数据,一般而言,台湾闽南语拼音数据为台湾罗马拼音,但本发明并不限于此。词组表 300中同一笔数据的台湾闽南语拼音数据即为相对应的词组的发音。数据库110也负责储存台湾闽南语中每一个音节的声音档案。一般而言,各音节 的声音档案是以音节中的“声母”与“韵母”的台湾闽南语拼音数据以及音节之“声调”所代 换的数字做为文件名,前述的“声调”所代换的数字可由录音者自行定义,通常以1 8依 序代表“阴平”、“阴上”、“阴去”、“阴入”、“阳平”、“阳上”、“阳去”以及“阳入”等八个声调。 参见图3,以对应表400来记录各个音节的声音档案,也就是说,台湾闽南语拼音数据为台 湾罗马拼音时,字词“我”的台湾闽南语拼音数据为“gu0” (声调为“阴上”),因此表示字词 “我”的声音档案的文件名称为“gua2.mp3”。其中,本发明所提的声音档案的档案命名方式 并不限于此。输入模块120负责输入属于台湾闽南语的目标词句,目标词句由多个闽南语的词 组组合而成。其中目标词句可由使用者选取档案中的特定词句或是由使用者自行键入等方 式来输入,但本发明所提输入目标词句的方式并不限于此。词句分割模块130负责将输入模块120所输入的目标词句分割为字词。当数据库110以词组表300储存台湾闽南语的词组以及台湾闽南语的拼音数据 时,词句分割模块130可以由目标词句的第一个字开始,将目标词句依序与词组表300中的 各个词组做字数最大的匹配,若词组表300中的词组与目标词句中的字词相符,则词句分 割模块130会把匹配的字词分割出来。例如目标词句为“我毋是本地人”时,词句分割模块130会将目标词句由第一个 字开始与词组表300中的所有词组进行比对,假设词组表300中“我”开头的词组只有一 个“我”字,则词句分割模块130把目标词句进行字数最大的匹配后,只能匹配到“我”,因此 “我”会被分割为一个字词,且分割后的目标词句变为“毋是本地人”。之后,当词句分割模块 130将分割后的目标词句“毋是本地人”再次与词组表300中的词组进行匹配时,由于词组 表300中包含与分割后的目标词句的前两个字相匹配的词组“毋是”,假设词组表300中还 有包含有“毋”的词组,但由于词组“毋是”与目标词句匹配的字数为两个字,而词组“毋”与 目标词句匹配的字数只有一个字,因此在字数最大的匹配后,“毋是”会由目标词句中被分 割出来,同样的,“本地人”也会由目标词句中被分割出来。因此在词句分割模块130完成目 标词句“我毋是本地人”的分割后,会分割出“我”、“毋是”以及“本地人”三个字词。其中, 本发明所提词句分割模块130分割目标词句的方式并不限于此。读取模块150负责从数据库110中读取词句分割模块130分割出的各字词所对 应的闽南语拼音数据,以及跟据读取出的闽南语拼音数据读取表示各字词的发音的声音档案。若数据库110以词组表300储存台湾闽南语的词组以及台湾闽南语的拼音数据 时,由于词组表300中包含记录台湾闽南语拼音数据的拼音字段320,因此读取模块150在 词句分割模块130将目标词句与词组表300中的词组进行匹配而分割出字词后,便可以直 接根据词组字段310所对应的拼音字段320,读出与被词句分割模块130分割出的字词相对 应的台湾闽南语拼音数据,但本发明并不限于此,其它方式例如将词组字段310与拼音字段320分开存放,使读取模块150需要以被词句分割模块130分割出的字词做为索引,至不 同于记录词组字段的位置读取相对应的台湾闽南语拼音数据等。显示模块160负责根据被词句分割模块130所分割出的各字词在目标词句中的 排列顺序,排列显示词句分割模块130所分割出的字词对应的闽南语拼音数据,也就是说, 目标词句“我毋是本地人”被词句分割模块130分割为“我”、“毋是”以及“本地人”三个字 词后,显示模块160会根据“我”、“毋是”以及“本地人”本地人」的排列顺序,排列显示出 “gu0”、“m □ si"以及“ρ η-让 l&ng”三个闽南语拼音数据。当显示模块160在图4. 1所示的显示画面500中显示目标词句时,显示模块160参 见图4. 2所示,在显示画面500中设置展示区域510,并在展示区域510上显示读取模块150 所读出的闽南语拼音数据。其中,展示区域510可以迭加的方式设置在显示画面500中。显示模块160还可以在播放模块170播放字词所属的声音档案时,在显示的闽南 语拼音数据中,标记正被播放模块170播放的声音档案相对应的闽南语拼音数据。显示模 块160标记闽南语拼音数据的方式包含但不限于反白、加底线、变更显示颜色或变更背景 颜色等。播放模块170负责根据被词句分割模块130所分割出的各字词在目标词句中的排 列顺序,依序播放属于闽南语拼音数据的各字词的声音档案。播放模块170中还包含判断单元171,判断单元171负责判断被播放模块170所播 放的声音档案是否为各字词所属的声音档案中的最后一个,若判断单元171判断被播放的 声音档案为各字词所属的声音档案中的最后一个时,播放模块170会在正在播放的声音档 案播放完成后,延迟特定的时间,让字词与字词之间的发音有时间上的间隔。也就是说,播 放模块170在字词“我”以及字词“毋是”中的“毋”之间,会延迟些许的时间,以分隔出两个 字词,而在播放字词“毋是”所属的声音档案时,“毋”以及“是”之间不会有延迟的时间,如 此使用者便可以清楚的听出“毋是”的发音。下面以一个实施例来解说本发明的运作系统与方法,参见图5. 1。在使用者开始使用本发明之前,执行本发明装置中的数据库110需要先储存台湾 闽南语中的各音节的声音档案(步骤210)。当使用者由显示画面500中,以鼠标选取显示画面500中的文字“我毋是本地人” 后,按下装置上的“发音”按键,则输入模块120会将使用者使用鼠标所选取的文字“我毋是 本地人”输入成为目标词句(步骤220)。在输入模块120输入目标词句(步骤220)后,词句分割模块130会将目标词句 “我毋是本地人”进行分割的处理(分割的详细过程如上所述,故不再重复说明),目标词句 “我毋是本地人”最后会被词句分割模块130分割为“我”、“毋是”以及“本地人”三个字词 (步骤230)。之后,读取模块150会根据“我”、“毋是”以及“本地人”三个字词,从数据库110所 储存的词组表300中,读取“我”、“毋是”以及“本地人”三个字词的闽南语拼音数据,分别为 “gu0”、“m □ si,,以及“ρ η-让 lang"(步骤251)。接着,读取模块150还会读出的闽南语 拼音数据“gu0”、“m □ si"以及“ρ η-让 l&ng”中的各音节,至对应表400中搜寻分别对应 闽南语拼音数据的字词“我”、“毋是”以及“本地人”所属的声音档案的文件名称,并根据文 件名称读取声音档案(步骤25 ,也就是说,读取模块150会读出之声音档案“gua2. mp3”、"m7. mp3,,、‘‘si7· mp3,,、‘‘pun2· mp3,,、‘‘te7· mp3,,以及"Iang5. mp3,,,其中"gua2. mp3,,是属于 字词“我”的声音档案,"m7. mp3”以及“si7. mp3”是属于字词“毋是”的声音档案,而声音档 案“pim2. mp3”、“te7. mp3”以及“ lang5. mp3”则是属于“本地人”的声音档案。在读取模块150读出与分割出的字词相对应的闽南语拼音数据(步骤251) 后,显示模块160会根据各字词在目标词句中的排列顺序,依序显示读取模块150所读 出的闽南语拼音数据(步骤261),也就是说,显示模块160会在显示画面500上显示出 "guam □ slptin-telang"0其中,显示模块160还可以如图4. 2所示,在显示画面500中 以迭加的方式设置展示区域510,并在展示区域中显示目标词句的台湾闽南语拼音数据 “guctaiD slpto-tgl&ng”,使用者可以根据闽南语拼音数据念出表示为目标词句的声音。在显示模块160显示出读取模块150所读出的闽南语拼音数据(步骤261)后,播 放模块170同样也会根据各字词在目标词句中的排列顺序,依序播放由读取模块150所读 出的各字词所属的声音档案,也就是会以“gua2. mp3”、“m7. mp3”、“si7. mp3”、“pun2. mp3”、 "te7. mp3'\"lang5. mp3”的顺序播放声音档案,其中,判断单元171会在播放模块170播放 "gua2. mp3”、“si7. mp3”以及“lang5. mp3”三个声音档案时,判断出播放模块170所播放的 档案分别为字词“我”、“毋是”以及“本地人”所属的最后一个声音档案,因此会让播放模块 170在播放“gua2. mp3”、“si7. mp3”或“lang5. mp3”三个声音档案完成后,延迟短暂时间, 再播放下一个字词的声音档案(步骤270),也就是声音档案“m7.mp3”以及“pim2. mp3”, 也就是说播放模块170在播放声音档案时,两字词所属的声音档案(“gim2.mp3”与“m7. mp3”、“si7.mp3”与“pim2.mp3”)之间会有间隔,而同一字词所属的声音档案(“m7.mp3” 与“si7. mp3”、“pun2. mp3” 与“te7. mp3”、“te7. mp3” 与“lang5. mp3”)之间不会有间隔,如 此使用者便可以明确的分辨出“我”、“毋是”以及“本地人”的发音。另外,在播放模块170播放声音档案时,还可以传送控制信号至显示模块160,使 得显示模块160根据控制信号标记与被播放模块170播放的声音档案所属的字词(步骤 沈2),例如,当播放模块170开始播放“gua2. mp3”时,传送控制信号至显示模块160,显示模 块160就会更换显示台湾闽南语拼音数据“gu0”的颜色,而当播放模块170开始播放“m7. mp3”时,显示模块160就会将台湾闽南语拼音数据“gu0”的颜色换回原先显示的颜色,并更 换显示台湾闽南语拼音数据“m □ si,,的颜色,直到播放模块170开始播放“pim2. mp3”。综上所述,可知本发明与先前技术之间的差异在于具有将属于闽南语的目标词句 分割为字词后,根据字词对应的闽南语拼音数据读取字词的声音档案,并在播放闽南语的 声音档案时,延迟短暂时间来分隔各个字词的技术手段,由此可以解决先前技术所存在的 学习听说闽南语并不容易的问题,进而达成增加使用者的闽南语听说能力的功效。读取模块150至词组表300中读取闽南语拼音数据(步骤251)时,参见图5. 2,若 读取模块150判断出被分割模块130所分割出的字词中包含有发音标记(步骤2511),则 读取模块150在读取字词所对应的闽南语拼音数据时,便会根据发音标记读出字词所对应 的闽南语拼音数据(步骤2513),其中,发音标记可以由不容易被使用在句子中的特定符号 (如“幌”、“**”等,但并不限于此)加上闽南语拼音数据组成。例如读取模块150要读取字词“重来”中的单字“重”的声音档,若在“重”之前包 含有发音标记“幌ting”,也就是分割模块130所分割出的字词为“幌ting重来”,如此读取 模块150在读取字词“重来”所对应的闽南语拼音数据时,便会根据特定符号“幌”之后的闽南语拼音数据“ting”读出字词“重来”所对应的闽南语拼音数据“ting-mi” (步骤2513), 随后并根据闽南语拼音数据“ ting-mi”读出字词“_ ting重来”所属的声音档案“ting5. mp3”以及“Iai5.mp3”(步骤252)。其中,记录发音标记的方式并不限于此。若读取模块150判断单字“重”中未包含有发音标记(步骤2511),但在由词组表 300中读取对应单字“重”的闽南语拼音数据时,却读取出多个单字“重”所对应的闽南语 拼音数据,例如“Wng”、“ ting”、“ tiSng”以及“ti6ng”,则读取模块150会判断出单字 “重”为多音字(步骤2512),如此读取模块150会读出系统预设的单字“重”的闽南语拼音 数据(步骤2515)。而若读取模块150判断字词中未包含发音标记也不是多音字,则读取模块150将 会直接读取单字所对应的闽南语拼音数据(步骤2514)。再者,本发明闽南语语音播放的方法,可实现于硬件、软件或硬件与软件的组合 中,也可在计算机系统中以集中方式实现或以不同组件散布于若干互连的计算机系统的分 散方式实现。
权利要求
1.一种闽南语语音播放的系统,其特征在于该系统包含数据库,用来储存多个声音 档案;输入模块,用来输入目标词句;词句分割模块,用来将目标词句分割为字词;读取模 块,用来从数据库中读取对应字词的闽南语拼音数据,以及分别根据闽南语拼音数据从数 据库中读取字词所属的声音档案;显示模块,用来根据字词排列在目标词句中的顺序,排列 显示闽南语拼音数据;播放模块,用来根据字词排列于目标词句中的顺序,播放声音档案; 判断单元,用来判断被播放模块播放的声音档案是否为字词所属的最后一个声音档案,若 被播放的声音档案为字词所属的最后一个声音档案时,控制播放模块播放被播放的声音档 案完成后,延迟特定时间,所述输入模块分别接入词句分割模块和显示模块,所述词句分割 模块、显示模块、数据库和判断单元分别和读取模块连接。
2.根据权利要求1所述的闽南语语音播放的系统,其特征在于所述数据库用来储存 多个词组,词句分割模块根据词组分割目标词句为字词,字词为目标词句中字数最大匹配 于词组。
3.根据权利要求1所述的闽南语语音播放的系统,其特征在于所述读取模块用来根 据字词的发音标记,读取对应发音标记的闽南语拼音数据。
4.根据权利要求1所述的闽南语语音播放的系统,其特征在于所述读取模块用来判 断字词中的单字为多音字且单字未具有相对应的发音标记后,读取单字预设对应的闽南语 拼音数据。
5.根据权利要求1所述的闽南语语音播放的系统,其特征在于所述显示模块用来设 置展示区域,并在展示区域中显示闽南语拼音数据。
6.一种闽南语语音播放的方法,其特征在于该方法包含下列步骤1)输入目标词句;2)分割目标词句为字词;3)读取分别对应字词的闽南语拼音数据;4)读取分属字词的声音档案;5)根据字词排列于目标词句中的顺序,排列显示闽南语拼音数据;6)根据字词排列于目标词句中的顺序,依序播放声音档案,并在播放时判断被播放的 声音档案为字词所属的最后一个声音档案时,在被播放的声音档案播放完成后,延迟特定 时间再播放下一个声音档案。
7.根据权利要求6所述的闽南语语音播放的方法,其特征在于所述步骤幻中是根据 预存的多个词组分割目标词句为字词,字词为目标词句中字数最大匹配于词组。
8.根据权利要求7所述的闽南语语音播放的方法,其特征在于所述步骤幻中是根据 字词中的发音标记,读取对应发音标记的闽南语拼音数据。
9.根据权利要求7所述的闽南语语音播放的方法,其特征在于所述3)中是判断字 词中的单字为多音字且单字未有相对应的发音标记后,读取单字预设对应的闽南语拼音数 据。
10.根据权利要求6或7或8所述的闽南语语音播放的方法,其特征在于所述步骤5) 中还包含设置展示区域,并在展示区域中显示闽南语拼音数据。
全文摘要
本发明涉及一种闽南语语音播放的系统及其方法,该系统包括数据库、输入模块、词句分割模块、读取模块、显示模块、播放模块和判断单元,输入模块分别接入词句分割模块和显示模块,词句分割模块、显示模块、数据库和判断单元分别和读取模块连接。本发明通过将属于闽南语的目标词句分割为字词后,根据字词对应的闽南语拼音数据读取字词的声音档案,并在播放声音档案时,延迟短暂时间来分隔各个字词,可以达成增加使用者的闽南语听说能力的技术功效。
文档编号G09B5/06GK102087799SQ20111006896
公开日2011年6月8日 申请日期2011年3月23日 优先权日2011年1月19日
发明者蒋阳安, 陈淮琰 申请人:无敌科技(西安)有限公司

最新回复(0)