一、什麼是“喚醒詞”以及它為什麼重要?
1. “喚醒”和“喚醒詞”
據瞭解,語音互動的過程與平時人與人之間交流的方式非常相似,有問有答。比如某個陰天,你對同事呼喊稱:“小明”,小明聽到了抬頭看你表示在聽,你接著問“今天會下雨麼?”小明開啟手機查了一下今天的天氣預報,然後回答你說“天氣預報說下午3-4點有雷陣雨”。
智慧音箱亦如此,其語音互動流程被劃分為五個環節 – 喚醒、響應、輸入、理解、反饋。其中喚醒是每一次使用者與語音產品互動的第一個接觸點,喚醒環節的體驗在整個語音互動流程中至關重要,它的體驗好壞將直接影響使用者對產品的“第一印象”。
同時,儘管是“智慧”語音互動產品,機器仍沒有人類聰明。據瞭解,對於目前市面上常見的語音互動產品來說,一個眼神或者一個動作還不能引起它的注意,因此需要定義一個將產品從待機狀態切換到工作狀態的詞語,即所謂的“喚醒詞”。
同樣是上文所提到的“問天氣”案例。透過呼喊“小明”的名字,來引起他的注意,而對於智慧語音互動產品,也需要透過叫出“名字”,也就是喚醒詞來啟用裝置。以智慧音箱產品為例,“小度小度”是喚醒渡鴉raven H的喚醒詞,“Hey Google”是喚醒Google Home的喚醒詞,“Alexa”是喚醒Echo的喚醒詞。
2. “喚醒詞”對使用者體驗的影響
據瞭解,影響語音喚醒體驗的因素包含兩個維度——輸入和輸出。輸入環節的影響因素包括喚醒詞、喚醒方式,輸出環節的影響因素包括喚醒響應速度、喚醒反饋方式、喚醒成功率和誤喚醒率。
而對於使用者來說,喚醒詞是語音喚醒輸入環節中較為重要的影響因素,且一個好的喚醒詞,會直接影響喚醒率。
二、怎樣設計一個好的“喚醒詞”?
針對喚醒詞,主要透過以下兩個實驗進行了研究:
實驗一:現有喚醒詞組合方式研究
實驗二:喚醒詞語音要素研究
首先,對市場上各類語音互動裝置喚醒詞的組合方式進行拆解,發現喚醒詞均是在一個簡單“名字”的基礎上加以變化而構成,此外,“名字”本身也具備不同的構成方式。在實驗中,為使用者提供不同組合方式的喚醒詞,由使用者根據其個人喜好程度在5點量表上進行評價(1-非常不喜歡、2-不喜歡、3-一般、4-喜歡、5-非常喜歡)。
實驗結果表明,不同組合方式下,使用者的喜好程度不同:
1)在以“名字”為基礎的不同組合方式中,“名字+名字”的疊詞式組合方式最受使用者喜歡,而“品牌+名字”的組合方式最不被使用者喜歡。
2)另外,就“名字”本身而言,“小+字”的名字最受使用者喜歡。這點也與漢語人名命名習慣相符,《漢語人名用字的統計分析(鄭淑花,2010)》顯示,“小”字在人名命名十大常用字之中。
據瞭解,音節是聽覺上最容易分辨出來的語音單位,也是最自然的語音單位,漢字中一個漢字讀音就是一個音節,每個基本音節都是由聲調、聲母和韻母三個部分構成。
理想條件下,對喚醒詞每一音節的聲調、聲母、韻母進行研究,但是由於音節數的增加,研究變數數將大幅度增長,導致無法透過一次實驗來完成。
另外,透過文獻查閱,發現人們在起漢語人名時,會將尾音節的發音情況列入考量,同時,漢語人名/寵物名統計研究中也多見其對尾音節發音情況的統計。
因此,綜合文獻和前文實驗的結論,本次實驗中以喚醒詞尾音節為研究物件,選取“小+字”的構詞結構,變換尾音節,進行喚醒詞的發音偏好實驗。同時為避免使用者受漢字本身字義的影響,實驗中使用者看到的喚醒詞均為標有聲調的拼音。在實驗中,要求使用者根據其個人喜好程度在5點量表上對喚醒詞進行評價(1-非常不喜歡、2-不喜歡、3-一般、4-喜歡、5-非常喜歡)。
實驗結果表明:
1)聲調方面,使用者最喜歡陰平(1聲);另外相較“仄聲”(3聲上聲、4聲去聲統稱為“仄”),使用者更加喜歡“平聲”(1聲陰平、2聲陽平統稱為“平”)。
2)聲母方面,使用者更加喜歡尾音聲母為零聲母,而包含了z、c、s的舌尖前音最不被使用者所喜歡。
3)韻母方面,從韻母發音時的開口口型來看,使用者更喜歡開口口型較大的齊齒呼和開口呼;另外從韻母結構來看,音節韻母為單韻母的詞最受使用者的喜歡。
三、小結
本文主要圍繞智慧語音互動裝置的喚醒詞展開研究,從喚醒詞組合方式和語音要素兩個方面探討了影響使用者體驗的因素,發現:
1)現有喚醒片語成方式方面:
在以“名字”為基礎的不同組合方式中,“名字+名字”的疊詞式組合方式最受使用者喜歡,而“品牌+名字”的組合方式最不被使用者喜歡;
就“名字”本身而言,“小+字”的名字最受使用者喜歡。
2)語音要素方面:
聲調:使用者最喜歡陰平,同時相較“仄聲”,使用者更加喜歡“平聲”;
聲母:使用者更加喜歡尾音聲母為零聲母,而包含了z、c、s的舌尖前音最不被使用者所喜歡;
韻母: 按照韻母發音時的口型開口情況來看,使用者更喜歡開口口型較大的齊口呼和開口呼;另外按照韻母結構來看,音節韻母為單韻母的詞最受使用者的喜歡。
基於本文的研究,讀者們是否已經掌握如何構造一個好的喚醒詞的方法了?以下是結合收集的使用者自定義喚醒詞及本文研究結論,為喚醒詞作出的分類,供讀者們應用參考。
需要注意的是,本文是從使用者視角出發,對喚醒詞進行了科學的研究和探討,但是實際在設計喚醒詞時,需要考慮的因素還有很多,如:喚醒詞是否過於常見導致語音裝置容易被誤喚醒,喚醒詞與品牌之間是否具有關聯。另外,受當前語音技術的限制,現有的喚醒詞多以4音節詞居多,但未來隨著語音技術的進步,喚醒詞的長度存在變短的趨勢,在設計喚醒詞時還應考慮其可最佳化的空間等等。
一、什麼是“喚醒詞”以及它為什麼重要?
1. “喚醒”和“喚醒詞”
據瞭解,語音互動的過程與平時人與人之間交流的方式非常相似,有問有答。比如某個陰天,你對同事呼喊稱:“小明”,小明聽到了抬頭看你表示在聽,你接著問“今天會下雨麼?”小明開啟手機查了一下今天的天氣預報,然後回答你說“天氣預報說下午3-4點有雷陣雨”。
智慧音箱亦如此,其語音互動流程被劃分為五個環節 – 喚醒、響應、輸入、理解、反饋。其中喚醒是每一次使用者與語音產品互動的第一個接觸點,喚醒環節的體驗在整個語音互動流程中至關重要,它的體驗好壞將直接影響使用者對產品的“第一印象”。
同時,儘管是“智慧”語音互動產品,機器仍沒有人類聰明。據瞭解,對於目前市面上常見的語音互動產品來說,一個眼神或者一個動作還不能引起它的注意,因此需要定義一個將產品從待機狀態切換到工作狀態的詞語,即所謂的“喚醒詞”。
同樣是上文所提到的“問天氣”案例。透過呼喊“小明”的名字,來引起他的注意,而對於智慧語音互動產品,也需要透過叫出“名字”,也就是喚醒詞來啟用裝置。以智慧音箱產品為例,“小度小度”是喚醒渡鴉raven H的喚醒詞,“Hey Google”是喚醒Google Home的喚醒詞,“Alexa”是喚醒Echo的喚醒詞。
2. “喚醒詞”對使用者體驗的影響
據瞭解,影響語音喚醒體驗的因素包含兩個維度——輸入和輸出。輸入環節的影響因素包括喚醒詞、喚醒方式,輸出環節的影響因素包括喚醒響應速度、喚醒反饋方式、喚醒成功率和誤喚醒率。
而對於使用者來說,喚醒詞是語音喚醒輸入環節中較為重要的影響因素,且一個好的喚醒詞,會直接影響喚醒率。
二、怎樣設計一個好的“喚醒詞”?
針對喚醒詞,主要透過以下兩個實驗進行了研究:
實驗一:現有喚醒詞組合方式研究
實驗二:喚醒詞語音要素研究
實驗一:現有喚醒詞組合方式研究
首先,對市場上各類語音互動裝置喚醒詞的組合方式進行拆解,發現喚醒詞均是在一個簡單“名字”的基礎上加以變化而構成,此外,“名字”本身也具備不同的構成方式。在實驗中,為使用者提供不同組合方式的喚醒詞,由使用者根據其個人喜好程度在5點量表上進行評價(1-非常不喜歡、2-不喜歡、3-一般、4-喜歡、5-非常喜歡)。
實驗結果表明,不同組合方式下,使用者的喜好程度不同:
1)在以“名字”為基礎的不同組合方式中,“名字+名字”的疊詞式組合方式最受使用者喜歡,而“品牌+名字”的組合方式最不被使用者喜歡。
2)另外,就“名字”本身而言,“小+字”的名字最受使用者喜歡。這點也與漢語人名命名習慣相符,《漢語人名用字的統計分析(鄭淑花,2010)》顯示,“小”字在人名命名十大常用字之中。
實驗二:喚醒詞語音要素研究
據瞭解,音節是聽覺上最容易分辨出來的語音單位,也是最自然的語音單位,漢字中一個漢字讀音就是一個音節,每個基本音節都是由聲調、聲母和韻母三個部分構成。
理想條件下,對喚醒詞每一音節的聲調、聲母、韻母進行研究,但是由於音節數的增加,研究變數數將大幅度增長,導致無法透過一次實驗來完成。
另外,透過文獻查閱,發現人們在起漢語人名時,會將尾音節的發音情況列入考量,同時,漢語人名/寵物名統計研究中也多見其對尾音節發音情況的統計。
因此,綜合文獻和前文實驗的結論,本次實驗中以喚醒詞尾音節為研究物件,選取“小+字”的構詞結構,變換尾音節,進行喚醒詞的發音偏好實驗。同時為避免使用者受漢字本身字義的影響,實驗中使用者看到的喚醒詞均為標有聲調的拼音。在實驗中,要求使用者根據其個人喜好程度在5點量表上對喚醒詞進行評價(1-非常不喜歡、2-不喜歡、3-一般、4-喜歡、5-非常喜歡)。
實驗結果表明:
1)聲調方面,使用者最喜歡陰平(1聲);另外相較“仄聲”(3聲上聲、4聲去聲統稱為“仄”),使用者更加喜歡“平聲”(1聲陰平、2聲陽平統稱為“平”)。
2)聲母方面,使用者更加喜歡尾音聲母為零聲母,而包含了z、c、s的舌尖前音最不被使用者所喜歡。
3)韻母方面,從韻母發音時的開口口型來看,使用者更喜歡開口口型較大的齊齒呼和開口呼;另外從韻母結構來看,音節韻母為單韻母的詞最受使用者的喜歡。
三、小結
本文主要圍繞智慧語音互動裝置的喚醒詞展開研究,從喚醒詞組合方式和語音要素兩個方面探討了影響使用者體驗的因素,發現:
1)現有喚醒片語成方式方面:
在以“名字”為基礎的不同組合方式中,“名字+名字”的疊詞式組合方式最受使用者喜歡,而“品牌+名字”的組合方式最不被使用者喜歡;
就“名字”本身而言,“小+字”的名字最受使用者喜歡。
2)語音要素方面:
聲調:使用者最喜歡陰平,同時相較“仄聲”,使用者更加喜歡“平聲”;
聲母:使用者更加喜歡尾音聲母為零聲母,而包含了z、c、s的舌尖前音最不被使用者所喜歡;
韻母: 按照韻母發音時的口型開口情況來看,使用者更喜歡開口口型較大的齊口呼和開口呼;另外按照韻母結構來看,音節韻母為單韻母的詞最受使用者的喜歡。
基於本文的研究,讀者們是否已經掌握如何構造一個好的喚醒詞的方法了?以下是結合收集的使用者自定義喚醒詞及本文研究結論,為喚醒詞作出的分類,供讀者們應用參考。
需要注意的是,本文是從使用者視角出發,對喚醒詞進行了科學的研究和探討,但是實際在設計喚醒詞時,需要考慮的因素還有很多,如:喚醒詞是否過於常見導致語音裝置容易被誤喚醒,喚醒詞與品牌之間是否具有關聯。另外,受當前語音技術的限制,現有的喚醒詞多以4音節詞居多,但未來隨著語音技術的進步,喚醒詞的長度存在變短的趨勢,在設計喚醒詞時還應考慮其可最佳化的空間等等。