2019年12月11日

デジタルトランスフォーメーション

コラム

音声UI活用の新ビジネスを検討する企業人に向けたセミナー「電通デジタルが考える音声UI活用のポイント ―スマートスピーカーは新しいマーケティングチャネルとなるか―」。この第2部をレポートで振り返ります。第2部の主題は「進化する音声体験 画面付きスマートスピーカーのもたらす価値とは」。Amazon「Echo Show/Spot」、「Google Home Hub」(日本未発売。2019年6月、『Google Nest Hub』にブランドを変更して日本でも発売開始)、LINE「Clova Desk」の画面付きスマートスピーカーの登場で、スマートスピーカー体験はこれまでとどう変わったのか。株式会社Libalentの恩田氏をお招きし、電通デジタルでUXデザイン領域を担当する小浪のファシリテーションのもと、恩田氏と電通デジタルのクリエーティブディレクターである泰良とのセッションで、画面付きスマートスピーカー用スキル開発のポイントを具体的な事例とともに紹介します。

画面付きスマートスピーカーで利用者の得られる経験が変わる

泰良文彦(電通デジタル)

泰良文彦(電通デジタル)

まず小浪が「これまでのスマートスピーカーと画面付きスマートスピーカーの違い」について、泰良に問いかけました。泰良は自宅でEcho Showを1年、Google Home Hubを半年使いこなしており、VUI(Voice User Interface)を日常に取り入れる生活者としての意見に期待が持てます。

これまでのスマートスピーカーとの違い(出典:電通デジタル)

これまでのスマートスピーカーとの違い(出典:電通デジタル)

泰良は、現状のボイスだけのスマートスピーカーで困った例を挙げました。「『新橋の美味しい焼き肉屋さんを教えて』と呼びかけても、店名をズラッと並べられてしまう。美味しさが伝わらないし、人間の短期的な記憶としても店名を覚えられないですよね。また日用品が切れて注文をすると『シャンプー500ミリリットルですね?』と言われ、メーカーや商品名がわからなくて困ったこともあります。画面が付くことで商品を選ぶことができ、飲食店ならば美味しいかどうかの判断がつくようになる。今後は利用者の経験が変わっていくでしょう」と述べました。

各画面付きスマートスピーカーの特徴

各画面付きスマートスピーカーの特徴(出典:電通デジタル)

各画面付きスマートスピーカーの特徴(出典:電通デジタル)

次は、各画面付きスマートスピーカーの特徴に関してです。泰良は「Google Home Hubは、プライバシーの観点からカメラなしの判断をしたようです。また、Amazon EchoとGoogle Home Hubに関しては、第三者である他の企業や個人がスキル開発するためのガイドラインが整備されています。Amazon Echoはガイドラインに加え、開発キットをテンプレート形式で提供しています」と説明します。

泰良が語る「画面付きスマートスピーカー成功事例」

現状リリースしている画面付きスマートスピーカーでの成功事例はどのようなものでしょうか。最初に泰良が発表しました。

「出前館」成功のポイント(出典:電通デジタル)

「出前館」成功のポイント(出典:電通デジタル)

「出前館」は家族みんなで「ピザがいいね、お寿司がいいね」とワイワイ言いながら、自宅のリビングで食事をデリバリーするAmazon Alexaスキル。泰良は「子どもの友人が家に遊びに来ると使う」と言います。Amazon EchoからAmazonのタブレットであるFire HDやテレビに接続して、画面で選ぶことが可能です。意外とポイントが高いのが、3番目の「Payment(支払い)が終わってるから受け取りがスムーズ」な点。「子どもはデリバリーを頼むと玄関まで商品を取りに行きたがる」そうで、「楽なのは玄関でおつりのやり取りが発生しないこと」と語ります。

小浪宏信(電通デジタル)

小浪宏信(電通デジタル)

続いて泰良は、スマートスピーカーを使って、店頭で会話をするように花が選べるアメリカの生花店「1-800-Flowers」のAmazon Alexaスキルを紹介しました。小浪はこれを「日本で言うところの『花キューピット』のようなサービスをスマートスピーカー上で展開した形」と例え、第1部のラストで述べられた「既存事業のステップアップの形」と位置づけました。

Libalent恩田氏が語る「画面付きスマートスピーカー成功事例」

恩田氏による成功事例(出典:Libalent)

恩田氏による成功事例(出典:Libalent)

次に恩田氏による成功事例です。「今後はエンタメ系のコンテンツが、スマートスピーカーでは有利になる」と語る恩田氏が紹介したのは「おにから電話トーク」Amazon Alexaスキル。立ち上げると同時に鬼から電話がかかってくるシンプルな設計で、親の代わりに鬼が子どもを叱ってくれるものです。第1部で登壇した佐々木は「自宅で使っていますよ」、泰良は「ウチは禁止!子どもがすごく怖がってしまう。徐々に怖さが増していくから、うまく作り込まれている」と、パネラー陣も盛り上がりました。

この「おにから電話トーク」を徹底的に分析した恩田氏のヒット作が「ひょっこりはん」Amazon Alexaスキルです。「ひょっこりはん」とAmazon Alexaに呼びかけると、画面にひょっこりはんが登場。本人が出てきた画面は20秒で消える。ひょっこりはんの登場パターンは40種類。しかもランダムに出るため中毒性があり、子どもたちは何度も喜んで使う。

「ひょっこりはん」をモデルにスキルの設計・開発を考える

ヒットアイテム「ひょっこりはん」はどのように設計・開発したのでしょうか。恩田氏が解説します。

「ひょっこりはん」の設計・開発の進め方(出典:Libalent)

「ひょっこりはん」の設計・開発の進め方(出典:Libalent)

「『おにから電話トーク』はなぜヒットしたのだろうと、社内で徹底的に分析しました。そこで出てきたのは、"ターゲットが子ども"、"何回も使えるスキル"です。そこを起点に、"何だか不毛だけど無限に使われるコンテンツ"を考えていました。弊社はベルロックメディアという吉本興業グループの会社に所属しているので、よしもと芸人がキャスティングしやすい状況にありました」

恩田氏は、上図の「③シナリオ設計」が1時間ほど、「④開発〜リリース」も半日ほどでできたと言います。「一番大変だったのは、ひょっこりはんの動画撮影でした。スケジュールを押さえて1ヵ月半待ち。トータル40カットを撮りました」と答え、会場も笑いに包まれます。

恩田真丈氏(Libalent)

恩田真丈氏(Libalent)

そこに泰良が「シナリオ設計は簡単にできても、当然シミュレーションはしているんですよね?」と問いかけました。恩田氏は「もちろんです。ひょっこりはんは忙しいので、本人でテストができません。そのため自社のスタッフにお願いをして、ひょっこりはんのBGMを流しながら本人のように踊ってもらい、iPhoneで動画を撮ってスキルに組み込みました」と答えます。

じつは、ひょっこりはんのネタは数分の長尺。きちんとネタ振りがあってから「はい、ひょっこりはん」と出てくる全体のパッケージは、芸人さんの命とも言える部分なので崩したくない。ただ短くしないと子どもは飽きてしまう。そこでどれだけ短くできるか動画でテストを繰り返しました。最終的に恩田氏の上司のお子さんに見てもらい、一番子どもにウケたのが20秒の長さだったのです。

勝てるVUI作りは既存コンテンツの徹底的な分析から

最後は、VUI開発の成功ポイント、失敗しがちな点について考えます。その前に泰良が「VOX VUI開発フロー」をまとめました。

VOX VUI開発フロー(出典:電通デジタル)

VOX VUI開発フロー(出典:電通デジタル)

「成功するかどうかは、上図のフェーズ1とフェーズ2をどれだけ真剣に考えたかで決まると思います。フェーズ1の『コンセプトを固める』は、先ほど恩田さんが子どもをターゲットにしたように、誰をターゲットにするのかです。そして使われる環境ですよね。『出前館』ならリビングですが、キッチンなのか、玄関なのか。さらに使用人数。どういう人たちが何人ぐらいで使うのか。また使う状況はテレビを観ながらなのか、料理をしながらなのか、ワイワイしゃべりながらなのか。さらに『ひょっこりはん』なら単純に動画をプレイしてもらうことでしたが、利用者に選ばせたいのか、確認やフィードバックで使ってもらいたいのか。そしてSiriが『わかりません』と答えると心なしかムカッとするように、VUIが話すとパーソナリティーを感じます。コンテンツのパーソナリティーをどうするのか。コンセプトスキルを絵コンテなどで描き出します」

さらに泰良は続けます。「フェーズ2は『ひょっこりはん』を例に挙げると、20秒以上だと利用者が飽きてしまうという設計ですね。フェーズ3も重要です。ユーザーは、開発者が想定するのとまったく違うしゃべり方でスキルを呼び出します。さまざまな言い方を想定して柔軟に考え、スキルを立ち上げた後に利用者が何をするのか、行動をきちんと考えておくことです」

成功ポイントと失敗しがちなポイント(出典:Libalent)

成功ポイントと失敗しがちなポイント(出典:Libalent)

恩田氏は、泰良が上記に挙げた成功ポイントのほかに、ここ1年でスキル設計をして感じるところがあったと言います。それは「ユーザーの感じるコンテンツがダイレクトに出てくる設計。言い換えると、ユーザーが最短距離でコンテンツに近づけることが大事で、"会話は補足で充分"」とのこと。そこから失敗しがちなポイントの「インタラクティブ性を入れたがる」に言及します。

「インタラクティブ性を入れたがったり、ユーザーに選んでもらいたいと選択肢を増やしたりしますが、実際の製作者から言うと、いずれもまあ使われないです。頻度は1日1回使われるか否かという程度。"ユーザーに選ばせない"という決断も1つの真理ではないでしょうか。繰り返しになりますが、タイトルから想起したコンテンツがダイレクトにユーザーの前に現れる。今のスマートスピーカーのユーザー体験としては、これがベストではないかと考えています」

最後に恩田氏は、会場に駆けつけた音声UIを活用したい企業人の背中を押しました。

「世の中に成功事例や面白いコンテンツが何千、何万と出ています。でもそれらを気にしなくても大丈夫です。同じようなコンテンツでも、使われているものと使われてないものがあります。泰良さんもおっしゃっていたように、徹底的に"分析"し、"設計""コンセプト決め"を重要視したら、今からでも勝てるコンテンツは簡単に作れると思います」