IoT

スマートスピーカーの仕組みについて調べてみた

スマートスピーカー(通称スマスピ)は、Amazon Echo、Google Home、Clova WAVEの3強が、メインと廉価版を出したことで、急に身近なものになりましたね。ネットでも色々な使い方を紹介していますし、私も色々と調べてきました。さらに2018年4月にはAmazon Echoが一般販売され、大きな話題となりました。

そこで今回はちょっと目先を変えて、スマスピの仕組みについて調べたいと思います。

ユーザーの声を拾う

スマートスピーカーの仕組みについて調べてみた

スマスピは、声で呼びかけると応答するシステムで、物理的なインタフェースを必要としません。逆に、声だけなので人によって声質やしゃべり方、クセが違ってきますよね。それをどうやって判別して、正しい答えを出してくれるのでしょうか。

仕組みそのものはメーカー(ブランド)によって違いはほとんどありません。

ユーザーの声をクラウドサービスに送ることと、クラウドサービスからの答えを音声にしてユーザーに答えることだけです。

まず、ユーザーの声を正しく拾うためには、周囲の騒音と声を聞き分けること、複数のユーザーの声を聞き分けること、ユーザーの言葉の内容を正確に聞くことが必要になります。

この点は、すでにAppleのSiriやGoogleのGoogleアシスタントで実績がありますが、スマスピの場合はどちらの方向から聞こえてきてもいいように精度を高めてあります。

タスク指向対話と非タスク指向対話

マイクが音声を拾うと、次はそれをネットを通してクラウドサービスに送ります。

現在はWi-Fiなどでルーターに接続しますが、情報量としては小さいため、ユーザー側ではすでにあるネット環境をそのまま使えます。ネットでクラウドサービスに送られた音声は、ここで音声認識ロジックというシステムで解析されます。

例えば、「天気を知りたい」と言った場合は「天気」と「知りたい」に分解して、ユーザーの意図を理解しやすくします。このように目的があって話しかけることを「タスク指向対話」といい、目的のない雑談などは「非タスク指向対話」のシステムといいます。前者の場合は答え方も範囲が決まっていますが、後者の場合は答える範囲が決まっていないため、処理方法も違ってきます。

「非タスク指向対話」では、とにかく「こういう会話にはこう答える」というバリエーションを自己学習させるしかないので、ユーザーの望み通りの答えを出すまでは、時間がかかります。この点では、Amazon Echoより、Google Homeが優れているといわれる理由ですね。また、対話を繰り返すことで精度が上がったことを実感した人もいると思います。

大切なことはクラウドサービスが行っている

「非タスク指向対話」に比べて「タスク指向対話」のシステムのほうが処理が簡単なように書きましたが、実際は仕組みが簡単なだけであって、やることは大変です。

先ほどの「天気を知りたい」と言った場合なら、膨大なリストのなかから「天気」と「知りたい」という単語を探し出し、単語同士をつないで初めてユーザーのしたいことを理解するわけです。でも、実はここが大切な作業で、「知りたい」「教えて」「聴きたい」など、同じ意味でも違う言い回しや、ニュアンス、個人のクセにも対応できるように、常にデータを蓄積しています。

こうして「何をするか」を理解すると、外部のクラウドサービスにアクセスしてデータを受け取り、ユーザーに送り返します。この場合の外部とは、天気予報情報を提供しているサービスのことです。こうした外部のクラウドサービス(スキル)の多さでは、Echoなどのアレクサのほうが充実していますね。

ところで現在、Bluetooth対応スピーカーがGoogle Homeに対応するようになりました。こうなると「スマスピ本体のスピーカーから音を出すのか、外部のスピーカーから音を出すのか」の優先順位を判断しないといけなくなります(すでにEchoには3.5mmジャックがありますが、無線接続の場合です)。

こうした場合は、事前に対応するデバイスをアプリなどを利用して登録しておく必要がありますが、実際はクラウドサービス側で管理しています。Android搭載端末を利用していてGoogle Homeも持っている人なら分かると思いますが、両方を揃えて「OK google ○○して」といった場合にGoogle Homeだけが答えますよね。照明のオン/オフなどIoT管理もこのようにクラウドサービス側で行うわけです。

警察の捜査には使えるのか?

こうして、クラウドサービスから戻ってきた答えをスマスピが音声としてユーザーが意図する形で提供します。天気予報を内蔵スピーカーから流したり、音量を調節したりするわけですね。

ここまでをまとめると、スマスピはユーザーとクラウドサービスをつなぐデバイスということになります。ユーザーの声を覚えるのも、好みを記録するのも実際にはクラウドサービスが行うわけです。アメリカの警察では、このクラウドサービスの記録を殺人事件の捜査に利用しようとしたことがあります。ある容疑者が所有していたスマスピから何らかの情報が得られるのではないかという考えでしたが、企業側は「正当な理由がない限り、個人情報は提供できない」と当然のように対応しました。

対応としては真っ当だと思いますが、仮に裁判所の正式な令状があっても大した情報は得られないでしょう。

ストリーミング再生は利用すべし!

それは常にユーザーの声を記録しているわけではなく、「Alexa」や「OK Google」のようにコマンドワードの後に発した単語しか拾っていないからです。コマンドワードは「この後の言葉が命令だよ」ということを認識させて、記録する部分を明確にしているためです。スマスピはレコーダーではないので、あくまでコマンドワードに続く限定的な言葉しか記録してないということになります。

だから、コマンドワードの後に殺人事件に関するワードを容疑者が発していなければ、正当な理由にはなりません。

ちなみに、スマスピの使い方のひとつに、音楽配信サービスを理由するというものがありますが、本体にはスマートスピーカーとは別にストリーミング再生プレーヤーが独立して実装されています。音楽を聴く場合は、スマスピが直接ネット経由でサーバーに接続し、ここからデータを受け取る形になっているんです。せっかく内蔵されているんですから、スマスピを手に入れたらストリーミング再生機能を使わないのは勿体ない気がしますね。

まとめ

ユーザー、スマスピ、クラウドサービス、外部サービスの関係は、私のようなライターの関係で表現することも出来ます。

ユーザーがクライアントさんで、ライターがスマスピとクラウドサービス、そして、ライターが使うインターネットが外部サービスです。例えばクライアントさんから「こんな記事が欲しい」という依頼があれば、その意図をライターが理解して、どこからどのような情報を集めるかを判断して実行します。そして、インターネットなどで集めた情報をまとめてクライアントさんに提出するわけです。

ただ、クライアントさんが具体的に思い描く記事をライターが提出できるようになるまでは、お互いにやり取りを繰り返し、クライアントさんの意図をより正確に覚えないといけないというわけです。

関連記事:スマートスピーカー
Amazon Echoについて調べてみた【Google Homeとの比較】
LINE Clova WAVEについて調べてみた
Google Home Miniを一週間使ってみた

関連記事:音楽ストリーミングサービス
【ミュージックアプリを徹底比較!】聴き放題 5選

『Amazon Echo (Newモデル)、チャコール 』画像をクリック!

クロワ

クロワ

投稿者の記事一覧

フリーライターのクロワです。主に生活のなかで役立つ記事やトレンド記事などを書いています。よろしくお願いします

コメント

  1. この記事へのコメントはありません。

  1. この記事へのトラックバックはありません。

関連記事

  1. マイルを貯めるにはどのクレジットカードが良いか?【オススメ5選】…
  2. Google Homeで何ができるのか調べてみた
  3. バーバリーの歴史について調べてみた【英国ブランド】
  4. LINE Clova WAVE について調べてみた
  5. もう中華系だからとは言わせない!HUAWEI端末の本気
  6. 日本のAI技術が世界に普及する日が近い?【海外でも注目の日本のA…
  7. ビットコインの仕組み 【分かりやすい!】
  8. 本当に優良な「お小遣い稼ぎアプリ」はどれか?【2019】

カテゴリー

新着記事

おすすめ記事

東京で食べたい美味しいカレー店 12選【実際に行ってみた】

暑いときは“カレー”を食べなさいとは最近言いませんよね。日本以上に暑い“インド”でなぜカレー…

【ロシア初の女帝】 エカチェリーナ1世のシンデレラストーリー 「農民から皇帝に」

ロシア王朝の女性君主といえば、啓蒙専制君主として知られるエカチェリーナ2世が有名である。しか…

直江兼続の正室・お船の方とは ~「夫、娘、息子を亡くすも上杉家を支え続けた良妻」

お船の方とはお船の方(おせんのかた)とは、直江兼続(なおえかねつぐ)の正室である。…

【戦前のカフェー】 喫茶店ではなく風俗店だった 「時代を象徴する源氏名」

大正後期から昭和初期にかけて、一つの文化を形成したカフェー。当初、文化人が集うサロン的な役割…

武田信玄は生涯3敗しかしていない!? その3敗をあえて掘り下げる!

今回は、日本の戦国時代において多くの方が「最強」と述べる戦国武将『甲斐の虎』こと武田信玄につ…

アーカイブ

PAGE TOP