IoT

スマートスピーカーの仕組みについて調べてみた

スマートスピーカー(通称スマスピ)は、Amazon Echo、Google Home、Clova WAVEの3強が、メインと廉価版を出したことで、急に身近なものになりましたね。ネットでも色々な使い方を紹介していますし、私も色々と調べてきました。さらに2018年4月にはAmazon Echoが一般販売され、大きな話題となりました。

そこで今回はちょっと目先を変えて、スマスピの仕組みについて調べたいと思います。

ユーザーの声を拾う

スマートスピーカーの仕組みについて調べてみた

スマスピは、声で呼びかけると応答するシステムで、物理的なインタフェースを必要としません。逆に、声だけなので人によって声質やしゃべり方、クセが違ってきますよね。それをどうやって判別して、正しい答えを出してくれるのでしょうか。

仕組みそのものはメーカー(ブランド)によって違いはほとんどありません。

ユーザーの声をクラウドサービスに送ることと、クラウドサービスからの答えを音声にしてユーザーに答えることだけです。

まず、ユーザーの声を正しく拾うためには、周囲の騒音と声を聞き分けること、複数のユーザーの声を聞き分けること、ユーザーの言葉の内容を正確に聞くことが必要になります。

この点は、すでにAppleのSiriやGoogleのGoogleアシスタントで実績がありますが、スマスピの場合はどちらの方向から聞こえてきてもいいように精度を高めてあります。

タスク指向対話と非タスク指向対話

マイクが音声を拾うと、次はそれをネットを通してクラウドサービスに送ります。

現在はWi-Fiなどでルーターに接続しますが、情報量としては小さいため、ユーザー側ではすでにあるネット環境をそのまま使えます。ネットでクラウドサービスに送られた音声は、ここで音声認識ロジックというシステムで解析されます。

例えば、「天気を知りたい」と言った場合は「天気」と「知りたい」に分解して、ユーザーの意図を理解しやすくします。このように目的があって話しかけることを「タスク指向対話」といい、目的のない雑談などは「非タスク指向対話」のシステムといいます。前者の場合は答え方も範囲が決まっていますが、後者の場合は答える範囲が決まっていないため、処理方法も違ってきます。

「非タスク指向対話」では、とにかく「こういう会話にはこう答える」というバリエーションを自己学習させるしかないので、ユーザーの望み通りの答えを出すまでは、時間がかかります。この点では、Amazon Echoより、Google Homeが優れているといわれる理由ですね。また、対話を繰り返すことで精度が上がったことを実感した人もいると思います。

大切なことはクラウドサービスが行っている

「非タスク指向対話」に比べて「タスク指向対話」のシステムのほうが処理が簡単なように書きましたが、実際は仕組みが簡単なだけであって、やることは大変です。

先ほどの「天気を知りたい」と言った場合なら、膨大なリストのなかから「天気」と「知りたい」という単語を探し出し、単語同士をつないで初めてユーザーのしたいことを理解するわけです。でも、実はここが大切な作業で、「知りたい」「教えて」「聴きたい」など、同じ意味でも違う言い回しや、ニュアンス、個人のクセにも対応できるように、常にデータを蓄積しています。

こうして「何をするか」を理解すると、外部のクラウドサービスにアクセスしてデータを受け取り、ユーザーに送り返します。この場合の外部とは、天気予報情報を提供しているサービスのことです。こうした外部のクラウドサービス(スキル)の多さでは、Echoなどのアレクサのほうが充実していますね。

ところで現在、Bluetooth対応スピーカーがGoogle Homeに対応するようになりました。こうなると「スマスピ本体のスピーカーから音を出すのか、外部のスピーカーから音を出すのか」の優先順位を判断しないといけなくなります(すでにEchoには3.5mmジャックがありますが、無線接続の場合です)。

こうした場合は、事前に対応するデバイスをアプリなどを利用して登録しておく必要がありますが、実際はクラウドサービス側で管理しています。Android搭載端末を利用していてGoogle Homeも持っている人なら分かると思いますが、両方を揃えて「OK google ○○して」といった場合にGoogle Homeだけが答えますよね。照明のオン/オフなどIoT管理もこのようにクラウドサービス側で行うわけです。

警察の捜査には使えるのか?

こうして、クラウドサービスから戻ってきた答えをスマスピが音声としてユーザーが意図する形で提供します。天気予報を内蔵スピーカーから流したり、音量を調節したりするわけですね。

ここまでをまとめると、スマスピはユーザーとクラウドサービスをつなぐデバイスということになります。ユーザーの声を覚えるのも、好みを記録するのも実際にはクラウドサービスが行うわけです。アメリカの警察では、このクラウドサービスの記録を殺人事件の捜査に利用しようとしたことがあります。ある容疑者が所有していたスマスピから何らかの情報が得られるのではないかという考えでしたが、企業側は「正当な理由がない限り、個人情報は提供できない」と当然のように対応しました。

対応としては真っ当だと思いますが、仮に裁判所の正式な令状があっても大した情報は得られないでしょう。

ストリーミング再生は利用すべし!

それは常にユーザーの声を記録しているわけではなく、「Alexa」や「OK Google」のようにコマンドワードの後に発した単語しか拾っていないからです。コマンドワードは「この後の言葉が命令だよ」ということを認識させて、記録する部分を明確にしているためです。スマスピはレコーダーではないので、あくまでコマンドワードに続く限定的な言葉しか記録してないということになります。

だから、コマンドワードの後に殺人事件に関するワードを容疑者が発していなければ、正当な理由にはなりません。

ちなみに、スマスピの使い方のひとつに、音楽配信サービスを理由するというものがありますが、本体にはスマートスピーカーとは別にストリーミング再生プレーヤーが独立して実装されています。音楽を聴く場合は、スマスピが直接ネット経由でサーバーに接続し、ここからデータを受け取る形になっているんです。せっかく内蔵されているんですから、スマスピを手に入れたらストリーミング再生機能を使わないのは勿体ない気がしますね。

まとめ

ユーザー、スマスピ、クラウドサービス、外部サービスの関係は、私のようなライターの関係で表現することも出来ます。

ユーザーがクライアントさんで、ライターがスマスピとクラウドサービス、そして、ライターが使うインターネットが外部サービスです。例えばクライアントさんから「こんな記事が欲しい」という依頼があれば、その意図をライターが理解して、どこからどのような情報を集めるかを判断して実行します。そして、インターネットなどで集めた情報をまとめてクライアントさんに提出するわけです。

ただ、クライアントさんが具体的に思い描く記事をライターが提出できるようになるまでは、お互いにやり取りを繰り返し、クライアントさんの意図をより正確に覚えないといけないというわけです。

関連記事:スマートスピーカー
Amazon Echoについて調べてみた【Google Homeとの比較】
LINE Clova WAVEについて調べてみた
Google Home Miniを一週間使ってみた

関連記事:音楽ストリーミングサービス
【ミュージックアプリを徹底比較!】聴き放題 5選

『Amazon Echo (Newモデル)、チャコール 』画像をクリック!

クロワ

クロワ

投稿者の記事一覧

フリーライターのクロワです。主に生活のなかで役立つ記事やトレンド記事などを書いています。よろしくお願いします

コメント

  1. この記事へのコメントはありません。

  1. この記事へのトラックバックはありません。

関連記事

  1. エルメス(HERMES)のアイテムは高いのになぜ人気なのか?
  2. 5G 運用開始前夜!MWCでスマホの未来が見えた
  3. かつらはファッション!ウィッグで薄毛を忘れる方法
  4. Appleはなぜ画期的な新製品を発表しないのか?!
  5. マッチングアプリの巧妙な仕組み 「スワイプし続けるように設計され…
  6. IoT【第4次産業革命】とはなにか?【モノのインターネット】
  7. カードを使いこなす最新情報 5選
  8. マイルを貯めるにはどのクレジットカードが良いか?【オススメ5選】…

カテゴリー

新着記事

おすすめ記事

董卓の生涯【三国志序盤最大の悪役】

三国志序盤最大の「悪役」様々な人物が登場する三国志だが、その中でもヒール(悪役)として一…

山縣有朋 の功績ついて調べてみた【今までの評価は間違い?】

明治2年(1869年)、山縣有朋(やまがたありとも)は、ヨーロッパの地にいた。明治維新を成功させ…

自然の避暑地・マレーシアのキャメロンハイランド ~幻の花『ラフレシア』

マレーシアの首都『クアラルンプール』から北へ約150kmの場所に位置する「キャメロンハイランド」は、…

ギャンブル=大損は間違い!?リスクを回避して楽しく遊ぶ方法

10月19日、人気お笑いコンビ「霜降り明星」の粗品(27)が2日間で530万円を失った、とツイッター…

日本のクマを絶滅させたらどうなるのか? 調べてみた 【指定管理鳥獣に追加】

近年、日本全国各地で報道されているクマの出没情報。いかにクマが危険で恐ろしいかを煽り立て、駆除(補殺…

アーカイブ

PAGE TOP