IoT

スマートスピーカーの仕組みについて調べてみた

スマートスピーカー(通称スマスピ)は、Amazon Echo、Google Home、Clova WAVEの3強が、メインと廉価版を出したことで、急に身近なものになりましたね。ネットでも色々な使い方を紹介していますし、私も色々と調べてきました。さらに2018年4月にはAmazon Echoが一般販売され、大きな話題となりました。

そこで今回はちょっと目先を変えて、スマスピの仕組みについて調べたいと思います。

ユーザーの声を拾う

スマートスピーカーの仕組みについて調べてみた

スマスピは、声で呼びかけると応答するシステムで、物理的なインタフェースを必要としません。逆に、声だけなので人によって声質やしゃべり方、クセが違ってきますよね。それをどうやって判別して、正しい答えを出してくれるのでしょうか。

仕組みそのものはメーカー(ブランド)によって違いはほとんどありません。

ユーザーの声をクラウドサービスに送ることと、クラウドサービスからの答えを音声にしてユーザーに答えることだけです。

まず、ユーザーの声を正しく拾うためには、周囲の騒音と声を聞き分けること、複数のユーザーの声を聞き分けること、ユーザーの言葉の内容を正確に聞くことが必要になります。

この点は、すでにAppleのSiriやGoogleのGoogleアシスタントで実績がありますが、スマスピの場合はどちらの方向から聞こえてきてもいいように精度を高めてあります。

タスク指向対話と非タスク指向対話

マイクが音声を拾うと、次はそれをネットを通してクラウドサービスに送ります。

現在はWi-Fiなどでルーターに接続しますが、情報量としては小さいため、ユーザー側ではすでにあるネット環境をそのまま使えます。ネットでクラウドサービスに送られた音声は、ここで音声認識ロジックというシステムで解析されます。

例えば、「天気を知りたい」と言った場合は「天気」と「知りたい」に分解して、ユーザーの意図を理解しやすくします。このように目的があって話しかけることを「タスク指向対話」といい、目的のない雑談などは「非タスク指向対話」のシステムといいます。前者の場合は答え方も範囲が決まっていますが、後者の場合は答える範囲が決まっていないため、処理方法も違ってきます。

「非タスク指向対話」では、とにかく「こういう会話にはこう答える」というバリエーションを自己学習させるしかないので、ユーザーの望み通りの答えを出すまでは、時間がかかります。この点では、Amazon Echoより、Google Homeが優れているといわれる理由ですね。また、対話を繰り返すことで精度が上がったことを実感した人もいると思います。

大切なことはクラウドサービスが行っている

「非タスク指向対話」に比べて「タスク指向対話」のシステムのほうが処理が簡単なように書きましたが、実際は仕組みが簡単なだけであって、やることは大変です。

先ほどの「天気を知りたい」と言った場合なら、膨大なリストのなかから「天気」と「知りたい」という単語を探し出し、単語同士をつないで初めてユーザーのしたいことを理解するわけです。でも、実はここが大切な作業で、「知りたい」「教えて」「聴きたい」など、同じ意味でも違う言い回しや、ニュアンス、個人のクセにも対応できるように、常にデータを蓄積しています。

こうして「何をするか」を理解すると、外部のクラウドサービスにアクセスしてデータを受け取り、ユーザーに送り返します。この場合の外部とは、天気予報情報を提供しているサービスのことです。こうした外部のクラウドサービス(スキル)の多さでは、Echoなどのアレクサのほうが充実していますね。

ところで現在、Bluetooth対応スピーカーがGoogle Homeに対応するようになりました。こうなると「スマスピ本体のスピーカーから音を出すのか、外部のスピーカーから音を出すのか」の優先順位を判断しないといけなくなります(すでにEchoには3.5mmジャックがありますが、無線接続の場合です)。

こうした場合は、事前に対応するデバイスをアプリなどを利用して登録しておく必要がありますが、実際はクラウドサービス側で管理しています。Android搭載端末を利用していてGoogle Homeも持っている人なら分かると思いますが、両方を揃えて「OK google ○○して」といった場合にGoogle Homeだけが答えますよね。照明のオン/オフなどIoT管理もこのようにクラウドサービス側で行うわけです。

警察の捜査には使えるのか?

こうして、クラウドサービスから戻ってきた答えをスマスピが音声としてユーザーが意図する形で提供します。天気予報を内蔵スピーカーから流したり、音量を調節したりするわけですね。

ここまでをまとめると、スマスピはユーザーとクラウドサービスをつなぐデバイスということになります。ユーザーの声を覚えるのも、好みを記録するのも実際にはクラウドサービスが行うわけです。アメリカの警察では、このクラウドサービスの記録を殺人事件の捜査に利用しようとしたことがあります。ある容疑者が所有していたスマスピから何らかの情報が得られるのではないかという考えでしたが、企業側は「正当な理由がない限り、個人情報は提供できない」と当然のように対応しました。

対応としては真っ当だと思いますが、仮に裁判所の正式な令状があっても大した情報は得られないでしょう。

ストリーミング再生は利用すべし!

それは常にユーザーの声を記録しているわけではなく、「Alexa」や「OK Google」のようにコマンドワードの後に発した単語しか拾っていないからです。コマンドワードは「この後の言葉が命令だよ」ということを認識させて、記録する部分を明確にしているためです。スマスピはレコーダーではないので、あくまでコマンドワードに続く限定的な言葉しか記録してないということになります。

だから、コマンドワードの後に殺人事件に関するワードを容疑者が発していなければ、正当な理由にはなりません。

ちなみに、スマスピの使い方のひとつに、音楽配信サービスを理由するというものがありますが、本体にはスマートスピーカーとは別にストリーミング再生プレーヤーが独立して実装されています。音楽を聴く場合は、スマスピが直接ネット経由でサーバーに接続し、ここからデータを受け取る形になっているんです。せっかく内蔵されているんですから、スマスピを手に入れたらストリーミング再生機能を使わないのは勿体ない気がしますね。

まとめ

ユーザー、スマスピ、クラウドサービス、外部サービスの関係は、私のようなライターの関係で表現することも出来ます。

ユーザーがクライアントさんで、ライターがスマスピとクラウドサービス、そして、ライターが使うインターネットが外部サービスです。例えばクライアントさんから「こんな記事が欲しい」という依頼があれば、その意図をライターが理解して、どこからどのような情報を集めるかを判断して実行します。そして、インターネットなどで集めた情報をまとめてクライアントさんに提出するわけです。

ただ、クライアントさんが具体的に思い描く記事をライターが提出できるようになるまでは、お互いにやり取りを繰り返し、クライアントさんの意図をより正確に覚えないといけないというわけです。

関連記事:スマートスピーカー
Amazon Echoについて調べてみた【Google Homeとの比較】
LINE Clova WAVEについて調べてみた
Google Home Miniを一週間使ってみた

関連記事:音楽ストリーミングサービス
【ミュージックアプリを徹底比較!】聴き放題 5選

『Amazon Echo (Newモデル)、チャコール 』画像をクリック!

クロワ

クロワ

投稿者の記事一覧

フリーライターのクロワです。主に生活のなかで役立つ記事やトレンド記事などを書いています。よろしくお願いします

✅ 草の実堂の記事がデジタルボイスで聴けるようになりました!(随時更新中)

Audible で聴く
Youtube で聴く
Spotify で聴く
Amazon music で聴く

コメント

  1. この記事へのコメントはありません。

  1. この記事へのトラックバックはありません。

関連記事

  1. 緊急事態宣言が出ても3日間はスーパーへ行かない方が良い
  2. 【ミュージックアプリを徹底比較!】聴き放題 5選
  3. ポータブルヘッドホンアンプとは 【ワンランク上の音質】
  4. Google Home Miniを一週間使ってみた【レビュー】
  5. 【利用のコツも教えます】メルカリの数字について調べてみた
  6. 汗以外も!男の体臭を科学する【体や衣類のニオイ対策】
  7. 5G 運用開始前夜!MWCでスマホの未来が見えた
  8. サブスクリプションサービス 【○○し放題 5選】

カテゴリー

新着記事

おすすめ記事

ジンバブエの過酷な現在 【アフリカ食糧庫からの転落、ムガベ独裁後も再びインフレ】

ジンバブエのあらましジンバブエ はアフリカ南部にある国であり、かつては南ローデシアとも言…

サンジェルマン伯爵について調べてみた 【不老不死、高い知能】

太古から不老不死は人類の夢であった。エジプトのミイラ作りは死者の復活を信じて行われ、ハンガリ…

誠意を見せろ!部下の不祥事を詫びるため、源頼朝が梶原景時に命じたのは…【鎌倉殿の13人】

「誠意を見せて下さいよ」そう言われた時、大抵の場合は「カネを払え」という遠回りなメッセージを…

フィリピンで普及するPiso WiFiとは 「PisoWiFi自動販売機の料金や使い方、オーナーにもなれる」

はじめに現代において、インターネット接続は私たちの生活にとって欠かせないものとなっている…

毛利敬親【多くの維新の人材を見出した そうせい候】

「そうせい候」毛利敬親(もうりたかちか)は、長州藩の第13代の藩主を務め、激動の幕末期におい…

アーカイブ

PAGE TOP