IoT

スマートスピーカーの仕組みについて調べてみた

スマートスピーカー(通称スマスピ)は、Amazon Echo、Google Home、Clova WAVEの3強が、メインと廉価版を出したことで、急に身近なものになりましたね。ネットでも色々な使い方を紹介していますし、私も色々と調べてきました。さらに2018年4月にはAmazon Echoが一般販売され、大きな話題となりました。

そこで今回はちょっと目先を変えて、スマスピの仕組みについて調べたいと思います。

ユーザーの声を拾う

スマートスピーカーの仕組みについて調べてみた

スマスピは、声で呼びかけると応答するシステムで、物理的なインタフェースを必要としません。逆に、声だけなので人によって声質やしゃべり方、クセが違ってきますよね。それをどうやって判別して、正しい答えを出してくれるのでしょうか。

仕組みそのものはメーカー(ブランド)によって違いはほとんどありません。

ユーザーの声をクラウドサービスに送ることと、クラウドサービスからの答えを音声にしてユーザーに答えることだけです。

まず、ユーザーの声を正しく拾うためには、周囲の騒音と声を聞き分けること、複数のユーザーの声を聞き分けること、ユーザーの言葉の内容を正確に聞くことが必要になります。

この点は、すでにAppleのSiriやGoogleのGoogleアシスタントで実績がありますが、スマスピの場合はどちらの方向から聞こえてきてもいいように精度を高めてあります。

タスク指向対話と非タスク指向対話

マイクが音声を拾うと、次はそれをネットを通してクラウドサービスに送ります。

現在はWi-Fiなどでルーターに接続しますが、情報量としては小さいため、ユーザー側ではすでにあるネット環境をそのまま使えます。ネットでクラウドサービスに送られた音声は、ここで音声認識ロジックというシステムで解析されます。

例えば、「天気を知りたい」と言った場合は「天気」と「知りたい」に分解して、ユーザーの意図を理解しやすくします。このように目的があって話しかけることを「タスク指向対話」といい、目的のない雑談などは「非タスク指向対話」のシステムといいます。前者の場合は答え方も範囲が決まっていますが、後者の場合は答える範囲が決まっていないため、処理方法も違ってきます。

「非タスク指向対話」では、とにかく「こういう会話にはこう答える」というバリエーションを自己学習させるしかないので、ユーザーの望み通りの答えを出すまでは、時間がかかります。この点では、Amazon Echoより、Google Homeが優れているといわれる理由ですね。また、対話を繰り返すことで精度が上がったことを実感した人もいると思います。

大切なことはクラウドサービスが行っている

「非タスク指向対話」に比べて「タスク指向対話」のシステムのほうが処理が簡単なように書きましたが、実際は仕組みが簡単なだけであって、やることは大変です。

先ほどの「天気を知りたい」と言った場合なら、膨大なリストのなかから「天気」と「知りたい」という単語を探し出し、単語同士をつないで初めてユーザーのしたいことを理解するわけです。でも、実はここが大切な作業で、「知りたい」「教えて」「聴きたい」など、同じ意味でも違う言い回しや、ニュアンス、個人のクセにも対応できるように、常にデータを蓄積しています。

こうして「何をするか」を理解すると、外部のクラウドサービスにアクセスしてデータを受け取り、ユーザーに送り返します。この場合の外部とは、天気予報情報を提供しているサービスのことです。こうした外部のクラウドサービス(スキル)の多さでは、Echoなどのアレクサのほうが充実していますね。

ところで現在、Bluetooth対応スピーカーがGoogle Homeに対応するようになりました。こうなると「スマスピ本体のスピーカーから音を出すのか、外部のスピーカーから音を出すのか」の優先順位を判断しないといけなくなります(すでにEchoには3.5mmジャックがありますが、無線接続の場合です)。

こうした場合は、事前に対応するデバイスをアプリなどを利用して登録しておく必要がありますが、実際はクラウドサービス側で管理しています。Android搭載端末を利用していてGoogle Homeも持っている人なら分かると思いますが、両方を揃えて「OK google ○○して」といった場合にGoogle Homeだけが答えますよね。照明のオン/オフなどIoT管理もこのようにクラウドサービス側で行うわけです。

警察の捜査には使えるのか?

こうして、クラウドサービスから戻ってきた答えをスマスピが音声としてユーザーが意図する形で提供します。天気予報を内蔵スピーカーから流したり、音量を調節したりするわけですね。

ここまでをまとめると、スマスピはユーザーとクラウドサービスをつなぐデバイスということになります。ユーザーの声を覚えるのも、好みを記録するのも実際にはクラウドサービスが行うわけです。アメリカの警察では、このクラウドサービスの記録を殺人事件の捜査に利用しようとしたことがあります。ある容疑者が所有していたスマスピから何らかの情報が得られるのではないかという考えでしたが、企業側は「正当な理由がない限り、個人情報は提供できない」と当然のように対応しました。

対応としては真っ当だと思いますが、仮に裁判所の正式な令状があっても大した情報は得られないでしょう。

ストリーミング再生は利用すべし!

それは常にユーザーの声を記録しているわけではなく、「Alexa」や「OK Google」のようにコマンドワードの後に発した単語しか拾っていないからです。コマンドワードは「この後の言葉が命令だよ」ということを認識させて、記録する部分を明確にしているためです。スマスピはレコーダーではないので、あくまでコマンドワードに続く限定的な言葉しか記録してないということになります。

だから、コマンドワードの後に殺人事件に関するワードを容疑者が発していなければ、正当な理由にはなりません。

ちなみに、スマスピの使い方のひとつに、音楽配信サービスを理由するというものがありますが、本体にはスマートスピーカーとは別にストリーミング再生プレーヤーが独立して実装されています。音楽を聴く場合は、スマスピが直接ネット経由でサーバーに接続し、ここからデータを受け取る形になっているんです。せっかく内蔵されているんですから、スマスピを手に入れたらストリーミング再生機能を使わないのは勿体ない気がしますね。

まとめ

ユーザー、スマスピ、クラウドサービス、外部サービスの関係は、私のようなライターの関係で表現することも出来ます。

ユーザーがクライアントさんで、ライターがスマスピとクラウドサービス、そして、ライターが使うインターネットが外部サービスです。例えばクライアントさんから「こんな記事が欲しい」という依頼があれば、その意図をライターが理解して、どこからどのような情報を集めるかを判断して実行します。そして、インターネットなどで集めた情報をまとめてクライアントさんに提出するわけです。

ただ、クライアントさんが具体的に思い描く記事をライターが提出できるようになるまでは、お互いにやり取りを繰り返し、クライアントさんの意図をより正確に覚えないといけないというわけです。

関連記事:スマートスピーカー
Amazon Echoについて調べてみた【Google Homeとの比較】
LINE Clova WAVEについて調べてみた
Google Home Miniを一週間使ってみた

関連記事:音楽ストリーミングサービス
【ミュージックアプリを徹底比較!】聴き放題 5選

『Amazon Echo (Newモデル)、チャコール 』画像をクリック!

クロワ

クロワ

投稿者の記事一覧

フリーライターのクロワです。主に生活のなかで役立つ記事やトレンド記事などを書いています。よろしくお願いします

コメント

  1. この記事へのコメントはありません。

  1. この記事へのトラックバックはありません。

関連記事

  1. カードを使いこなす最新情報 5選
  2. Amazonサービスを徹底的に使い倒す!裏技10選
  3. キャリアと格安スマホの違い【2020年には5G通信】
  4. コストコは本当にお得なのか?人気の理由を調べてみた
  5. IoT【第4次産業革命】とはなにか?【モノのインターネット】
  6. 20代~30代女性におすすめのオンラインショップ 「通販大好きな…
  7. 日本のAI技術が世界に普及する日が近い?【海外でも注目の日本のA…
  8. 実体験 【100円ショップ】買って損するもの 7選

カテゴリー

新着記事

おすすめ記事

和田義盛(横田栄司)と巴御前(秋元才加)の子供?朝比奈三郎義秀の武勇伝【鎌倉殿の13人】

……しかるに朝夷名三郎義秀惣門を破りて南庭へ乱入し、籠るところの御家人らを攻撃す……(意訳:朝夷…

【チューリップバブル】世界最古のバブルについて調べてみた

世界最古のバブル2021年、日本やアメリカの株価はバブルに突入したかと言われるくらいの株高になっ…

日本の謎の未確認生物【UMA】「ハマちゃん、イッシー、クッシー」

未確認生物【UMA】 とはUMAとは、UMAとも表記され生物学的・科学的に確認されておらず、目撃…

徳川家光に諫言しすぎて嫌われた 青山忠俊の心 ~「東京・青山の由来」

青山忠俊とは青山忠俊(あおやまただとし)とは、徳川家康・秀忠に仕えた譜代の家臣で、特に2…

暴君の代名詞?武烈天皇は本当に悪逆非道だったのか調べてみた

初代・神武天皇の即位から第126代の今上陛下(現在の天皇陛下)まで2681年の永きにわたって日本国と…

アーカイブ

PAGE TOP