IoT

スマートスピーカーの仕組みについて調べてみた

スマートスピーカー(通称スマスピ)は、Amazon Echo、Google Home、Clova WAVEの3強が、メインと廉価版を出したことで、急に身近なものになりましたね。ネットでも色々な使い方を紹介していますし、私も色々と調べてきました。さらに2018年4月にはAmazon Echoが一般販売され、大きな話題となりました。

そこで今回はちょっと目先を変えて、スマスピの仕組みについて調べたいと思います。

ユーザーの声を拾う

スマートスピーカーの仕組みについて調べてみた

スマスピは、声で呼びかけると応答するシステムで、物理的なインタフェースを必要としません。逆に、声だけなので人によって声質やしゃべり方、クセが違ってきますよね。それをどうやって判別して、正しい答えを出してくれるのでしょうか。

仕組みそのものはメーカー(ブランド)によって違いはほとんどありません。

ユーザーの声をクラウドサービスに送ることと、クラウドサービスからの答えを音声にしてユーザーに答えることだけです。

まず、ユーザーの声を正しく拾うためには、周囲の騒音と声を聞き分けること、複数のユーザーの声を聞き分けること、ユーザーの言葉の内容を正確に聞くことが必要になります。

この点は、すでにAppleのSiriやGoogleのGoogleアシスタントで実績がありますが、スマスピの場合はどちらの方向から聞こえてきてもいいように精度を高めてあります。

タスク指向対話と非タスク指向対話

マイクが音声を拾うと、次はそれをネットを通してクラウドサービスに送ります。

現在はWi-Fiなどでルーターに接続しますが、情報量としては小さいため、ユーザー側ではすでにあるネット環境をそのまま使えます。ネットでクラウドサービスに送られた音声は、ここで音声認識ロジックというシステムで解析されます。

例えば、「天気を知りたい」と言った場合は「天気」と「知りたい」に分解して、ユーザーの意図を理解しやすくします。このように目的があって話しかけることを「タスク指向対話」といい、目的のない雑談などは「非タスク指向対話」のシステムといいます。前者の場合は答え方も範囲が決まっていますが、後者の場合は答える範囲が決まっていないため、処理方法も違ってきます。

「非タスク指向対話」では、とにかく「こういう会話にはこう答える」というバリエーションを自己学習させるしかないので、ユーザーの望み通りの答えを出すまでは、時間がかかります。この点では、Amazon Echoより、Google Homeが優れているといわれる理由ですね。また、対話を繰り返すことで精度が上がったことを実感した人もいると思います。

大切なことはクラウドサービスが行っている

「非タスク指向対話」に比べて「タスク指向対話」のシステムのほうが処理が簡単なように書きましたが、実際は仕組みが簡単なだけであって、やることは大変です。

先ほどの「天気を知りたい」と言った場合なら、膨大なリストのなかから「天気」と「知りたい」という単語を探し出し、単語同士をつないで初めてユーザーのしたいことを理解するわけです。でも、実はここが大切な作業で、「知りたい」「教えて」「聴きたい」など、同じ意味でも違う言い回しや、ニュアンス、個人のクセにも対応できるように、常にデータを蓄積しています。

こうして「何をするか」を理解すると、外部のクラウドサービスにアクセスしてデータを受け取り、ユーザーに送り返します。この場合の外部とは、天気予報情報を提供しているサービスのことです。こうした外部のクラウドサービス(スキル)の多さでは、Echoなどのアレクサのほうが充実していますね。

ところで現在、Bluetooth対応スピーカーがGoogle Homeに対応するようになりました。こうなると「スマスピ本体のスピーカーから音を出すのか、外部のスピーカーから音を出すのか」の優先順位を判断しないといけなくなります(すでにEchoには3.5mmジャックがありますが、無線接続の場合です)。

こうした場合は、事前に対応するデバイスをアプリなどを利用して登録しておく必要がありますが、実際はクラウドサービス側で管理しています。Android搭載端末を利用していてGoogle Homeも持っている人なら分かると思いますが、両方を揃えて「OK google ○○して」といった場合にGoogle Homeだけが答えますよね。照明のオン/オフなどIoT管理もこのようにクラウドサービス側で行うわけです。

警察の捜査には使えるのか?

こうして、クラウドサービスから戻ってきた答えをスマスピが音声としてユーザーが意図する形で提供します。天気予報を内蔵スピーカーから流したり、音量を調節したりするわけですね。

ここまでをまとめると、スマスピはユーザーとクラウドサービスをつなぐデバイスということになります。ユーザーの声を覚えるのも、好みを記録するのも実際にはクラウドサービスが行うわけです。アメリカの警察では、このクラウドサービスの記録を殺人事件の捜査に利用しようとしたことがあります。ある容疑者が所有していたスマスピから何らかの情報が得られるのではないかという考えでしたが、企業側は「正当な理由がない限り、個人情報は提供できない」と当然のように対応しました。

対応としては真っ当だと思いますが、仮に裁判所の正式な令状があっても大した情報は得られないでしょう。

ストリーミング再生は利用すべし!

それは常にユーザーの声を記録しているわけではなく、「Alexa」や「OK Google」のようにコマンドワードの後に発した単語しか拾っていないからです。コマンドワードは「この後の言葉が命令だよ」ということを認識させて、記録する部分を明確にしているためです。スマスピはレコーダーではないので、あくまでコマンドワードに続く限定的な言葉しか記録してないということになります。

だから、コマンドワードの後に殺人事件に関するワードを容疑者が発していなければ、正当な理由にはなりません。

ちなみに、スマスピの使い方のひとつに、音楽配信サービスを理由するというものがありますが、本体にはスマートスピーカーとは別にストリーミング再生プレーヤーが独立して実装されています。音楽を聴く場合は、スマスピが直接ネット経由でサーバーに接続し、ここからデータを受け取る形になっているんです。せっかく内蔵されているんですから、スマスピを手に入れたらストリーミング再生機能を使わないのは勿体ない気がしますね。

まとめ

ユーザー、スマスピ、クラウドサービス、外部サービスの関係は、私のようなライターの関係で表現することも出来ます。

ユーザーがクライアントさんで、ライターがスマスピとクラウドサービス、そして、ライターが使うインターネットが外部サービスです。例えばクライアントさんから「こんな記事が欲しい」という依頼があれば、その意図をライターが理解して、どこからどのような情報を集めるかを判断して実行します。そして、インターネットなどで集めた情報をまとめてクライアントさんに提出するわけです。

ただ、クライアントさんが具体的に思い描く記事をライターが提出できるようになるまでは、お互いにやり取りを繰り返し、クライアントさんの意図をより正確に覚えないといけないというわけです。

関連記事:スマートスピーカー
Amazon Echoについて調べてみた【Google Homeとの比較】
LINE Clova WAVEについて調べてみた
Google Home Miniを一週間使ってみた

関連記事:音楽ストリーミングサービス
【ミュージックアプリを徹底比較!】聴き放題 5選

『Amazon Echo (Newモデル)、チャコール 』画像をクリック!

クロワ

クロワ

投稿者の記事一覧

フリーライターのクロワです。主に生活のなかで役立つ記事やトレンド記事などを書いています。よろしくお願いします

✅ 草の実堂の記事がデジタルボイスで聴けるようになりました!(随時更新中)

Audible で聴く
Youtube で聴く
Spotify で聴く
Amazon music で聴く

コメント

  1. この記事へのコメントはありません。

  1. この記事へのトラックバックはありません。

関連記事

  1. Google Homeで何ができるのか調べてみた
  2. 日本のAI技術が世界に普及する日が近い?【海外でも注目の日本のA…
  3. Appleはなぜ画期的な新製品を発表しないのか?!
  4. Amazonサービスを徹底的に使い倒す!裏技10選
  5. 汗以外も!男の体臭を科学する【体や衣類のニオイ対策】
  6. Amazonのデリバリープロバイダはもう限界!どうなる遅延問題
  7. 自動車保険 おすすめ5選 【毎年変わる最安値】
  8. マイルを貯めるにはどのクレジットカードが良いか?【オススメ5選】…

カテゴリー

新着記事

おすすめ記事

実体験【100円ショップのオススメ】ひんやり冷感グッズ6選

いよいよ夏が近づくと男女関係なく汗には気をつかうし、暑さ対策やUV対策もしないといけません。…

ヒムラーの謎の城について調べてみた【ナチス親衛隊】

1945年3月、敗戦が迫るナチス・ドイツ。ナチスの親衛隊全国指導者「ハインリヒ・ヒムラー」は、奇妙な…

ブロンテ姉妹とは(シャーロット、エミリー、アン)【全員短命の天才小説家】

ブロンテ姉妹とはブロンテ姉妹とは、長女のシャーロット・ブロンテ(1816~1855)、次女の…

【光る君へ】 地方の最高責任者「受領」とは? 「治安の悪化と武士の台頭」

「受領(ずりょう)」は平安時代の地方統治を理解する上で欠かせないキーワードになりますが、教科…

強いだけじゃないんです!戦国時代「甲斐の虎」と恐れられた武田信玄の偉業「信玄堤」

戦国時代「甲斐の虎」と恐れられ、天下に名を馳せた武田信玄(たけだ しんげん)。その偉大さにつ…

アーカイブ

PAGE TOP