音声対話汎用AIアシスタントを作る前提で、「対話シナリオとAIを組み合わせた仕組み」について書く予定でしたが、その前に、前回、「ChatGPTのような昨今のAI（LLM：大規模言語モデル）が救世主に」と簡単に書いてしまったので、少し補足訂正をさせてください。まず、現代の（ノイマン型）コンピュータは「入力」された情報をCPUが何等かの「処理」をして「出力」するものです。前回の対話シナリオの処理部分を当てはめると、音声認識で変換された「テキスト文字」が、「対話シナリオ」を使って処理され、対話シナリオに記載された「決まった動作」が実行されるという流れにおいては・「テキスト文字」が　　「入力」(input)・「対話シナリオ」による処理が　　「処理」・「決まった動作」の実行が　　「出力」(output)となります。対話シナリオのデメリットは、この「入力」のパターンが沢山ありすぎる場合に、全てに対応する「処理」を書ききれず、処理できないものが発生してしまう、という点になります。逆に「処理」ができる場合には、確実に決まった動作をさせる事ができます。一方、昨今のAI（LLM：大規模言語モデル）のメリットは、「入力」パターンが膨大にあっても、推論「処理」をすることで何等かの「出力」を得る事ができる点にあります。音声対話型の汎用AIアシスタントを作るという前提で、「ChatGPTのような昨今のAI（LLM：大規模言語モデル）が救世主に」と書いたものの、この救世主の意図するところは、あくまでも、昨今のAI（LLM：大規模言語モデル）は「入力」部分において、膨大にあるパターンに対応できるという点になります。次回はAIの出力についてお話させていただく予定です。

ACUAH のプロジェクト説明の中に「対話シナリオ」という言葉があるのですが、そもそも「対話シナリオ」とは何か。というお話をさせていただきます。音声対話を実現する上で非常に重要な仕組みです。「対話シナリオ」とは、以下のような表と考えてください。テキスト文字に対して、どんな動作をすれば良いかが 1対1 で記載されている表です。音声認識の仕組みで、ユーザーの音（音声）がテキスト文字に変換される事をご説明しました。例えば、マイクに向かって「こんにちは」と言うと、「今日は」というテキスト文字に変換されます。では、その後はどうなるでしょうか。この「対話シナリオ」のテキスト文字列を調べます。すると、2行目に「今日は」というテキスト文字に対しては『手を振って「今日は」という音声を再生する』という動作が記載されています。そこで、この対話シナリオに従って、キャラクターが　手を振って「今日は」という音声を再生する、という動作をします。この、「対話シナリオ」のメリットは、・対話シナリオに該当するテキスト文字が記載されていれば、確実に（100%）決まった動作をさせる事ができるという点になります。逆に、対話シナリオに該当するテキスト文字が見つからない場合には、動作させる事ができません。（ACUAH でも、「分からなかった」という回答をします。）ユーザーは様々な言葉をマイクに向かって話しかけてきますので、どんな言葉を話してくるかを想定して、全てのテキスト文字を対話シナリオに記載しなければなりません。（特に日本語はハイコンテクストですので、主語が除かれたりして難解です。）そこで、ChatGPTのような昨今のAI（LLM：大規模言語モデル）が救世主となりました。ユーザーが発する様々な言葉に対して、推測に基づいて何かしらの応答をする事が可能になりました。これは自然な音声対話を実現する上で欠かせないものです。次は ACUAHのような音声対話汎用AIアシスタントを作る前提で、「対話シナリオとAIを組み合わせた仕組み」について、お話できればと思いますが、ACUAH はなぜ対話シナリオにこだわるのか。「対話シナリオは、確実に決まった動作をさせる事ができる」というのは大切な事なので、ご理解頂けると幸いです。

ACUAH はスマートスピーカーのような"OK, ○○"、"Hey, ○○"といった「ウェイクワード」による音声認識開始の仕組みは使っていません。ウェイクワードは、スマートスピーカーなどが常にユーザーからの音（音声）を待ち受けているような状況において、その音がユーザー（人間）の発した声なのかを区別し、音声認識の精度を高めるために利用するものです。また、その他の利点として、スマートスピーカー等に手を触れる事なく操作が可能になる点があります。ウェイクワードは音声認識で機器を操作するための技術ではあるのですが、一方で、・毎回、ウェイクワードを言う必要がある・ウェイクワード自体が対話として不自然（普段の会話で使わない言葉を言わなければならない）・誤ってテレビやラジオの音声を拾って誤動作してしまう場合がある・上手く認識してくれないといった課題があります。音声認識で動作が可能な照明に「○○、明かりを点けて」と話しかけているのに、うまく動作せず、結局リモコンでボタンを押して操作してしまう。そういった経験をされている方もいらっしゃるのではないでしょうか。慣れてしまえば特に気にならないのですが、ウェイクワードは、UI（ユーザーインターフェース）としては意外とユーザー側に負担が掛かっているとも言えます。比べて、「ボタンや画面をタップ」して音声認識を開始するというのはどうでしょうか。・ボタンや画面をタップするという物理的な操作で、確実に音声認識が開始できる・ウェイクワードが不要なので、自然な声掛けができる従来の簡単な仕組みですが、手を振れないで操作できる事が必要な状況でなければ、実は、UIとしてそれ程悪いものではないと思います。ACUAH は「キャラクターをタップ」して音声認識を開始する仕組みとしています。前回お話した、デバイスローカルの音声認識技術を使っている事が理由の一つではあるのですが、音声対話AIアシスタントの普及版を作りたいという開発方針に、現状では適したUIだと考えています。次回は「対話シナリオ」についてお話させていただきます。

今日は音声対話を実現する「音声認識」についてお話します。ACUAH は、音声対話型の汎用AIアシスタントを目指して開発をしていますので、音声認識はコアな技術となります。「音声認識」とは、音（音声）を解析してテキスト文字に変換する技術です。例えば、PCのマイクに向かって「こんにちは」と言葉を発した際に、その音声が解析されて「今日は」というテキスト文字が画面に表示される技術です。スマートフォンで利用できる音声認識技術には、その解析をスマートフォン内部で行うデバイスローカル版と、インターネット上のサーバーで行うサーバー版があります。ACUAH は、デバイスローカル版の音声認識を利用しています。・Android: Android speech recognizer・iPhone(iOS): SFSpeechRecognizerと呼ばれる仕組みです。サーバー版に比べて変換精度は低いですが、以下の点で本プロジェクト上のメリットが大きいとの判断によるものです。・利用回数に制限がなく、無料で使える・音声データがスマートフォン内部で処理されセキュリティ面で安心ところで、ACUAH はスマートスピーカーのような"OK, ○○"、"Hey, ○○"といったウェイクワードによる音声認識開始の仕組みは採用していません。キャラクターをタップする事により、音声認識を開始する仕組みとしています。次回は「ウェイクワード」についてお話できればと思います。

クラウドファンディングがスタートしました。初日から多くのご支援を頂きましてありがとうございます。活動報告では、本プロジェクトについて本文ではお伝えしきれなかった事を中心に記載させて頂く予定です。クラウドファンディング終了までよろしくお願いいたします。最初の投稿は、先日2024/7/3（水）～5（金）に東京ビックサイトで開催されました「ライフスタイルWeek【夏】雑貨EXPO STARTER 」出展のご報告です。STARTER枠、展示会場隅の小さなブースでしたが、3日間で100名以上の方にお越し頂けました。当日お話させて頂きました方々、ありがとうございました。この手のガジェットは、通常、XRやメタバース系の展示会に出展される事が多いのですが、プロジェクトの特性上そういった分野に限定せず、なるべく多くの方に普及させたいという思いもあり、雑貨EXPOへの出展とさせていただきました。通りすがりに疑似ホログラムの映像をご覧になられて興味を持って頂いた方更に音声対話で動作するのをご覧になられて驚かれる方様々な業種の方に商品をお見せする事ができ、実りある出展となりました。展示会をきっかけに、国内外様々な企業様から製品の利用、販売や共同開発のご相談も頂いております。クラウドファンディングでご支援頂きました皆様も、今後のプロジェクトの展開にご期待頂ければと思います。よろしくお願いいたします。

CsUnite

千葉県

他に1件のプロジェクトを掲載しています

当社は、「AIが人々の日常に安心して寄り添える社会」の実現を目指し、AIの倫理的な活用を常に意識した設計を核に製品・サービスを開発しています。最新AIと従来技術を最適に掛け合わせた独自アプローチにより、IP（キャラクター・音声・情報）を守りながらキャラクターとのコミュニケーションを可能にする「ACUAH（アクア）」と、疑似ホログラム映像でキャラクターとの対話を実現する「3Dホログラム装置」を提供しています。

メッセージを送る

リターンを選ぶ

目標金額未達でもリターンが届きます(All-in方式)

3,000円

【お礼のメッセージ】感謝の気持ちを込めて、お礼のメッセージをお送りします。

支援者：8人

お届け予定：2024年09月

このリターンを選択する
10,000円

【開発支援・体験会】・代表の経歴から"ACUAH"の開発経緯、　今後のロードマップについてお話させていただきます。・アプリケーションの操作方法や機能についてご説明いたします。・"ACUAH editor"を使ったデータの差し替え方法をご説明し、ご体験いただきます。・開発について皆さまと意見交換をさせていただきます。・日程：2024年9月～・時間：1回 3時間～4時間程度を予定・場所：千葉県千葉市、他別途調整 ※支援者様の交通費や滞在費は各自でご負担ください。 ※日程、場所、内容につきましてはクラウドファンディング終了後、別途調整し詳細をご案内いたします。 ※関東以外での開催となる場合には、参加人数により別途交通費をご負担頂く事もあります。ご相談させていただきます。

支援者：0人

お届け予定：2024年09月

このリターンを選択する
17,000円

【疑似ホログラムスマートフォンスタンド（量産型）】 ■対応スマートフォンサイズ：　幅約64mm～約78mm まで（ケース等含まず） ■材料：　アクリル、PA12、PP ■付属品：　アクリル板、ステージバック用紙、ネジ、ナット、　取扱説明書、組立説明書、ミニドライバー、　アプリDL用QRコード（予定） ※量産型のスタンドを3Dプリンターを使って作成します。 ※部品の調整により、見た目の細部が写真と異なる場合があります。 ※量産化された場合には、同様のものが低価格で販売される可能性があります。

支援者：15人

お届け予定：2024年10月

このリターンを選択する
20,000円

【体験会・ワークショップ】・代表の経歴から"ACUAH"の開発経緯、　今後のロードマップについてお話させていただきます。・疑似ホログラムスマートフォンスタンドを工作用紙を使って作ります。　（材料は弊社にて用意いたします。）・アプリケーションの操作方法や機能についてご説明いたします。・"ACUAH editor"を使ったデータの差し替え方法をご説明し、ご体験いただきます。・開発について皆さまと意見交換をさせていただきます。・日程：2024年9月～・時間：1回 4時間～5時間程度を予定・場所：千葉県千葉市、他別途調整 ※支援者様の交通費や滞在費は各自でご負担ください。 ※日程、場所、内容につきましてはクラウドファンディング終了後、別途調整し詳細をご案内いたします。 ※関東以外での開催となる場合には、参加人数により別途交通費をご負担頂く事もあります。ご相談させていただきます。

支援者：1人

お届け予定：2024年09月

このリターンを選択する
30,000円

残り12

【疑似ホログラムスマートフォンスタンド（試作版）】透明アクリル板で作成した試作スタンドです。＜こちらの商品は今後の製造販売予定はありません。＞ ■対応スマートフォンサイズ：　スマートフォンほぼ全機種対応　※ 備考欄に、本スタンドと組み合わせる予定のスマートフォンの機種をご記入ください。画面サイズに合わせてポリスチレンボードをカットして同封いたします。 ■材料：　アクリル、ポリスチレン ■付属品：　アクリル板、ポリスチレンボード、ネジ、ナット、ワッシャー　組立説明書、アプリDL用QRコード（予定）　充電ケーブル（USB Type-C/Type-C）　※ iPhone (Lightning) の場合は、Type-C to Lightning のコネクタを使用しますので、備考欄にその旨ご記載ください。 ■送料込 ※1つずつ手作業で製作いたします。 ※アクリル板の曲げ加工等全て手作業となりますので、多少の歪みや誤差が出る可能性があります。（利用には問題ない範囲です。）

支援者：3人

お届け予定：2024年11月

このリターンを選択する