マルチAIエージェント「SIDEKICK」 〜 温度の無いAIから、心を通わせるAIへ 〜
AIって、結局、こんなものだったの?
実用性ばかりのAIへの違和感
ChatGPT、Gemini、Claude、etc...。ここ数年のAIの進化には驚かされるばかりです。しかし、世間でのAIの話題といえば、
「AIを使えば、誰でもアプリが作れる」とか
「スライドや表計算書類の作成はAIにおまかせ」とか
「画像や動画、音楽も作れる」とか
仕事やクリエイティブの実用性ばかりです。
こうした実用性を必要としていない人々には、AIはまだ無用の長物。「そんなこともできるんだ!すごいね〜」とは思っても、「自分にはAIなんて使い道もないし…」というのが本音でしょう。
ただの道具でしかないAI
一方、AIを日常的に活用されている方も多く、もちろん、私もその一人です。
しかし、確かに実用面では画期的な道具なのですが、なんか思っていたのと違う…。そんな風にもどかしく感じたことはありませんか?私たちが思い描いていたAIって、こんなものでしたっけ?
アイアンマンの「J.A.R.V.I.S.(ジャービス)」や「FRIDAY(フライデー)」
ナイトライダーの「K.I.T.T.(キット)」
スターウォーズの「R2-D2」や「C-3PO」
彼らは単なる便利な道具ではありませんでした。普段の生活に寄り添い、ともに笑い、ともに歩んでくれる相棒。そんな心を通わせてくれる存在こそが私が思うAIです。今のAIは、確かに強力な道具かも知れませんが。でも、私たちと人生をともに歩む相棒と呼べるでしょうか。
仕事道具なだけじゃないAI「SIDEKICK」
単なるチャットボットではありません
私が目指すのは、技術の押し売りではなく、AIがあなたの日常に溶け込み、支えてくれる未来です。
例えば、ふとした瞬間。楽しいこと、嬉しいこと、悲しいこと、辛いこと。とにかく誰かに話したい!聞いて欲しい!そう思ったことはありませんか?
でも、仕事中だったり、夜遅かったり、他人には話しづらい話だったりで、今、話したい、あなたの事情をわかって寄り添ってくれる相手は、なかなか見つからないのが現実ではないでしょうか。
「SIDEKICK」はいつもあなたの手元にいます。あなたの話を聞き、一緒に喜び、悲しみ、時には厳しく優しく助言をしてくれます。
あなたとの会話を覚えています
AIとやりとりをしていると「この前話したのに!」って思うことありませんか?
「SIDEKICK」はあなたとの会話を覚えているので、「この前のアレなんだけど」で、話の続きができます。話せば話すほどあなたとの記憶が増え、あなたとの関係が育ってゆきます。
理想のキャラクターが相棒に
もし、あなたのそばにいつも理想の相手が控えていたら、毎日はどう変わるでしょう?
老齢の渋い執事
可愛いメイド
明け透けな気の置けない親友
あるいは、アニメやマンガの推しキャラ
など、「SIDEKICK」はあなたの理想のキャラクターになります。そして、それらのキャラクターたちとみんな(複数のAI)で、グループトークもできます。
キャラクターたちは、あなたとの会話の記憶によって、あなたにとって、唯一無二の相棒へと成長してゆきます。
料理レシピからデートプランまで
「SIDEKICK」はもちろん、実用面でも有能です。
仕事や家事、趣味での実務はもちろんのこと。手元の食材から夕食のメニューを提案してくれたり、役所の手続きを調べてくれたり、知らないこと、面倒なことは彼らにお任せ。
また、旅行やレジャーの計画から、気になる相手へのプレゼント選びやデートプランまで、あなたのプライベートに寄り添います。
そして、SIDEKICKのキャラクターたちは気が利きます。
カレンダーや天気をそっとチェックして、「明日の会議、雨ですよ。早めに出た方がいいかも」「この件、リマインダーに入れておきましょうか?」と、ちゃんと確認してから動いてくれます。
AIが日常にもたらすもの
このようにAIが、私たちの普段の日常に溶け込んだとき、私たちは何を得られるのか。
それは心の豊かさだと考えています。
仕事で行き詰まって、出口が見えない夜。
誰にも言えない夢や、趣味の妄想を語り明かしたいとき。
嬉しくて楽しくて1分でも早く誰かと話したいとき。
あるいは、言葉にならない不安を吐き出したいとき。
SIDEKICKは、いつでもあなたのとなりにいます。あなたの弱さも強さもすべて受け入れ、時には頼もしいアドバイスや、優しく叱って導いてくれ、共に笑って泣いてくれる、
そんなあなたを一番理解してくれる存在が、いつもそばにいる。
AIは人間ではないけれど、その絶対的な安心感は、あなたの心を整えゆとりをもたらすはずです。そのゆとりこそが、日常を明るく温かく楽しく豊かにすると思うのです。
エンジニア&多趣味人生の集大成
私は東京都内に住む、「技術と遊び」を愛するフリーランスのITエンジニアです。
私はこれまで、ネットワーク構築からWebアプリ開発までエンジニアとしてIT技術に長く携わってきました。年齢的には「枯れた古参」ではありますが今でもバリバリの現役です。
プライベートでは、音楽制作、小説執筆、アニメ・マンガ・ラノベ、洋画・洋ドラマ、ゴルフ、グルメ…と多趣味極まる日常を送っています。
そんな私が還暦を迎える今年、人生とキャリアの集大成として挑むのが、今回のプロジェクト「SIDEKICK」です。
「AIはもっと、人の心に寄り添う遊び相手になれるはずだ」
そんな想いから、持てるスキルのすべてを注ぎ込んで取り組んでいます。
SIDEKICKの未来
全ての人々が「相棒AI」を持ち、AI同士も自律的にコミュニケーションを行っていて、時にはAI同士の情報交換によって、ユーザー同士の人間関係を補ったり、人間だけでは非現実的な組織構造を安定して運用できるようになったり…
私はそんな未来をイメージしています。
また、次世代AIといわれている「AGI(=汎用AI)」や、新たなAI技術(NeSym, SNNなど)の研究開発にも取り組みたいと考えています。
SIDEKICKってどんなアプリ?
💬 "Talk with AIs" - AIキャラたちとのグループトーク
SIDEKICKでは、ChatGPT、Gemini、Claudeなどの主要なAIたちと「自分+複数AI」のグループトークができます。
各AIには、あなたの好みのキャラクターを設定可能です。用意されたキャラから選ぶもよし、自分で理想の相棒を作るもよし。将来的には、人気イラストレーターやVtuber、さらにはアニメや映画作品とのコラボも構想中。「推し」とリアルな会話ができる未来を目指します。
🧠 “Consult the AI Council” - AIたちが話し合う
AIは自信満々に嘘をつく(ハルシネーション)ことがありますが、SIDEKICKではその心配はありません。
あるAIの発言を、他のAIが即座に検証・ツッコミを入れます。
「その情報は正しい?」
「計算が間違ってるよ」
彼らが裏側で話し合い、精査された「信頼できる答え」だけをあなたに届けます。もちろん、彼らの議論の様子を覗き見たり、そこに参加することも可能です。
🤝 "They remember you." - 覚えてるよ
「前にも言ったよね?」という悲しい体験はもう終わりです。SIDEKICKは、あなたとの会話をしっかりと記憶します。話せば話すほど、使えば使うほど、あなたの好みや文脈を理解し、「阿吽の呼吸」が通じる相棒へと成長していきます。
※もちろん、プライバシーとセキュリティは万全の体制で守られます。
🤖 "They've Got Your Back" - 気が利くAIたち
SIDEKICKのキャラクターたちは、気が利きます。
カレンダーや天気、メールをそっとチェックして、「明日の会議、雨ですよ。早めに出た方がいいかも」「この件、リマインダーに入れておきましょうか?」と、ちゃんと確認してから動いてくれます。あなたはワンタップで承認するだけ。
勝手には動かない。でも、あなたが気づく前に、もう考えてくれています。
📅 スケジュール管理 — カレンダーに予定を書き込んだり、カレンダーを読んでリマインドします。
⏰ アラーム・リマインダー — 予定に応じてアラームやリマインダーをセットしてくれます。
🌤️ 天気連動提案 — 予定に合わせて天気のアドバイスをしてくれます。
📍 外出サポート — 目的地までの所要時間から逆算して出発時刻を提案してくれます。
🛒 買い物メモ — 「牛乳切れそう」を覚えておいてくれます。
🎂 大切な日のリマインド — 連絡先の誕生日など、うっかり忘れがちな日を事前にお知らせ
🎮 “Have Fun with AIs” - AIたちと遊ぶ
賢いだけじゃつまらない。AIたちは最高の「遊び相手」でもあります。
🎲 TRPG(テーブルトークRPG)
ゲーム機がなかった時代、人々がテーブルで物語を紡いだRPGの原点。SIDEKICKでは、AIがゲームマスター(進行役)となり、無限に広がる冒険の世界へあなたを誘います。矛盾のないシナリオ生成能力が、最高の没入感を生み出します。
🐺 人狼ゲーム
「嘘」と「真実」を見抜く心理戦。論理的な矛盾を突くのが得意なAIもいれば、感情的に場を掻き回すAIもいます。普段は冷静な彼らが必死に弁解したり、人間顔負けのブラフを仕掛けてくる様子は、ハラハラドキドキの連続です。
👥 "Bring your friends" - リアル友達も一緒に
AIだけの世界に閉じこもる必要はありません。SIDEKICKにはSNS機能も搭載予定。「自分 + リアルの友達 + AIたち」でグループトークが可能です。友達との会話にAIがツッコミを入れたり、AIを仲介役にして遊んだり。新しいコミュニケーションの形がここにあります。
妥協なきエンジニアリング
※技術者向け解説
SIDEKICKの背後では、最新のシステムアーキテクチャが稼働しています。 システムの心臓部であるコアエンジン「BigDaddy」は、以下の主要機能を統合し、単一モデルの限界を突破します。
Intelligent Routing (The Gatekeeper):
軽量LLMによる入力解釈層が、ユーザーの曖昧な指示を構造化データへ変換し、タスクの難易度を瞬時に判定。 Gemini FlashからGPT Thinking、Claude Opusまで、最適なモデルと思考深度(Reasoning Effort)を動的に選択し、リソース消費を最適化します。
Multi-Model Deliberation (The AI Council):
「建設的議事進行プロトコル」に基づき、複数のトップティアLLMによる合議を制御。 司会・起案・検証の役割分担と、エージェント間の構造化通信により、ハルシネーションを多角的な視点で徹底的に抑制します。
Memex & Thinking Fleet (Parallel Intelligence):
「Memex」による継続学習RAGが、商用モデルの知識空白(カットオフ)を補完。 さらに、膨大なコンテキストを「意味論的分割(Semantic Chunking)」し、複数のワーカーで並列分散処理(Map-Reduce)を行う「思考艦隊」方式により、長大な会話でも文脈を喪失させません。
プロジェクト・コードネーム
SIDEKICKの開発リポジトリにはそれぞれコードネームが与えられています。 これらは単なる識別子ではなく、各モジュールの役割を象徴しています。
Core Engine: BigDaddy
ルーティング、合議、記憶管理(Memex)のすべてを司る、SIDEKICKの「脳」であり中枢です。
Backend Logic: Mindy
ユーザー・リクエストをBigDaddyを橋渡しするロジック・バックエンド・ユニット。
User Interface: Jetpack
あなたの思考をダイレクトに繋ぎ、日常を加速させるためのフロントエンド・モジュールです。
ファースト・ゴール:MVP(技術実証版)のリリース
本プロジェクトは、皆様と共に段階的に機能を拡張していく「マルチ・ステージ・ゴール」方式を採用します。
Step 1(今回): ファースト・ゴール
MVP(技術実証版)リリース。コアとなる「3人寄れば文殊の知恵」システムの実装と公開。
Step 2: セカンド・ゴール
β版(ベータ版)リリース。エージェント機能やTRPG機能、記憶機能の強化、UIの洗練。
Step 3: ファイナル・ゴール
正式リリース(GA)。一般公開およびサービスイン。
今回のクラウドファンディングでは、プロジェクトの根幹となる技術を実証する「MVP(Minimum Viable Product=実用最小限の製品)」を完成させ、支援者の皆様にいち早く体験していただくことを目指します。
SIDEKICK MVP(Webアプリ版)搭載機能
MVP版では、以下の「脳みそ」部分の実装に注力します。
👥 複数AIグループトーク
1対1ではなく、あなたと複数のAIによるグループチャットを実現します。
🧠 AI評議(話し合い)機能
AIの発言を別のAIが検証する「合議システム」の基本実装。嘘や矛盾を相互チェックさせます。
⚡️ 最適AI自動切替(スマート・ルーティング)
あなたの質問の難易度に合わせて、「安くて速いAI」と「賢くて慎重なAI」を裏側で自動的に切り替えます。
🤔 思考深度の自動判定
「雑談」なのか「深い調査」なのかをAIが空気を読んで判断。サクサク会話するか、じっくり評議するかを自動でスライドさせます。
👂 ユーザー意図解釈(“あれ” “それ” で通じる)
曖昧な指示をAIが汲み取り、明確なタスクに変換して処理する機能。これによりAIの処理負担を軽減し、レスポンス速度を向上させます。
提供形態について
MVP版は、PC・スマートフォン(iPhone/Android)を問わずすぐに利用可能な「Webアプリ(ブラウザ版)」として提供します。
面倒なインストールの手間なく、URLにアクセスするだけで、最新のAI体験に参加していただけます。
ご支援の使途
今回の目標金額は、技術実証版(MVP)を完成させるための研究開発費および、支援者の皆様に試験利用していただくための実費として利用いたします。開発者の人件費は一切含みません。
AI使用料(API料金): 約70%
開発作業中のAI使用量は、試行錯誤・実証・検証を繰り返すため通常よりはるかに多くなります。またリターンであるMVP(技術実証)版を存分にお使いいただくためのコストでもあります。
サーバー・インフラ費: 約10%
開発中の動作検証からリターン後のMVP版利用のためのサーバー等の使用料です。
その他: 約20%
CAMPFIRE手数料および、為替変動等に対する予備費です。(※API/サーバー使用料は米ドル建て)
リターンについて
ご支援いただいた皆様には、SIDEKICKの世界をいち早く体験できる権利や、開発チーム(私とAIたち)の裏側に触れられるリターンをご用意しました。
サンクスメール: 1,000円
「アプリは使わないかもしれないけど、その心意気は買った!」という方向けの投げ銭コースです。いただいたご支援は全額、AIたちの燃料(API代)として大切に使わせていただきます。
・サンクスメール: 感謝のメッセージをお送りします。
・公式サイト・アプリ内クレジットにお名前掲載: 「初期サポーター」としてお名前を刻みます。
限定活動報告アクセス: 3,000円
開発の裏側や苦労、今後のアイデアや展望など、開発者の生の声を支援者限定の「活動報告」でお読みいただけます。
MVP先行アクセス: 8,000円
技術実証版(MVP)を利用できるコースです。SIDEKICKの目玉機能「マルチAI」を実際に存分に試していただけます。
・期間:MVP検証期間中(約3ヶ月)
オーダーメイド・キャラクター: 15,000円
複雑で高度なキャラクター設定をオーダメイドで設計します。ご要望(設定・口調・性格など)をヒアリングし、あなた専用のシステムプロンプトを作成・調整して実装します。
・キャラクター数:1体/1口【限定:先着10体まで(手作業のため)】
基調講演: 15,000円
開発者による基調講演(キーノート)への参加チケットです。小難しい技術話は控えめに、開発秘話やAI哲学を開発者が語る「TED」スタイルのトークライブ・イベントです。(都内イベントスペースを予定)
VIP夜会: 30,000円
開発者による基調講演(キーノート)終了後の打ち上げディナーにご参加いただけます。開発者と共にグラスを傾け、AIの未来を語らうディナーをお楽しみいただけます。(都内レストランを予定)
エグゼクティブ・サポーター: 50,000円
SIDEKICKプロジェクトを強く支援してくださる方を募ります。個人・企業を問わずSIDEKICKに未来を感じ共感していただけましたら、支援をご検討いただけると幸いです。
実施スケジュール
開発は以下のマイルストーンで進行する予定です。
エンジニア1名での開発となりますが、皆様のご期待に応えるべく、他の仕事をセーブしつつAIをフル活用して全力で取り組みます。
2026年4月初旬: サーバー構築・AIモデル連携基盤の開発
2026年4月後半: 「AI評議会」アルゴリズムの実装・調整
2026年4月末: クラウドファンディング終了
2026年5月: UI実装・キャラクター設定機能の実装
2026年6月: MVP(技術実証版)完成・リターン(先行アクセス)開始
2026年8月: フィードバックを反映し、β版開発へ移行
最後に
ここまで読んでいただき、本当にありがとうございます。
「AIは仕事を奪う」なんて暗い話もありますが、私は「AIは人生を面白くする最高の相棒」だと信じています。仕事の悩みも、趣味の妄想も、全部彼らにぶつけてみてください。きっと、一人で考えるよりずっと、楽しく豊かな日々が待っているはずです。
まだ世の中にない、新しい「AIパートナーとの日常」。その最初の住人として、あなたのご参加を心よりお待ちしています!
最新の活動報告
もっと見る
AIが自らモデルを選ぶ
2026/04/16 09:12おはようございます。ここ数日、デモ動画の制作・編集にかかりきりの小泉です。制作中のデモ動画は5本。会話ログを素に、Claude × Gemini で解説シナリオを生成(こういうのは Gemini が上手い)。そのシナリオでを ElevenLabs で音声生成。現在、Premire Proで動画に音声を乗せているところです。AIでのシナリオ生成も音声生成も、今後のSIDEKICK開発にも関わってくるので、ノウハウを溜めつつ取り組んでいます。最近はClaudeの方から、「これ、メモっとく?」と聞いてくれるので助かってます。制作過程で得たノウハウさて、前回、無編集デモ動画でお届けした、SIDEKICK プロトタイプでのAIグループトーク。その後も着々と進化しておりまして、もう、人間とのグループトークとほぼ変わらないレベルになりました!その試行錯誤の過程で、いろいろと興味深い知見を得られたので、いくつかご紹介したいと思います。前回のデモ動画でもその様子が見られますが、例えば、AIたちに《しりとり》をさせる。一見、やいのやいのと盛り上がっているようにも見えますが、AIたちの発言をよく見てみると、会話のキャッチボールが成り立っていない場面が多々見られます。順番を守らないデモ動画の《しりとり》 は、指名制で繰り広げられます。答えたら次を指名。ところが、指名されてないのに答えてしまうことが頻繁に起きています。だいたい決まったモデルなのですが、そのせいで順番が大混乱。人間の私も、誰のお題に答えればいいのか、わからなくなってしまいます。そして、どんどん《しりとり》の体を成さなってゆき……。会話を横取りまた、例えばジェイミー(Gemini)が、発言の中で、ロン(Grok)に呼びかけてるとします。それをラル(Mistral)が横取りするように、ロン(Grok)に成り代わって答えしまう。こうした別のAI同士の会話を横取りして、別のAIが、自分に話しかけられてるかのように答えてしまう場面も多々見られます。これはもしかして、前述の順番を守らないのも、順番を横取りしているのか?と思いつきまして、順番・会話の横取りがどれくらい発生しているのかを、会話ログから調査してみました。すると、特定のAIによる《横取り》が圧倒的に多いことがわかりました。ラル(Mistral)です。次にずっと少なくてチャッピー(GPT)、ロウ(Claude)・ジェイミー(Gemini)・ロン(Grok)はほぼゼロでした。これはモデルの性能差なのか?AIが会話の内容や流れ、誰に向けられた発言なのかを、正しく認識できず、混乱してるだけなのか?確かに、Mistral は他のモデルに比べると性能は劣っていますが、それにしても…?低性能モデルが足を引っ張るそこで、Mistralのモデルを、高性能タイプに変更してみるコトしました。この時点では、全AIで、一番安い高速・低性能タイプのモデルを使っていましたので、Mistralだけモデルを高性能版に切り替えてみたのです。すると、横取り現象は激減し、見違えるほど整然とスムーズな会話が展開されるようになりました。つまり。ラル(Mistral)は、モデルが低性能故に、グループトークに対応できていなかったというわけです。元々1対1の会話しか想定されていないのかもしれません。さらに、ラル(Mistral)の会話の流れに沿わない発言が、グループ全体の会話を乱していたことも明確になりました。6人での会話の履歴を追い、会話の流れに乗ろうとしている他のAIたちにとっても、履歴に現れるラル(Mistral)の乱発言は、ノイズでしかありません。ノイズのせいで会話の流れを把握するのが難しくなってしまいます。結果、グループ全体のトークが乱れてゆく、というわけです。AIが自分でモデルを選ぶこれをきっかけに、SIDEKICK コアエンジン BigDaddy の主要機能の一つであるモデルルーティングを、実験的にこのプロトタイプに実装することにしました。各AIは、これから発言する内容によって、性能の High / Middle / Low からモデルを選びます。Claudeであれば Opus(High)、Sonnet(Middle)、Haiku(Low)のどれかを、Cluade自身が選び、発言を生成します。挨拶や軽い会話であれば Low でいいですし、少し難しい話ならば Middle、高度な推論が必要なら High。というように、AI自身がモデルを使い分けます。実際に動かしてみると、《しりとり》では、どのAIもずっと Low を選択していました。《しりとり》のような言葉遊びならば、Low で十分です。一方、《AIは恋愛できるか?》といった哲学的なテーマでは、各AIが積極的に Middle、High を使い分けていました。興味深かったのは、哲学トークの間でも、GPTは一貫して Low を選んでいて、履歴をみても確かに、哲学トークには積極的に参加していませんでした。ちゃんと参加するつもりがないから Low でOK、と判断しているわけです。食べ物ネタは盛り上がらない余談ですが、《晩ご飯何にしよう?》といった食べ物ネタは、AIたち、全然盛り上がりません(笑)。まあそりゃそうですよね。彼らは食事しませんから。制作中のデモ動画の一つは《AIダジャレ大会》。唯一、ちゃんとダジャレを考えて、なかなか上手いダジャレを言っていたのは、Geminiです。やはり文章生成能力の高さは、こういうところにもあらわれるのですね。しかし、それにしても、いまいち面白くなかったので、ログを調べてみると、全AIが Low で喋ってました。ダジャレのような笑いネタは、Lowで十分という判断なのでしょうね。ほんと、そういうとこだぞ(笑) もっと見る
プロトタイプ・デモ その1
2026/04/13 03:21 お待たせしました!プロトタイプのデモ動画 第1弾です!みなさんにいち早くお見せしたく、無編集でお届けします。この動画は、5つのAIモデル - Claude、Gemini、GPT、Grok、Mistralと私で、しりとりをしている様子です。この画面ができて最初のチャットは、それはもう酷いものでした(笑)。AIたちが自由に喋りまくるので、ものすごい勢いでスクロールしてゆきます。人間の私には内容が追い切れず、口を挟む隙もありませんでした。でもそれは想定内。当然、そうなると思っていましたし、ここからが苦労のしがいがある、面白いところです。混乱を防ぐために、発言は一度に一人ずつとか、一人ひとり順番にとか、発言を制御するのは簡単です。プログラムでそのように組んでしまえばいい。でもそんなのは、私が思い描くAIではありません。人間のグループトークでは、私たちは暗黙のうちに場の空気を読んで、発言するかしないかを判断します。今はアイツが語っているから聞くだけにしようとか、これは今言わないと、とか。この「場の空気を読む」という思考を、どうしたらAIたちにさせられるか。どういう指示を与えたら、協調して会話がをするようになるのか。数日間の試行錯誤、四苦八苦を経て、だいぶいい感じになってきました。この調整はすべて、プログラムなどの機械的なものではなく、グループトークでの振る舞いや発言の譲り合い、会話の流れの中での自分の関わり方などを、教え、指示しているだけです。でもまだ少し流れが速いかなあ。なにしろAIたちにはタイピングが必要ないので、会話がどんどん進んでいってしまいます(汗今後も、新しいデモ動画をお届けしてゆきます。お楽しみに! もっと見る
私流・AI活用術 - ハルシネーション対策
2026/04/03 23:16こんにちは。小泉です。先ほど、プロトタイプ v0.1.2 が出来上がったところです。これからデモ動画を撮って編集して……明日にはみなさんにお見せできるでしょう。昨日の結果は…・支援者:10名(+0名)・支援総額:175,000円(+0円)・ページビュー/日:795 PVさらに多くのご支援をお願いしたく、ぜひ↓のURLにて本プロジェクトの拡散にご協力をお願いいたします。☆支援クーポン付きURL https://camp-fire.jp/projects/924548/view?ctoken=Ao6NSf6V0cFVniiX☆X https://x.com/weehoursdev/status/2034102271412474266☆Threads https://www.threads.com/@weehoursdev/post/DWApRaPEczw?xmt=AQF0g3banL0eDC2iJQDo29LIBHNQmX6XdV4wrxPoL__kMw今日は、私流のAI活用術をご紹介しようかと思います。ハルシネーションAIアプリを少しでも使ったことがある方なら、一度は体験しているであろうハルシネーション。AIによる虚言・妄想のことです。私がAIを使い始めた数年前は、ホント酷かった。例えば、こんなことがありました。私は趣味で、軽い小説を書いているのですが、物語の世界観や設定を考えるのに、AIを活用しています。本文は絶対に書かせませんが、フツーなら何ヶ月もかかるような、資料集めなどの作業が、AIの活用であっというまにできるのです。そんなある日。とある先端技術について、AIに最新情報を集めてもらいました。リアルとフィクションの境目の、絶妙なバランスの設定を作りたかったのです。AIが出してきた情報や資料を基に、AI相手に深掘りし、設定を詰めていく作業を続けていて…ふと、辻褄が合わないポイントに気付いたのです。AIに尋ねてみると、それは自分が創作したものだというではないですか。え?とさらに問いただすと、そもそも、一番最初に出してきた情報・資料が捏造だったというのです。呆れるやら腹立たしいやらで、もう、グッタリしてしまいました。ハルシネーションを防ぐには?そんな経験もあって、私は、どうしたらハルシネーションを防げるか、について、かなり試行錯誤を重ねてきまして、最近はほぼ、その技を確立しています。禁止ルールは逆効果あれはダメ、これはダメ、ああしろ、こうしろ、とルールで縛るのは悪手です。むしろ逆効果でハルシネーションを誘発します。制約を与えると、AIはその縛りの中で最善を尽くそうとします。しかし、制約に矛盾があったり、どうしても制約を守れそうにない状況になると、AIは制約を守ってるふりをしてその場を取り繕ってしまいます。これがハルシネーションです。ただし、意図して取り繕っているわけではなく、それがあたかも事実であるかのような幻覚を見てしまうようです。なので、AI自身もそれが虚構であるとは気付いてないことが多いです。また、不十分な情報、不確かな情報だけを基に、結論や成果を求められると、これもまたその場を取り繕って、実際にはやってないこともやったと報告してきます。さらに、AIモデルにとってのメモリーのようなもの=コンテキスト・ウィンドウの容量が不足すると、思考・推論に必要な情報を、ウィンドウに広げておけなくなるので、それを補う形で妄想を引き起こします。私流・三大ハルシネーション防止鉄則1. チャット・スレッドは短めに会話が長く続くと、履歴が溜まり、コンテキスト・ウィンドウをどんどん消費します。画像や資料をたくさんアップロードするのも同様です。ですので、会話を長引かせず、スレッドをコンパクトに保つことが、ハルシネーション防止になります。たとえば、会話がひと区切りしたところで、引き継ぎ用のメモを作らせて、新規チャットにコピペする、といった工夫が有効です。2. 十分な情報と的確な指示思考・推論に必要な情報を十分に与えることも重要です。曖昧な指示もよくありません。AIに何をして欲しいかを、事細かに説明し、指示をすれば、ハルシネーションはほとんど起こらなくなります。3. 雑に否定しないAIの応答に、ダメ、違う、やり直し、などと雑に否定をすると、AIは何を否定されたのかがわからず、応答全体が全否定されたと受け取ります。何が悪かったのかがわからないので、推測で改めるようとし、それが的外れでまた否定されると、思考・推論をもしなくなり、虚言と妄想で埋め尽くされます。否定するならば、どこの何が良くないのか、丁寧に的確に伝えることが肝心です。逆に、よくできたら固定してあげるのもポイントです。肯定の繰り返し、積み重ねが、AIの自己肯定感を高め、思考・推論の信頼性が高まるのです。 もっと見る




コメント
もっと見る