Check our Terms and Privacy Policy.

e-Govのデータを活用したカスタムGPTで法令情報へのアクセスを向上

e-Govのデータを活用したカスタムGPTを拡大し、法令情報へのアクセスをさらに向上させます。追加データを導入し、専門家や市民が効率的に利用できる法務支援ツールを目指します。2024年中に改良を進め、法令情報が誰でも使うことができるシステムの実現を目標としています。

現在の支援総額

40,000

4%

目標金額は1,000,000円

支援者数

2

募集終了まで残り

終了

このプロジェクトは、2024/11/25に募集を開始し、 2人の支援により 40,000円の資金を集め、 2024/12/25に募集を終了しました

このプロジェクトを見た人はこちらもチェックしています

e-Govのデータを活用したカスタムGPTで法令情報へのアクセスを向上

現在の支援総額

40,000

4%達成

終了

目標金額1,000,000

支援者数2

このプロジェクトは、2024/11/25に募集を開始し、 2人の支援により 40,000円の資金を集め、 2024/12/25に募集を終了しました

e-Govのデータを活用したカスタムGPTを拡大し、法令情報へのアクセスをさらに向上させます。追加データを導入し、専門家や市民が効率的に利用できる法務支援ツールを目指します。2024年中に改良を進め、法令情報が誰でも使うことができるシステムの実現を目標としています。

このプロジェクトを見た人はこちらもチェックしています

時期を区切ることでいい感じにデータを取得できることがわかった。しかし、量が多いので1日の最大アクセス1万回にどうしても引っかかってしまう。文章が長い場合にどうしても分割して推論して結合して更に推論する必要があるので、1法令1アクセスでは済まない場合が多い。まあ何事も試行錯誤ですね。


OpenAIのAPI制限に引っかかってしまった。時間的な間隔は意識してたが、APIの呼び出しは10,000回/日が上限らしくそれにかかってとまった。やっぱり期間を設定して、じわじわ攻めていくしかないな。その前には、文章が長すぎて1回の最大トークン量を超えてしまうことがあったりした。文章を分割して要約して、最後また分割要約を要約する、という手法を取る必要がある。やってみると、いろいろと細かいAPI制約があることに気づく。


有名な人が一人リツイートしたりすると、急に盛り上がったりするのがバイラル効果のすごいとろこ。ジャスティン・ビーバーがいなかったら、ピコ太郎も今頃まだくすぶってたでしょう。自分は別にインフルエンサーでもなんでもないが、こういうときにインフルエンサーの友達がいたりするといいよね。やっぱり何事も人脈なんだなぁ。でも、なんかジャスティン・ビーバーが間違ってリツイートしてくれないかなぁ。まあ必要以上に盛り上がる必要はないけど、ちょっとは注目されたい。


地道な作業
2024/12/14 12:59

スクリプトによる地道なデータ取得+変換作業を行っています。データ件数が多いのと、憲法・法律は文章が長いので一回の入力トークンの量を超えてしまうので分割したりという工程が入ることがあり、まあまあ時間がかかる。しばらくほうっておくしかないが、途中ちょこちょこ間違ってて何度か再スタートして今は順調。可能な限り並列化しているが、時間はかかる。でも、日本の法律を全部ちゃんと知ってるLLMとかが現れたらなにかの役には立ちそう。少なくとも誰もやっていなさそうだし。そういう意義だけのためにこれはやっている。


支援者が現れたことで、前倒しで作業を開始することができました!法令データには以下の分類のデータが網羅的に入っています。- 憲法・法律- 政令・勅令- 府省令・規則総データ件数を見ると、約8,000件くらいあるようです。昔のデータになると「xxノxxヲける」みたいない昔の表記も存在しました。それらを要約したデータを作り、要点は維持したまたデータ量を削減し、且つLLMがアクセスできるデータにするのがこのプロジェクトの目指すところです。データの作り方である程度の試行錯誤が必要ですが、小データセットでやり方は大体わかったので、全データセットに拡張していこうと思います!