2024/12/13 11:04
支援者が現れたことで、前倒しで作業を開始することができました!
法令データには以下の分類のデータが網羅的に入っています。
- 憲法・法律
- 政令・勅令
- 府省令・規則
総データ件数を見ると、約8,000件くらいあるようです。昔のデータになると「xxノxxヲける」みたいない昔の表記も存在しました。それらを要約したデータを作り、要点は維持したまたデータ量を削減し、且つLLMがアクセスできるデータにするのがこのプロジェクトの目指すところです。
データの作り方である程度の試行錯誤が必要ですが、小データセットでやり方は大体わかったので、全データセットに拡張していこうと思います!