以下、YouTube の説明欄の内容にて
広聴AIについて、チーム安野で使い方をご紹介いたしました!
広聴AIについてはこちらよりご覧ください( GitHub へのリンク)
https://github.com/digitaldemocracy20…
備忘録:
フロントエンド:TypeScript & React( Next.js , Chakra UI v3 ), Plotly
バックエンド:Python : FastAPI , OpenAI – LLM
処理の概要( パイプライン ):
- テキストを数値ベクトル化(text-embedding-3-large)
- UMAPで次元削減
- K-Meansで初期クラスタリング
- Ward法による階層的クラスタリングでクラスタ統合
- 初期/統合層ごとにクラスタごとのタイトルと説明文をgpt-4o-miniで生成
- 最終的に得られたクラスタをgpt-4o-miniで要約
- 散布図やツリーマップなどで可視化