以下、YouTube の説明欄の内容にて
広聴AIについて、チーム安野で使い方をご紹介いたしました!
広聴AIについてはこちらよりご覧ください
https://github.com/digitaldemocracy20…
デジタル民主主義2030プロジェクトSlack
https://join.slack.com/t/w1740803485-…
—
補足説明:
上のリンクは、広聴AIを開発している GitHub へのリンク
下のリンクは、そのコミュニティSlack への加入リンクです。
( 小生も加入してますので・・・ )
備忘録:
フロントエンド:TypeScript & React( Next.js , Chakra UI v3 ), Plotly
バックエンド:Python : FastAPI , OpenAI – LLM
処理の概要( パイプライン ):
- テキストを数値ベクトル化(text-embedding-3-large)
- UMAPで次元削減
- K-Meansで初期クラスタリング
- Ward法による階層的クラスタリングでクラスタ統合
- 初期/統合層ごとにクラスタごとのタイトルと説明文をgpt-4o-miniで生成
- 最終的に得られたクラスタをgpt-4o-miniで要約
- 散布図やツリーマップなどで可視化