【デジタル民主主義2030】新プロジェクト『広聴AI』紹介

以下、YouTube の説明欄の内容にて

広聴AIについて、チーム安野で使い方をご紹介いたしました!

広聴AIについてはこちらよりご覧ください
https://github.com/digitaldemocracy20…

デジタル民主主義2030プロジェクトSlack
https://join.slack.com/t/w1740803485-…


補足説明:
上のリンクは、広聴AIを開発している GitHub へのリンク
下のリンクは、そのコミュニティSlack への加入リンクです。
( 小生も加入してますので・・・ )

備忘録
 フロントエンド:TypeScript & React( Next.js , Chakra UI v3 ), Plotly
 バックエンド:Python : FastAPI , OpenAI – LLM

 処理の概要( パイプライン )

  1. テキストを数値ベクトル化(text-embedding-3-large)
  2. UMAPで次元削減
  3. K-Meansで初期クラスタリング
  4. Ward法による階層的クラスタリングクラスタ統合
  5. 初期/統合層ごとにクラスタごとのタイトルと説明文をgpt-4o-miniで生成
  6. 最終的に得られたクラスタをgpt-4o-miniで要約
  7. 散布図やツリーマップなどで可視化