いさぼうネット
賛助会員一覧
こんにちはゲストさん

登録情報変更(パスワード再発行)

  • rss配信いさぼうネット更新情報はこちら
 シリーズコラム 「社会を支える人工知能」 
【第22回】:実際にデータ分析をしてみよう!(クラスタリング編)
 

 今回は、クラスタリングを実際に体験してみましょう。エクセルでのクラスタリングはかなり手間がかかるため、Windows用の簡易クラスタリングアプリを作成しました(図1)。簡易的なアプリなので、機能としては足りない部分がありますが、色々と試して遊んでみてください(注1)。クラスタリングについては、「【第5回】人間では見出すことが困難なデータの特徴を捉えてくれる人工知能」で説明していますので、ご興味ありましたらご覧ください。

「簡易クラスタリングアプリ」をダウンロード
(ZIPファイル:75.9MB)

図1 Windows用の簡易クラスタリングアプリ

 まずは、簡易クラスタリングアプリの使い方について説明します。入力は2列で構成されたCSVです(図2)。CSVの1行目は各列の名前で、英数字のみで記載します。したがって、日本語は対応しておらず、日本語が含まれているCSVではエラーメッセージが表示されます。

図2 入力データとなるCSVのフォーマット

 図3は簡易クラスタリングアプリの画面です。「CSVファイルを選択」ボタンをクリックして、入力するCSVを選択します。次に、クラスタ数のテキストボックスに好きな数字を入力して、「クラスタ数を指定してクラスタリング」ボタンをクリックします。少し時間はかかりますが、クラスタリングが完了すると「クラスタリングが完了しました。」というメッセージが表示されます。

図3 簡易クラスタリングアプリの画面

 クラスタリングの完了後、「クラスタリング結果を保存」ボタンをクリックすると、クラスタIDの列が追加されたCSVを保存できます(図4)。「散布図を表示」ボタンをクリックすると、図5のように視覚的にクラスタリング結果を確認できます。なお、散布図の下にあるアイコンで散布図の保存やズームアップなどができます。

図4 クラスタリング結果のCSV

図5 クラスタリング結果を示す散布図

 このアプリを使って、富山市オープンデータで公開されている中川の雨量と河川水位をクラスタリングしてみましょう。図6は、取得した中川のエクセルです。このエクセルから「水位」と「雨量」のデータをコピーして、CSVとして保存します。CSVでは「水位」と「雨量」をそれぞれ「water」と「rain」としました。この加工をしたCSVは、SampleData.csvとして用意しましたのでダウンロードしてください(注2)

図6 「中川(向新庄町7丁目)水位、雨量データ(2025年3月末現在)」のエクセルデータ

 初めに、クラスタ数を5にしてクラスタリングしてみました。図7は、この散布図です。横軸はrain(雨量)で、縦軸はwater(水位)となります。散布図を見てみると、主にrainでクラスタリングされていることが分かります。

図7 クラスタ数5のクラスタリング結果

 次に、図8はクラスタ数を10にしたクラスタリング結果の散布図です。クラスタ数5の結果と比較すると、waterの値に対してもクラスタリングしたことが分かります。何かしらの基準で雨量と河川水位を分割して分析したい場合などでクラスタリングは活躍しそうですね。

図8 クラスタ数10のクラスタリング結果

 今回は、簡易クラスタリングアプリを使って、簡単なクラスタリングを試してみました。ぜひ、このアプリで色々と遊んで、クラスタリングを体験してみてください。

 話は変わりますが、7月11日(金)に開催されるK&iウェブアカデミーで、「AIを使うから作るにシフトする実践的アプローチ」と題して、この連載をしている五大開発株式会社の荒木が講演します。有料講習ではありますが、ご興味のある方は是非お申込みください。

(注1)
本アプリの使用によって生じたいかなる直接的、間接的、偶発的、特別、結果的損害についても、当社は一切の責任を負いません。また、アプリに関するいかなる質問、要望、問い合わせにも対応いたしません。サポートは一切提供されません。
(注2)
CSVデータは以下の著作物を改変して利用しています。
中川(向新庄町7丁目)水位、雨量データ(2025年3月末現在)、富山市、クリエイティブ・コモンズ・ライセンス
表示4.0国際

K&i ウェブアカデミー(有料講習) 「AIを使うから作るにシフトする実践的アプローチ」

2025年7月11日(金)13:30〜15:50

  • 1.「AI開発の本質的かつ実践的なテクニック大放出!
      えっ!こんなことまで言っちゃうの?」
  •  [講師]
      五大開発株式会社 技術研究所 主任研究員 荒木 光一

  • 2.「自動車認識AIソフトの開発」
  •  [講師]
      株式会社藤井基礎設計事務所 基礎設計室 主任 新宮 直人

▽詳細、お申し込みはこちら 「K&i ウェブアカデミー」(いさぼうネット)

https://isabou.net/event/r07/ws20250711.asp

Copyright(C) 2002- ISABOU.NET All rights reserved.