|
|
シリーズコラム 「社会を支える人工知能」 |
【第19回】:建設工事事故データベースの分析(その2)
|
|
|
|
|
|
前回は、建設工事事故データベース[1]に関して、コード表に種類が記載されている項目に絞って分析をしました。今回は、自由記述となっている「事故に至る経緯と事故の状況」の文章について分析してみようと思います。
全事故報告(1,564件)の「事故に至る経緯と事故の状況」を分析しても解釈が難しくなるため、前回の分析結果をもとに、以下の2つの観点から「事故に至る経緯と事故の状況」の分析をしてみます。
@ 工事分野:河川 事故分類:建設機械等の転倒、下敷、接触、衝突等
A 工事分野:砂防・地滑り 事故分類:墜落
これらは、河川と砂防・地滑りおいて、最も多かった事故分類となります(前回の表3と表4参照)。@で「事故に至る経緯と事故の状況」が記載されてた事故報告は67件、Aでは34件でした。
「事故に至る経緯と事故の状況」のテキスト分析には、ブラウザ上で分析できるAIテキストマイニング[2]のサービスを利用しました。このサービスは、テキストを入力することで様々な分析ができます。今回は「事故に至る経緯と事故の状況」の文章に含まれている名詞に焦点を当てて分析してみました。それでは、@とAの分析結果を見てみましょう。
まず、単語の出現頻度と重要度を示すスコアに関してです。図1と図2に、@とAの出現頻度とスコアを示します。単語の出現頻度とは、文章に出現する単語のカウント数となります。例えば、@では、67件の「事故に至る経緯と事故の状況」の文章において「バックホウ」が50回出現していることを示します。重要度を示すスコアとは、“一般的な文章において出現頻度は低いが、「事故に至る経緯と事故の状況」では頻繁に出現する単語は重要である”という考えのもとに算出された数値を示します。
図1 @「河川、建設機械等の転倒、下敷、接触、衝突等」の単語の出現頻度とスコア(重要度)
図2 A「砂防・地滑り、墜落」の単語の出現頻度とスコア(重要度)
@の結果において「バックホウ」は、出現頻度とスコア共に最も高いです。そして、バックホウに関連する「バケット」のスコアは2番目に高いです。この結果から、河川の事故分類が「建設機械等の転倒、下敷、接触、衝突等」となる事故は、バックホウが関連していることが多く、そして、バックホウのバケットにも関連していることが分かります。
Aの結果では、「作業」や「足」の出現頻度は高いですが、スコアとしては低くなっています。一方で、「型枠」や「斜面」の出現頻度は低いですが、スコアは高いです。したがって、砂防・地滑りの事故分類が「墜落」となる事故では、型枠や斜面に関連しており、これらの注意する必要があることが分かります。
次に、重要度を示すスコアを分かりやすく可視化するワードクラウドを見てみましょう。図3と図4に、@とAのワードクラウドを示します。中心に位置して、フォントサイズが大きいほど重要な単語であることを示します。図1や図2より重要な単語が分かりやすく、事故防止のポスターにも使えそうなポップさがあります。
図3 @「河川、建設機械等の転倒、下敷、接触、衝突等」のワードクラウド
図4 A「砂防・地滑り、墜落」のワードクラウド
今回は、建設工事事故データベースの「事故に至る経緯と事故の状況」について分析してみました。次回もテキスト分析についてお伝えしようと思います。