読者です 読者をやめる 読者になる 読者になる

中堅企業IT部門の日常

中堅企業IT部門の中間管理職で半研究者の雑談です。毎週火曜日更新予定

ブログはどうかわったか - 形態素解析2

文書 統計 文書解析 学習

前回、ブログデータを整形しました。早速KH-CODERに取り込んでみます。
ファイルを選択して取り込み、前処理を実施すると、とこんな感じになります。

f:id:systembu:20161006232812p:plain

H1の数がブログの投稿数+ドラフト数となります。ブログ数としては199件です。行数としては、10016行。1ブログあたり50行程度です。また、1行の平均が51文字なので、1ブログあたり2,500文字程度となります。

原稿用紙6枚分程度。そんなに書いているかなあという疑問も。

 

頻出後を出す

まずは、頻出後から出してみましょう。出現度数に応じて全件出したり、上位150件のみ出すことができます。今回は、上位50件を出してみます。 

f:id:systembu:20161006234123p:plain

 

「企業」「人」「仕事」「会社」などが上位に来ます。このブログ全体を通して、ビジネスの話、会社での出来事を書いているので当然と言えば当然ですが。

そのほかにも、「情報」「システム」「プロジェクト」「ユーザー」といったITプロジェクト関係の語彙も多く登場します。

 

このように見ると、ブログの傾向は分かるのですが、これまでの変化などはわかりません。 

 

年代別の頻出後を出す

そこで時系列の変化はわかりません。ですので、年ごとの頻度を見ていきます。

前回整形した際に、

<H1> 2015 </H1>

というようにタグ付けしましたが、KH-CODERでは、<H1>~<H5>までのタグを認識し、このタグの要素で分類して分析することができます。

 

実際に、分析した結果がこちらです。

f:id:systembu:20161006235133p:plain

2013年はITプロジェクト関連の話が多く、2016年はベンダー営業への愚痴の記事が多いような、なんとなくの傾向が見て取れます。

 

具体的に見てみる

各年の頻出後について、どのような文書に出てきているのかを具体的に見てみます。

2013年:「プロジェクト」

そうすると、コンサルは、後に続く開発プロジェクト受注に向け、数字を作るわけです。

といったITの開発プロジェクトの話。

ITシステム開発のプロジェクトは、その結果により成功・失敗の評価がなされます。某大手の雑誌では失敗プロジェクトを特集したりもしています。

この3指標の評価は、(ITに限定しない)プロジェクトの評価指標として1950年代から提唱されています。こんな図であらわされることも多々あります。

 というような、プロジェクトの成功の定義についての話などがあげられます。

ブログを始めた当初は、実際にプロジェクトをまわす立場であったこともあり、いかにプロジェクトを成功させるか、そもそも成功とは何かといったことをまじめに考えていた形跡が見受けられます。例えばこんな投稿です。

blog.sme-itdept.com

 

2014年:「企業」

2014年の最頻出後は「企業」です。この年は、全体的に企業人事についての投稿が多い年です。

こちらは、研究者と経営者は本来別のケイパビリティが必要で、それぞれプロがやるべきなのに、日本の企業や学術機関では、ミスマッチが良く見られるという話。

日本の一般の企業では、営業、人事、研究開発、総務などいろんなセクションを経験して経営者になります。そのキャリアパスの中で、人の使い方、組織の統制の仕方等を学んで経営者になります。 

確かに、研究所と一般企業は違うだろうという声もあるかと思います。研究の内容が理解できなければ、研究者の管理も、組織としての研究テーマの設定もできないだろうと。確かにそうなのですが、例えば、一般企業の研究所を見ると、組織内でマネジメントパスと研究者パスを分けているケースは多々見受けられます。

しかしながら、日本企業でそれをやってしまうと、大きな荷物を抱えこむことになります。日本企業では、そう簡単に人を切れないので、いったん取ってしまうと長期的に使っていく必要が生じます。

blog.sme-itdept.com

 

2015年:「人」

この年も、企業の人事の話が多いのですが、特に人材配置や教育、役割などについての投稿が多数です。

こちらは、IT部門に入ってくる新人の教育的な内容です。

IT部門にも毎年若いが入ってきます。当然ITやりたくて入ってくるはいないので、一から育成になります。育成するにあたっても、飲み込みの早いとそうでない人の差は大きくて、特に物事を抽象化して考えたり、大きな視点で見ることができない人は苦労します。

入社間もないは、細かい面倒な作業を振られることが多いのですが、その際、一旦作業の目的を抽象化して、「そもそもなぜやっているのか?」、「目的は何なのか?」

 

2016年:「営業」

今年は、ベンダー営業に対する愚痴が多いようです。

まずは、春に話題になった、日立の営業をコンサルに転換するという話

これを読むと、

営業がコンサルなんてできるの?」

「名前変えてお金取るだけでしょう?」

など意見あるかと思いますが、個人的には「13万人!、そんな大量の営業をユーザー企業が養うのか!」という驚きがまず始めにきます。  

 

営業の接待が全くなくなっているという一方で、下手に飲みに行くだけで疑われかねないという話。

例えば、コンペをしている際に家の前でベンダー営業が休みの日に待ち伏せしており、ちょっとしたお土産(換金性の高い物)を渡していくとか。

 

というように、ブログ全体としては、始めた当初はIT部門をどうやってうまく運用できるのかを純粋に考えていたブログから、組織や人材に対する問題意識(愚痴?)、そして最近はベンダーの営業に対する不満と、ブログの傾向が変わってきています。

 

ブログ内容の高尚さは年々薄まってきており、日に日に下世話な話題を取り上げている傾向が見受けられます。

 

と、ここまで来ましたがもう少し続きます。

 

(今回の調査にはKH-Coderを利用してます。こちらを読めばさらに深い使い方ができるかと) 

社会調査のための計量テキスト分析―内容分析の継承と発展を目指して

社会調査のための計量テキスト分析―内容分析の継承と発展を目指して

 

 

ブログランキング・にほんブログ村へ