タグカテくんの概要

バックアップファイルを活用しようという試みの一つです。
以下のことが可能です。

  • データベースのバックアップファイル読み込み
  • 個別記事の解析を行い頻出品詞の分析
  • ブログ全体の解析を行い頻出品詞の分析
  • 過去記事のバックナンバー出力
  • 過去記事のマークダウン出力

トップ画面

タグカテくんを選択します

開いた直後は以下の状態です。

記事取り込み

記事取込ボタンを押します。

荷造り画面で取得したバックアップファイル
もしくはこの画面で作成した解析結果ファイルを読み込むことができます。

過去記事の行を選択することで、
過去の記事の内容を確認することができます。

個別記事解析ボタンを押すことで過去記事のそれぞれの頻出品詞を分析します。
形態素解析エンジン MeCabを使用しています。
以下は個別記事解析ボタンを押した状態の画像。

このような形で頻出単語が表示されます。

品詞を絞ることも可能です。

全記事解析は全ての記事を一つにまとめて
ブログ全体で頻出する単語を解析することができます。
少し時間がかかりますのでのんびり待ってください。

本家のプログラマーやめました
解析した結果ですがどうやらGoogleという名詞をよく使っているみたいです。

記事解析(マニアック)

これだけだと面白くありませんのでテキストマイニングをやりたくなります。
記事内容をまとめて出力を押すと全ての記事を一つのテキストファイルにまとめて出力します。
KHCoderなどを使えばテキストマイニングができます。

いやいや、私はPythonを使って分析するよ。
という方はレポート出力機能がありますのでこちらをご使用ください。

バックナンバー作成

ブログが大きくなってくると過去に何を書いたか見出しで見るためのバックナンバーが欲しくなります。
そういう場合はバックナンバー作成ボタンを押します。
以下の内容でバックナンバーを作成することができます。

  • 日付順 / 逆順
  • 名前順 / 逆順

マークダウン出力

最新の記事を残しておきたいというケースがあります。
そういう場合はマークダウン出力が便利です。

新記事解析

全ての記事に出てくる名詞のTOP20でほとんどの記事が分類できるという雑な僕理論を実装したものです。

記事内容をここにコピペという欄に
新しく書いた記事を貼り付け個別解析を行うことで
ブログにつけるカテゴリとタグを推薦してくれます。
ぶっちゃけあまり使えません。

解析保存

あまり説明は必要ないかと思いますが、
個別記事解析と全記事解析の結果を保存します。
記事取り込みよりは短時間で取り込めるので便利です。

以上