JANOG 19 のページは MT (Movable Type) を使って作っている。
記事の作成や削除、ファイルをアップロードを繰り返していると、
不要なファイルが沢山できる。
永久保存のため、ゴミ掃除。
具体的には以下の作業を行なう、と。
1. wget によるファイルの一括取得
wget -r --no-parent http://www.janog.gr.jp/meeting/janog19/
これで、リンクが貼られているすべてのファイルが取得できる
2. リンクが貼られていないファイルの個別取得
wget http://www.janog.gr.jp/meeting/janog19/個別ファイル
RSS とか Google 用の Sitemap とかは、これで取得。
3. リンク切れ等の確認
手元の環境に www.janog.gr.jp のバーチャルホストを設定。
/etc/hosts に以下を記述。
127.0.0.1 localhost www.janog.gr.jp
その上で、linkchecker を走らせる。
リンクが絶対パスで書かれてたりするので、こうやったけど、
もっと手軽な方法があるような気がするなあ。
4. 問題がなければ、すべてファイルを tar で固める
5. ディレクトリを MT の管理から外す
6. ディレクトリ以下を削除
7. wget で取得して tar で固めたものを再配置
参考)
JANOG 19
http://www.janog.gr.jp/meeting/janog19/