Movabletype4のインポート作業メモ

間違えてブログのDBを捨ててしまった。今はURLも変わって新たなブログ・DBを使用しているのだが、昔のブログを取り込めないし、管理画面からも修正できない。どうするか。。。手元に残っているのは静的な1600あまりの各エントリーファイル(HTML)のみ。捨てるにはもったいない。かと言って残しておいても修正できないし。。。

力技でしますか。

Perlで各ファイルの必要な部分だけを抜き出した。タイトル、エントリー日時、カテゴリー、本文。それらをエクセルで取りまとめ。ソートしたり、リンク修正したり。エクセルとテキストエディタを行き来して置換の嵐。Perlによるゴミ取りも。←ここが一番大変だった。

次はMovableType4のインポート形式に書き換え。下記を参考に雛形に合わせてPerlで吐き出し。

Movable Type のブログ記事インポートフォーマット
http://www.movabletype.jp/documentation/appendices/import-export-format.html


■注意点
インポートエラーは教えてくれない
「すべてのデータをインポートしました。」と表示が出るが嘘です。ちゃんとインポートできた場合、インポートできたタイトルが表示されます。されない場合、インポート形式の何かがおかしいです。でもその何かは内緒らしいです。

インポートファイルは改行コード「LF」
これを知らずにインポートできず、30分ぐらい悩む

「----」は危険
「-」の8文字(まはた5文字)と改行コードの文字列でセッションを区切っている。本文中に「-」が連続であるとセッションと勘違いして区切ってしまい、データが壊れます。「--」を「--」に置換した方が良いかも。←なぜ二つの「-」にしているとかというとURLなどのハイフンが変換されないように。

同時に大量のインポートができない
最初は200エントリーとか一気にインポートできたが、100→50→20→10とインポートで成功するエントリー数が減ってきた。これはサーバスペックの問題?インポートが途中で止まるので、失敗したところから、再度インポートをやり直す。


そんな感じです。


 

このブログは引越ししました→クネアシ


TrackBack(1)

TrackBack URL for this entry:
http://www.qunea.com/mt/mt-tb.cgi/1705

Post a comment











画像の中に見える文字を入力してください。