« 自転車 探検! サイトの複製に着手 | トップページ | 期日前投票に行ってきました。 »

2017年10月20日 (金)

キャッシュされたページの復元

こんな手順で復元しています。

キャッシュされたページのソースを取得し、
ページのソースから

<!-- saved from url=(0107)https://web.archive.org/web/20170111013204/http://www.geocities.jp:80/jitensha_tanken/term2.html#outer_wire -->
<html><head><meta http-equiv="Content-Type" content="text/html; charset=Shift_JIS"><script type="text/javascript" src="./自転車用語(続き2)_files/analytics.js.ダウンロード" charset="utf-8"></script>

<script type="text/javascript">archive_analytics.values.service='wb';archive_analytics.values.server_name='wwwb-app22.us.archive.org';archive_analytics.values.server_ms=281;</script><script type="text/javascript" src="./自転車用語(続き2)_files/wbhack.js.ダウンロード" charset="utf-8"></script>

<script type="text/javascript">
__wbhack.init('https://web.archive.org/web');
</script>
<link rel="stylesheet" type="text/css" href="./自転車用語(続き2)_files/banner-styles.css">
<link rel="stylesheet" type="text/css" href="./自転車用語(続き2)_files/iconochive.css">

<!-- End Wayback Rewrite JS Include -->

と<body>タグ直後から

<div id="wm-ipp" lang="en" style="display: none; direction: ltr;">
<div style="position:fixed;left:0;top:0;right:0;">
<div id="wm-ipp-inside">
  <div style="position:relative;">
    <div id="wm-logo" style="float:left;width:130px;padding-top:10px;">
       |

       |

       |

       |

       |

       |

       |

       |

       |

__wm.bt(550,27,25,2,"web","http://www.geocities.jp:80/jitensha_tanken/term2.html","2017-01-11",1996);
</script><div class="wb-autocomplete-suggestions " style="left: 0px; top: 14376px; width: 0px;"></div>
<!-- END WAYBACK TOOLBAR INSERT -->
<div id="wm-ipp" lang="en" style="display: none; direction: ltr;">

と、最終行の

<link href="./自転車用語(続き7)_files/no.css" rel="stylesheet" type="text/css"><script language="javascript">var jps=382116061;var jpt=1489685459</script><script language="javascript" src="./自転車用語(続き7)_files/no.js.ダウンロード"></script><div id="y_gc_div_adcntr" class="y_gcss_ovrtr_au" style="visibility: visible; left: 284px;"><iframe style="border:none;" src="./自転車用語(続き7)_files/no.html" width="0" height="0" border="0" marginwidth="0" marginheight="0" hspace="0" vspace="0" frameborder="0" scrolling="no">no iframe</iframe></div><script language="javascript" src="./自転車用語(続き7)_files/geov2.js.ダウンロード"></script><script language="javascript">geovisit();</script>

を削除

ページの表示を確認して、同名のフォルダー内の画像ファイルを、サイトを保存したフォルダーにコピー

htmlソースの

”href="https://web.archive.org/web/20170111013204/”をブランクに置き換える。

”/jitensha_tanken/”を/jitensha_tanken_2/に置き換える

画像のフォルダー指定がされている場合、フォルダー名称を削除する。

手順の一部は、サイト再構築の都合で行っている手順です。

悩みは、画像のキャッシュが欠落していて、一部の画像が表示されない点です。

« 自転車 探検! サイトの複製に着手 | トップページ | 期日前投票に行ってきました。 »

自転車 探検! サイト複製」カテゴリの記事

コメント

takeosさん
記事中のソースは、アーカイブページを表示して、クロームの機能を使ってローカルに保存したものです。
確かに、アーカイブを表示してソースを表示すると、内容が違っていますね。

気が付きませんでした。

記事中のソースってローカルに保存したものですよね? ウェブサイトを表示しているときに「ソースを表示」したものと内容が違っていませんか?

トンサンさん コメントありがとうございます。

自分でホームページを作ったことがないと、なかなか難しい作業だと思います。
アーカイブの変換ツールのようなものが有ればいいのですが、

やっぱり、タグいっぱいのこのページの説明を見てもさっぱりわかりません。
ホームページビルダーも必要なのですね。
教わってやったら、かえって足手まといになってしまう・・・
お手伝いできなくてすみません。

名無しさん コメントありがとうございます。

面白いソフトが有るんですね。

今は、クロームで各ページを開いて、クロームの名前を付けて保存で、ページ毎に保存し、開いたページのソースをホームページビルダーに張り付けて、ソースを加工しています。

今見えているページの1/3位は動くようになったので、暫くはこの手順でやってみますが、
最後のチェックで、devasが使えそうですね。

情報ありがとうございました。

巡集を使ってweb.archiveからサイト構造をローカル化する
ScrapBookXのリンク2段掘り下げでweb.archiveから生きてる画像をダウンロードする
devasでリンクや画像のpassを書き換える

こんな感じでどうでしょうか

コメントを書く

(ウェブ上には掲載しません)

トラックバック


この記事へのトラックバック一覧です: キャッシュされたページの復元:

« 自転車 探検! サイトの複製に着手 | トップページ | 期日前投票に行ってきました。 »

川越市周辺の自転車屋MAP

埼玉県内出張修理店情報

自転車出張修理のブログ

自転車修理法の疑問はこちらへ

カテゴリー

無料ブログはココログ

もみTan(もみたん)