site logoRepair html sources  test α


www.tenman.info

このページについて

このページは、htmlの補正と、補正後のドキュメントの活用を試みるページです。

このページが、指定されたhtmlのコピーに対して、以下の作業を試みます

  • htmlページに記述された。リンクのうち、相対リンクを絶対リンクに書き換える試みを行います。

    リンクの書き方は、いろんな風に書くことが出来るので、抽出は、私にとっては、難しいテーマです。抽出は、まったくうまくいっていません

    今のところ、「./」「 ../」「 /」には対応したいと思っていますが、「"images/hoge"」のようなものには、手が出ていません。

  • 絶対URLに変換できたリンクがうまく変換できているかどうかを確認するために、実際に、リンク先のレスポンスを確認します。

    不用意に、何度も使わないでください。人様に迷惑がかかるようなら、公開を停止します。

  • 変更前と変更後のドキュメントを、htmllintで、検査できるリンクを作成します。

    左の列のリンクがそうです

  • 変更後のドキュメントを、xmlとしてパースします。

    左の列の「オブジェクトに変換」リンクがそうです

    今のところ、ヘッダー部の埋め込みスタイル要素が、2回出ただけで、パース出来ないみたいです。
    かなりのヘタレです。

諸々

  • 本来のページは、Shift_JIS何だけど、ドキュメントの文字コードは、UTF-8になっている。といったhtml lintのエラーが出ます。

    xmlとして、パースした時に、input conversion failed due to input error等、文字コードのためのエラーが出るため、UTF-8のままになっています。

  • 2000行位のファイルで、タイムアウトになるほど、のろまです。大きなファイルは許してください。

publisher:www.tenman.info