<title>がファイル名に…

<title>がファイル名に…

日時： 2007/06/25 23:15
名前： HSK: はじめまして。先日ダウンロードして便利に使わせていただいています。

私のHTMLの書き方が悪いのですが、

<title>
タイトルです
</title>

のようになっていると、RSSを生成したとき、<entry>の<title>にHTMLのファイル名が入ってしまいます。

HTMLを書き換えればいいのですが、１０年以上やっているサイトなので、ちょっと面倒です。（汗）

こういう変なHTMLに対応するご予定はあるでしょうか？

Page: 1 |

Re: <title>がファイル名に… ( No.1 )

日時： 2007/06/26 00:06
名前： にしし

HSKさん、どうもです。

なるほど…。どうやら改行が含まれてると1行目（＝何もない行）だけを取得してしまって、その結果、「何も取得できなかったらファイル名を使う」というルールが適用されてしまっているのですね。(^_^;;;

次回のバージョンアップあたりで対応したいと思いますので、もうしばらくお待ち下さい。

ちなみに次回のバージョンアップでは、抽出処理の部分をいろいろ改善して、条件に合致できないHTMLがあっても、できるだけ文字をなんとか抽出できるようにする仕組みを搭載予定です。(^_^;;;
もうだいたい開発はできあがっていて、残りは微調整のみです。

titleなど、「改行が含まれていた場合」の対策も、できれば一緒に加えたいと思います。（次回できなくても、その次で対応します。）

Re: <title>がファイル名に… ( No.2 )

日時： 2007/06/27 00:36
名前： HSK

にししさん、ありがとうございます。
首を長くして待っています。（ぺこり）

Re: <title>がファイル名に… ( No.3 )

日時： 2007/07/08 19:12
名前： にしし

HSKさん、どうもです。

Ver 0.90βを開発する上で少し実験してみたのですが、<title>～</title>に改行が含まれていても特に問題なく取得できるのですが……。
もしかして、タイトルを抽出する設定に何か問題があるのではないでしょうか？「サイト設定」で抽出方法の設定を再度行ってみても抽出できませんか？

とりあえず、Ver 0.90βでは、情報抽出処理を大きく修正していますので、最新版で試してみて下さい。

それでも抽出できないようでしたら、（もし可能なら）どんなHTMLファイルなのか具体的にお教えいただけると私自身で確認してみることができてありがたいのですが。
よろしくお願いします～。

Page: 1 |

Fumy RSS & Atom Maker