02時21分03秒 [Office系ソフト]
WordとかExcelを使ってHTMLを出力すると、(WordやExcel上での表示と似たような)表示形態を維持するための属性や独自CSSが付加された状態で出力されます。
これらの余計な属性を取り除くツールを、Microsoft自身が昔々に公開していました。
■HTML Filter 2.1 for Office 2000(@Microsoft)
名称の「for Office2000」という表記が気になってはいたんですが......
起動してみましたら、
セットアップ エラー
セットアップ プログラムを実行しようとしましたが、このコンピュータには Office 2000 製品がセットアップされていないことが判明しました。このダウンロード モジュールをインストールする前に、Office 2000 製品をインストールする必要があります。どの製品が Office 2000 製品に含まれるかを調べるためには、http://www.asia.microsoft.com/japan/office/2000/ をご覧ください。
というダイアログが表示されて、実行できず。(笑)
Office 2000よりも新しいOffice XPがインストールされてるんですが、認識してくれなかったようです。(もしくは、認識はしているけど、Office 2000でしか使えないから拒否されたのかな。)
どっちにしても、公開日が2000/07/24ですから、Office XPでの出力には対応してないのかも知れませんー。
で、結局、テキストエディタで正規表現を使って置換して、余計な属性を排除しました。
出力させたい内容が単純だったためか、意外と簡単なステップでいけました。
……これで、だいたい削除できました。
純粋にtable系タグだけを使った出力にしてくれるツールって公開されてないのかなあ。
まあ、テキストエディタでマクロを組めば、ほとんど自動化できそうな気もしますけど。
この日記へのコメントはお気軽に! コメント数:2件
ヨウレさん! お久しぶりです~。
巡り巡ってようこそいらっしゃいました。(笑)
なるほど、CAB形式のファイルとして中身を展開すればツールを取り出せるのですね……!
そんな裏技があったとは!(笑)
試してみます。
ざっとMicrosoftサイト内は検索してみたつもりなんですけどね。そもそもツールの名称がハッキリしないので、「HTML Filter 2.1 for Office 2000」しか見つけられなかったんですが。(^_^;;;
この余計な属性を排除する機能も、直接Officeに搭載してくれたらいいんですけどねー。(^_^;;;
投稿者 にしし : 2009年11月30日 03:13
コメント数: 2件
おひさしぶりです,ヨウレです(笑)
Ubuntu Linuxについての検索をしていて…
(またも"でるふぃ"さん絡みで…)巡り巡って,
久しぶりに立ち寄らせて頂きました~♪
ツール自体は
Officeのプログラムを一切使っていないので
Officeをチェックする必要性を感じないのですが,
当時としては,ライセンス無視して勝手に
インストールするユーザーに対しての対策…
と言うか,意識向上の為の飾りみたいな気もします.
WindowsのCABツールで中のファイルを取り出すと
そのまま使えていたと記憶しています.
(MicrosoftのTechNetにも紹介されてた様な…)
その昔,ワードとエクセルの文書を渡されて,
これでホームページを作って下さいと言われて,
このプログラムを使った覚えがあります.
OfficeXP対応の版もあるかもしれません…
(記憶では2バージョンあった気がします.不明瞭)
ダウンロードセンターで検索してみて下さい~
投稿者 youre(ヨウレです,笑) : 2009年11月26日 17:49