01時03分16秒 [Office系ソフト]
Microsoft Word文書をHTML形式に変換したい場合、Wordに付属しているHTML化機能を使うよりも、GMailに転送してGMailにある「HTML形式で表示」というメニューを使うことで表示されるHTMLのソースを保存する方が、いいHTMLソースが得られるんじゃないか、という話が、O'Reilly Mac DevCenter Blogに書かれてます。
◆Use Gmail to Convert Word Docs to HTML(@O'Reilly Mac DevCenter Blog)
via MSワード をHTMLにするならGMailで(@Goodpic)
そこで、どんな感じのHTMLソースになるのか、私も実験してみました。
適当なWordファイルを用意して、それをWordの機能でHTML化したものと、GMailのメールアドレスにWordファイルを添付したメールを送ってみて、添付ファイルの中身をHTML表示させたもののソースとを比べてみました。
GMail上では、下図のような感じ。「HTMLで表示」(英語版だと「View as HTML」)というところをクリックすると、メールに添付されてるWordファイルの中身がHTMLに変換されて表示されます。そのソースを保存すれば、WordファイルのHTML化ができることになります。
Wordでは、私が持ってるMicrosoft Wordが「Office XP」に付属の「Word 2002」なので、1バージョンほど古いんですけど(^^;)、「名前を付けて保存」ダイアログで、「Webページ(フィルタ後)」という形式を選択してみました。フィルタなし版だと、Word独自の書体情報とかを延々と出力するので、それと比較しても仕方ないと思って。
…で、この両者でHTML化されたソースを比較してみました。
………。
ええと。(^^;;;
個人的には、「どっちもどっち」という感じがするんですけどね。^^;;;
GMailのHTML化は、予想に反して、スタイルシートをほとんど使ってませんね。まあ、元になるWordファイルがあんまり装飾されてないものだったというのもあるのかも知れませんが。「下線を引く」という装飾でも、u要素(<u>~</u>)が使われてます。
WordのHTML化は、装飾にスタイルシートが使われてます。本文の一部分に対してダイレクトに施した装飾とか、和文・英文のフォント指定に関しては、span要素にstyle属性を使う形でのスタイルシートなので、データ量は多くなってしまってますが。でも、「見出し」機能などを使って装飾した箇所に関しては、ちゃんとクラス名(aクラス、a0クラス、a1クラス…とかだけど)を振って、head要素内でちゃんとスタイルを定義してくれてます。
もっとも、それでもやはりHTML的にはおかしなところも多いわけですが。
ただ、じゃあ、GMailでのHTML化と、WordでのHTML化とどっちがいいのか?と言われると、どっちもどっち…という気が私はしましたけどねー。どちらかというと、まだ、あとからWordに再取り込みして活用できる可能性のある、「WordによるHTML化」の方がいいんじゃないかな?と思ったり。装飾も基本的にはスタイルシートだし。
まあ、さっきのBlogでは、当然英語版が使われてたんだろうし、私が使ってるWord2002とはいろいろ異なってる可能性もあるのですけど。
個人的には、わざわざGMailに送るくらいなら、別にWordでHTML化したらいいんじゃないか?と思います。^^;;;
スタイルシートをほとんど解釈できないような、いにしえのブラウザでしか閲覧できない環境に送る必要があって、そこにWordがインストールされていないのなら仕方ないかも知れませんけど。^^;;;
ただ、文法的におかしいのはおかしいです。どっちも。
だから、HTML化したソースをそのまま活用するのではなく、自分で手を加えて、まともなHTMLに書き換えるんだということを前提にするなら、Goodpicで指摘されているように、スタイルシートを使わずに規則性のあるHTMLタグでマークアップされるGMail版HTMLの方が、テキストエディタの一括変換機能とかをうまく活用して、楽に修正ができるかも知れません。
この日記へのコメントはお気軽に! コメント数:0件
コメント数: 0件