23時50分26秒 [Web関連]
検索エンジンスパムの基本になる考え方は、「人間には読めないけど、検索エンジンには読める」ような文字列をHTML中に含めておくことで、適切ではない検索結果を返させることです。だから、微細な文字サイズで大量の文章を含めたり、画像のalt属性の中に(ページの内容と)無関係な文字列を大量に含める行為に対して、検索エンジンはペナルティを課そうとします。
で、ふと思ったんだけど、日本語の文字コードには、「★」や「●」といったような記号がたくさん定義されているので、日本語の文書中にはそのまま(プレーンテキストのまま)記号を活用できますよね。でも、英語環境にはそんなに豊富な記号は定義されてません。(まあ、Unicodeで数字文字参照とか文字実体参照とか使えば、いろんな記号を(HTML上で)表現は可能ですが。)
そんな問題を解決するためかどうかは知りませんが(^^;)、Microsoftが用意した方法は、Webdingsみたいな絵を表示できるフォントですね。
右図は、「ABCDE」という5文字を、Webdingsフォントで表示した場合の例です。こういったフォントを使えば、文字コードでは定義されていない様々な絵を表示させることができます。もっとも、表示対象のPCに該当するフォント(ここではWebdings)がインストールされていなければ、ただのアルファベットにしか見えないわけで、プラットフォームに依存しまくる方法なんですけども。
で、これを使う方法でも、なんか検索エンジンスパムが実現できちゃいそうだなあ…とふと思いました。
Webdingsみたいな「絵を表示するフォント」を指定していれば、(そのフォントが表示できる環境に限りますけど)人間にはどんな文字列がベースに存在しているのかは分からないわけです。ソースを見ない限り。ところが、検索エンジンはフォントなんて解釈しないわけだから、検索エンジンにはオリジナルの文字列が伝わるわけです。だから、一見装飾に見えるようなWebdings文字の羅列が、実は検索エンジン対策用の文字列になっている…というようなこともできると思います。
たいていのブラウザでは、日本語の文字列に対してWebdingsフォントを適用はできない(と思う)ので、日本語環境では使えませんけど。もしかして、英語圏ではわりと悪用されてる方法だったり?詳しくは知りませんが。
そんなことをふと思いました。^^;
※検索エンジンスパムは、発覚したときのペナルティが大きすぎるので、やめておきましょう。(^^;;;
この日記へのコメントはお気軽に! コメント数:0件
コメント数: 0件