2007/04/04

[雑記]   SEO話の続き

at 14:03JST
 
…なんか、こっちのblogにアクセスが増えると“本業”のほうがいかに大したことないか思い知らされるので、
「おまえらアクセスすんな!」
と書いておこ。未婚で10〜50歳くらいまでの美女の方だけがアクセスしてください。もちろんそれ以外の方は無断リンクも厳禁です。

で、そもそも他人に注目を浴びるためにエントリをものしているわけではないので表題の件についていろいろ補足したりする気はぜんぜんないんだけど。ちょっとだけ自分用にメモしておこう。

もちろん、ぼくだって一部の検索エンジンがh1やemなどに着目してスコアリングしていることは知っている(そしてやらないところがあることもだが)。

↓SEOやってる人が、こういうのを調べるのに血道を上げてるのもね。そんなのは常識だ。

タグの重み付けとSEO :間違いだらけのSEOとスパムのペナルティ ::SEO塾の検索エンジン対策
http://www.hyperposition.com/rumor/tag-scoring.html

でもねえ。それが本当に
「検索エンジン側にとって」
効果的に働いているのかというと、それを評価するのは「けっこう難しいよ」としか言いようがない。難しいと言っているのはタグの使われ方に基づいてキーワードの重み付けをするアルゴリズム、あるいはコーディングが難しい…ということじゃない。タグによる重み付けのさじ加減が難しいってことだよ。ここに着目しすぎてしまって有害な誤差が生じるのは、↑のようなSEOスパムのターゲットにされたときだけじゃない。世の中のサイトの99%を占める

題名:昨日。。。
本文:
超ウザかったー。マジキモ。社会のゴリ山がスカートじろじろ見てんの。
ところで新宿のクリスピードーナツ、実は超マズいの知ってた?
ウチ、親がドーナツ専門家だから一家言あるんだけさー。
あれはふくらし粉の量がちょっと多いよね。
ミスドのほうがうまいって。マジで。
だって作ってんのダスキンだよ?


的ニッキをクロールしたときの話だ。この日記で重要なキーワードが題名に使われている「昨日」じゃないことは誰でもわかるだろう(まあ、一般的なアルゴリズムで特徴語の評価をした時点で「昨日」なんてのはランク外に落ちるからコレが採用されることはまずないけれど、「ゴリ」だったらどうなるか怪しい)。hタグで囲われているものに「盲目的に」着目するアルゴリズムは、実用的には役に立たない。けっきょくは補正的なスケールにせざるを得ない。

※あー、でも手元のコーパスデータを使わない特徴語抽出モジュールだと、上の文章の特徴語はちゃんとドーナツになるな

だいたい、googleが
「すげー」
「便利だ」
って言われるような検索結果を出すことに成功したのは、別にタグ解析の効用じゃない。誰がどう見たって「PageRank」のほうでしょう(こういうのは全力戦争なのでそれ以外の要素も効果を生むことは否定しないけどね)。

だったらSEO業者も些末な「論理マークアップ」教に走ってないで、より多くのリンクを集められる「魅力的なコンテンツ」をつくる企画力のほうにその脳みそとカネを割こうよ、と。まあ、このあたりはSEOではいつも出てくる
「卵が先か、鶏が先か」論争
になってしまうが、ぼくは断然“卵”を推すね! 卵ってどっちだ。

つーかさ、ぼくがいちばんイヤなのは、こういう「タグ原理主義脳」にWebサービスを作っている人も罹りやすい部分があるってことだ。前に「おいおい」と思ったのは、

Webページのダイジェスト作るんスか。カンタンっスよ。hタグだけ抽出してやればいいんスよ


てな人…。「それってhタグとか使ってないページじゃ実用になんねーじゃん」と指摘すると、

そんなWeb標準に沿ってないページは腹を切って死ぬべきだ


てなカンジで反論されるわけで、じゃーおまえ以外誰も生き残らないじゃないか…。まあ、こういう人はもちろん若毛(ワカゲと読む。若い人に生えている特有の毛)が生えているだけなのでしかたないんだけど。でも、世の中見てるとイマイチこれを笑えない人が多い気がする。

たとえば、このあいだのエントリへの反応をちょろっと見ると、
「やっぱHTML捨ててXMLに走る必要があるのではないか」
というような人がいて、いい人なんだろうけど閉口した。

だってHTMLですらロジカルに書けない人たちが、ボヘミアンだの反対勢力だのなんだのが闊歩してるXML界でまともにドキュメントを書けると思う? そもそも女子高生が授業中に書いてるホムペをXML化できるのか! 世の中、そんなカンタンじゃないって。人間の言語表現はそんなカンタンにロジックでまとめられるものじゃない。それは別に希有だからとか尊いからとかじゃなく、人間の表現なんてほとんどがゴミだからだ。そのゴミからなんらかの資源を抽出するのが自然言語処理なり検索エンジンの仕事であって、「ゴミを出すな」と言うのは本末転倒だ。そもそもゴミ出すなって言われたらぼくが文章書けなくなっちゃうし。

なんか飽きたらおわり。



関連しそうな過去記事:
さらに過去の記事
2009/04 (1)   2008/12 (3)   2008/11 (9)   2008/10 (10)   2008/09 (20)   2008/08 (2)   2008/07 (23)   2008/06 (16)   2008/05 (22)   2008/04 (11)   2008/03 (21)   2008/02 (20)   2008/01 (21)   2007/12 (32)   2007/11 (37)   2007/10 (46)   2007/09 (63)   2007/08 (33)   2007/07 (41)   2007/06 (81)   2007/05 (173)   2007/04 (168)   2007/03 (113)   2007/02 (123)   2007/01 (92)   2006/12 (111)   2006/11 (185)   2006/10 (20)  
×

この広告は180日以上新しい記事の投稿がないブログに表示されております。