2007/04/04

[雑記]   キオースク

at 22:03JST
Yahoo!ニュース - 毎日新聞 - <JR東日本>「キヨスク」を「キオスク」に変更へ
http://headlines.yahoo.co.jp/hl?a=20070404-00000084-mai-bus_all

まあ、ロシア語的には「キオースク」が正しい。

[ネット]   これは「自然文で検索している」というより…

at 21:06JST
話し言葉でサイト内の情報を検索--OKWaveが自然文検索の新機能 - CNET Japan
http://japan.cnet.com/news/media/story/0,2000056023,20346452,00.htm

OK TellMe β版
http://search.okwave.jp/

うまく動いてるなあ。過去、この手の
「自然文で質問すると検索してくれる」
というサービスで、マンゾク行く結果が得られた覚えがないのだけど。これはいい気がする。

使っててなんとなくしくみを考えたのだが…。

たとえば、
「渋谷でお勧めのランチを教えて?」
だと、質問文が
「渋谷で誕生日ランチするのにお勧めのお店を教えてください。」
「渋谷でお薦めのランチ教えて下さい」
「渋谷・新宿でお勧めのランチスポット(休日も含む)はありますか?」
となっているようなQ&Aが出てくる。

特に質問形式になっていない
「字がうまくなりたい」
というクエリーをかけても、
「字がうまくなるには・・・・!!」
「字は上達するのか?」
「S字」(これだけはハズレ)
といったエントリが上がる。

クエリーと、ヒットするエントリの「Q」との類似性が高い。

…そっかー。これ、あらかじめ蓄積しておいたQ&Aの
「Q」
と、クエリー文の類似性で候補を探してるんだね。ふつうの検索エンジンではこの手法はとれないけど、OKWaveは確実に質問文が存在するから可能なんだ! うまいなー!

理屈がわかったし、プログラム的にはオープンソースで公開されているツールを組み合わせればできるね…。と言ってもOKWaveのやってることがたいしたことないって言ってるわけじゃないよ。おもしろい。ぼくもやってみよっかな。なんか既存データで応用できそうなおもしろいものないかな? …はてな?

[リリース]   「mixiただのり検索」できたー

at 20:03JST
わーい。って、喜ぶほどのものでもないか…。

mixiの自分の日記をキーワード検索できるブックマークレットを作りました。
http://tools.hirosiki.jp/mixisearch/

mixi、mixiプレミアム会員向けに日記検索機能をリリース
http://internet.watch.impress.co.jp/cda/news/2007/04/03/15298.html

というのを読んで、

「なんだー、検索、有料会員にしか開放しないのかー。
 HyperEstraierの中の外の人がシャインなのにーぶーぶー」

と思ったので公開。

つーか、ほんとは半年くらい前にjQueryの練習がてら途中まで作ってたんだけど、そのまんまになってた…。なので、意味もなくjQueryを使っているという。

ブックマークレットだという点でお気づきのように、単にJavaScriptでしらみつぶしにチェックしているだけです。ほかはなんにもしてない…だから
「ただのり」
なの。いちおう、mixi側にあまり負荷がかかりすぎないようにインターバルおいてますが…。おかげで遅い(目で検索したほうが速いくらい)ので、
「こんなんならmixiプレミアム契約するよ!」
と販促になるという思わぬ効果が!

さらにこの程度のブックマークレットに速攻で広告を入れているという、完璧なただのりっぷり。

# つーか、やっぱ日記サービスするなら検索機能くらい無料で
# 提供してくれてもいいと思うんだがなあ>mixi

[雑記]   11gのワイヤレスUSBハブ─UWBよりこっちのほうがラクそう

at 14:46JST
802.11gに対応するワイアレスUSB 2.0ハブ - 米Icron | パソコン | マイコミジャーナル
http://journal.mycom.co.jp/news/2007/04/04/006/index.html

ふーん。
国内でUWBのハブがいくつか出てきたけど、接続が面倒だったりコネクティビティに問題がありそうだったりと欠点が気になるんだよね。

サンワサプライ:UWB-H300【UWBワイヤレスハブ】既存のUSB機器を最大480Mbpsでワイヤレスに。最新規格UWB規格準拠ハブ。
http://www.sanwa.co.jp/product/syohin.asp?code=UWB-H300

それに比べると、実績があって通信がしっかりできる印象のある無線LANベースのほうが使えるんじゃないかという気がする。

問題は、54Mbpsの11gを採用しながらUSB 2.0をうたっている点だが…。こんなの買ってくるひまがあったら、10mくらいのリピータケーブル買ってきたほうがいいか?

[雑記]   なぞのウェットティッシュ

at 14:34JST
この喫茶店、おいしいし構えもかわいいしカップもいいんだけど…。

20070403mage002.jpg


なんでボトルティッシュを出してくるのかがわからん…違和感ありまくり。

[雑記]   SEO話の続き

at 14:03JST
…なんか、こっちのblogにアクセスが増えると“本業”のほうがいかに大したことないか思い知らされるので、
「おまえらアクセスすんな!」
と書いておこ。未婚で10〜50歳くらいまでの美女の方だけがアクセスしてください。もちろんそれ以外の方は無断リンクも厳禁です。

で、そもそも他人に注目を浴びるためにエントリをものしているわけではないので表題の件についていろいろ補足したりする気はぜんぜんないんだけど。ちょっとだけ自分用にメモしておこう。

もちろん、ぼくだって一部の検索エンジンがh1やemなどに着目してスコアリングしていることは知っている(そしてやらないところがあることもだが)。

↓SEOやってる人が、こういうのを調べるのに血道を上げてるのもね。そんなのは常識だ。

タグの重み付けとSEO :間違いだらけのSEOとスパムのペナルティ ::SEO塾の検索エンジン対策
http://www.hyperposition.com/rumor/tag-scoring.html

でもねえ。それが本当に
「検索エンジン側にとって」
効果的に働いているのかというと、それを評価するのは「けっこう難しいよ」としか言いようがない。難しいと言っているのはタグの使われ方に基づいてキーワードの重み付けをするアルゴリズム、あるいはコーディングが難しい…ということじゃない。タグによる重み付けのさじ加減が難しいってことだよ。ここに着目しすぎてしまって有害な誤差が生じるのは、↑のようなSEOスパムのターゲットにされたときだけじゃない。世の中のサイトの99%を占める

題名:昨日。。。
本文:
超ウザかったー。マジキモ。社会のゴリ山がスカートじろじろ見てんの。
ところで新宿のクリスピードーナツ、実は超マズいの知ってた?
ウチ、親がドーナツ専門家だから一家言あるんだけさー。
あれはふくらし粉の量がちょっと多いよね。
ミスドのほうがうまいって。マジで。
だって作ってんのダスキンだよ?


的ニッキをクロールしたときの話だ。この日記で重要なキーワードが題名に使われている「昨日」じゃないことは誰でもわかるだろう(まあ、一般的なアルゴリズムで特徴語の評価をした時点で「昨日」なんてのはランク外に落ちるからコレが採用されることはまずないけれど、「ゴリ」だったらどうなるか怪しい)。hタグで囲われているものに「盲目的に」着目するアルゴリズムは、実用的には役に立たない。けっきょくは補正的なスケールにせざるを得ない。

※あー、でも手元のコーパスデータを使わない特徴語抽出モジュールだと、上の文章の特徴語はちゃんとドーナツになるな

だいたい、googleが
「すげー」
「便利だ」
って言われるような検索結果を出すことに成功したのは、別にタグ解析の効用じゃない。誰がどう見たって「PageRank」のほうでしょう(こういうのは全力戦争なのでそれ以外の要素も効果を生むことは否定しないけどね)。

だったらSEO業者も些末な「論理マークアップ」教に走ってないで、より多くのリンクを集められる「魅力的なコンテンツ」をつくる企画力のほうにその脳みそとカネを割こうよ、と。まあ、このあたりはSEOではいつも出てくる
「卵が先か、鶏が先か」論争
になってしまうが、ぼくは断然“卵”を推すね! 卵ってどっちだ。

つーかさ、ぼくがいちばんイヤなのは、こういう「タグ原理主義脳」にWebサービスを作っている人も罹りやすい部分があるってことだ。前に「おいおい」と思ったのは、

Webページのダイジェスト作るんスか。カンタンっスよ。hタグだけ抽出してやればいいんスよ


てな人…。「それってhタグとか使ってないページじゃ実用になんねーじゃん」と指摘すると、

そんなWeb標準に沿ってないページは腹を切って死ぬべきだ


てなカンジで反論されるわけで、じゃーおまえ以外誰も生き残らないじゃないか…。まあ、こういう人はもちろん若毛(ワカゲと読む。若い人に生えている特有の毛)が生えているだけなのでしかたないんだけど。でも、世の中見てるとイマイチこれを笑えない人が多い気がする。

たとえば、このあいだのエントリへの反応をちょろっと見ると、
「やっぱHTML捨ててXMLに走る必要があるのではないか」
というような人がいて、いい人なんだろうけど閉口した。

だってHTMLですらロジカルに書けない人たちが、ボヘミアンだの反対勢力だのなんだのが闊歩してるXML界でまともにドキュメントを書けると思う? そもそも女子高生が授業中に書いてるホムペをXML化できるのか! 世の中、そんなカンタンじゃないって。人間の言語表現はそんなカンタンにロジックでまとめられるものじゃない。それは別に希有だからとか尊いからとかじゃなく、人間の表現なんてほとんどがゴミだからだ。そのゴミからなんらかの資源を抽出するのが自然言語処理なり検索エンジンの仕事であって、「ゴミを出すな」と言うのは本末転倒だ。そもそもゴミ出すなって言われたらぼくが文章書けなくなっちゃうし。

なんか飽きたらおわり。

[雑記]   30秒診療

at 11:38JST
ここの医者は信頼しているのだが、来るたびに診療時間が短くなってくるな。待ち人数も少ないのに…。今日は記録更新した。30秒? もっと短いかも。

そのぶん待ち時間も短いんだけどね。小児科だと3時間待ちはあたりまえなのに比べれば天国。医者なんて、長時間接触しないほうが(おたがい)しあわせ。

でも長時間つきあってもらって、となりのじいさんが受けると言ってた「冷凍療法」を受けてみたい気もする。

[雑記]   病院に行くべきか行かざるべきか

at 09:39JST
昨日は雨がひどかったのであきらめたが。
今日はどうしようかなー。

放置しといてもいいような気がするし、そうでもないような。
だいたい、今日行くと週末までぜんぶ医者行脚で埋まっちゃう。

まー、気分転換に行ってくるか。
さらに過去の記事
2009/04 (1)   2008/12 (3)   2008/11 (9)   2008/10 (10)   2008/09 (20)   2008/08 (2)   2008/07 (23)   2008/06 (16)   2008/05 (22)   2008/04 (11)   2008/03 (21)   2008/02 (20)   2008/01 (21)   2007/12 (32)   2007/11 (37)   2007/10 (46)   2007/09 (63)   2007/08 (33)   2007/07 (41)   2007/06 (81)   2007/05 (173)   2007/04 (168)   2007/03 (113)   2007/02 (123)   2007/01 (92)   2006/12 (111)   2006/11 (185)   2006/10 (20)  

広告


この広告は60日以上更新がないブログに表示がされております。

以下のいずれかの方法で非表示にすることが可能です。

・記事の投稿、編集をおこなう
・マイブログの【設定】 > 【広告設定】 より、「60日間更新が無い場合」 の 「広告を表示しない」にチェックを入れて保存する。


×

この広告は1年以上新しい記事の投稿がないブログに表示されております。