2007/02/09

[雑記]   続:amazonのURLからASINを取得する正規表現

at 14:59JST
 
http://memo.hirosiki.jp/article/32063378.html

もうひとつパターンをみつけた。

my ( $asin ) = 
( $url =~ m#^.*(?:ASIN|product-description|product|dp)/([^/]+)(?:/.*)*$# );


追記:
おぶわ?! なんでこんな記事にイマゴロはてなから飛んで来てる人がいるのだ?? でも、おかげでブクマコメントを参考にできた。と、めずらしくSBMに肯定的な意見を述べる自分。そうなのよ、これでもまだパターン完全網羅してないのよ;_;

だから
worris まだいくらでもある。確実なのはdocument.getElementById('ASIN').value

ていうのはそのとおり。本文をスクレイピングしたほうがいいね。…でもそれはJavaScriptだけなので痛し痒し(Perlだとページを取得しないといけなくなる)。

つーか、Amazonのあのクソ長いURL、いい加減やめてほしい。SEOがさらにキライになった。ユーザーに不便を強いてたら本末転倒だろ。



関連しそうな過去記事:
さらに過去の記事
2009/04 (1)   2008/12 (3)   2008/11 (9)   2008/10 (10)   2008/09 (20)   2008/08 (2)   2008/07 (23)   2008/06 (16)   2008/05 (22)   2008/04 (11)   2008/03 (21)   2008/02 (20)   2008/01 (21)   2007/12 (32)   2007/11 (37)   2007/10 (46)   2007/09 (63)   2007/08 (33)   2007/07 (41)   2007/06 (81)   2007/05 (173)   2007/04 (168)   2007/03 (113)   2007/02 (123)   2007/01 (92)   2006/12 (111)   2006/11 (185)   2006/10 (20)  
×

この広告は180日以上新しい記事の投稿がないブログに表示されております。