2007/03/17

[雑記]   日本語コーパス平成18年度公開ワークショップ

at 17:09JST
日本語コーパス -平成18年度公開ワークショップ プログラム
http://memo.hirosiki.jp/article/36051459.html

行ってきた。

予稿集もらって、オープニングスピーチを聞き流しながらその場で読んで帰ってきた。長らくこの方面から離れていた人間としては、この予稿集はとても示唆にとんだ内容で参考になった。これでタダっつーのは、国家予算ばんざいだと思った。

でも、残りの招待講演とかデモンストレーションとかは意味がなさそうなのでパッと帰ってきたのだ。また明日も行く予定だが、予稿集読んだ範囲じゃ、「Yahoo!知恵袋」の話もそんなにおもしろくなさそうだしアレかも…。

で、問題のこの
「日本語書き言葉コーパス」
の成果だが、有償DVD-ROM配布オンリーかと思ったら、
・Webによる無償供与(制限あり)
・Webによる有償供与
・メディアによる有償供与
の3タイプを予定しているらしい。Webって…まあ、内容から言って
「形態素分析しますよ」とか
「特徴語抽出しますよ」とか
のAPI提供なんてカジュアルなもんじゃないだろうが。どんなものを予定してるのかね。

予稿のなかで出てくるUniDicというのも成果物のひとつになるのだろうが…そこで「そういえばIPADICって結局どういうかたちで配布されてんだ?」というのを今さらながら疑問に思った。あとで調べてみよう。
※追記:
「IPA品詞体系辞書」か。とりあえずChaSenについてたやつを解凍すると、Lispのリスト表現っぽいかたちでまとめた品詞辞書ね。KOTONOHAのほうの成果物はXML形式になるらしいが。んで、
% wc -l *.dic
すると24万語なのね。今ごろはじめて中身を見た…。

あと、「確率的単語分割ツール」とかなんとかいうツールを作っているという人もいるらしくて、Sourceforgeのアドレスが掲載されていたが、今は空っぽのままだ。
http://barpp.sourceforge.jp/
内部的にChaSen/MeCabを使っているというようなことなのでどこらへんが確率的なのかわからんが、おもしろいのかな?

全般に「茶筅、茶筅」って感じの研究で、NAIST一色って気がした。やっぱ合格したとき行けばよかったかな…。絶対肌に合わないと思うけど。

[雑記]   バリスタコンテスト

at 04:02JST
【レポート】バリスタ日本一は初の女性 - 爽やかスマイルと冷静さを武器に世界へ! (2) 135人のトップには初の女性バリスタが (MYCOMジャーナル)
http://journal.mycom.co.jp/articles/2007/03/16/barista/001.html

なんでIT系ニュースのMYCOMジャーナルがバリスタの話題を扱っているのかというのが最大の疑問だが…。優勝者はなかなかの萌え萌えさんだ。あと、8位にエクセルシオールの店員さんが入ってるのががんばってると思った。ドトールだとさらに面白かったんだけど。

で、二位を輩出したほうの「ゾッカコーヒー」だが…。知らない。ほかの店は聞いたことあんだけどな。東京近郊のお店だから行きたい〜。

店舗紹介/ZOKA COFFEE
http://www.zoka-coffee.com/shop/index.html

目白か赤坂かあざみ野かー。全部縁がないな。などと思いつつ、適当につくったカフェオレを飲む。もうすでに寝ることは放棄した。

[雑記]   ねむ

at 03:01JST
ねむいけどねむれない。

よく考えるとねむいけどねむれないという事態はおかしなことなのだよな。おそらく、健常な人にとってはねむることはひとつの儀式であって、夜眠くなってきたら寝床に入って意識を失うのを待つのがふつうの所作なのだろう。

ぼくもかつてはそうであったはずだが、ここ数年はその常態を喪失して長い。寝ようというしぐさをとっても、やはりごそごそと起き出してしまう。

なぜかと言えば、やはり眠ることへの罪悪感がこころの奥底にまで染み付いてしまっているのだろう。なにもしないということに焦りを感じるようになってしまった。

今はやることが多少なりともあり、それをこなす気力もあるから、その焦りを生産に傾けることができるが、それができなければ悶々と眠れない時間を過ごす“だけ”でいなければならない。そう考えると、完成された不眠症の構成要素というのは、罪悪感と焦りと無気力なのだなあと思う。

で、明日起きられなかったらおでかけはやめておこう。

2007/03/16

[雑記]   免疫力20倍

at 22:33JST
Yahoo!ニュース - 毎日新聞 - <人工リンパ節>マウスに移植、免疫力20倍 理化学研究所
http://headlines.yahoo.co.jp/hl?a=20070316-00000019-mai-soci

すさまじいアトピーになりそうだ。

[雑記]   Vectorコメントラリー

at 18:17JST
そんなことよりちょいと聞いてくれよ>>1よ。

こないだVectorが「オンラインソフトにレビューコメントつけると点数に応じて電子マネープレゼント」ってキャンペーンやってたんですよ、Vectorが。

1月は我ながらヒマだなあとは思いつつ上限いっぱいまでコメントつけて¥3,000ぶんもらえることに。で、送られてきたのが「BitCash」。プレゼントはBitCashかWebMoneyかどっちかで、こっちは選べないんだけどBitCashでもらうことになった。

ネット対応の電子マネーが悲惨な状態だってのは(かつてその業界にいたから)知ってるけど、改めて調べてみて愕然としたね。BitCashって、さらに対応サイトが激減しててほとんど使えない! 物販で「livedoorブックス」が対応してたからしめた!と思ったんだけど、見てみたらあの本屋、まともに商品がそろってないというすさまじい状態で…(なんか予約受付しかしてないの?)。

「こんなBitCashしかもらえないなら、もういいや」
と思って、次の月は¥1,000ぶんしかレビューしなかったんですよ。そしたらさっき通知があって、こんどはWebMoneyでくれて…。

WebMoneyだったら、まだ対応状況マシだから、もっとがんばってコメントしたよ!!!
(↑身勝手きわまりない)

まあ、多少マシという程度でどんぐりの背比べなんだけどね。

この使い道のない¥3,000と¥1,000どうしようか…。ちなみにEXじゃないのでヘンなアダルトサイトとかにも行けません(BitCashの存在意義ってEXにしかないと思う)。誰か8割で換金しろ。

[雑記]   五十六メソッドとか

at 12:05JST
知らぬ間にこんな雑誌(ムック)が出ていたらしい。

エンジニアマインド
http://www.gihyo.co.jp/magazines/emind/contents/Vol3



もはや突っ込む気力さえ失う…。エンジニアに特化した自己啓発マガジンかいっ。

あと、目次に「五十六メソッド」というのがあって、
「もしかしてホントに五十六じゃないだろな…」
と思ってググってみたら、ホントに五十六関連のメソッドらしい。もちろん提案者はウケ狙い含んでるんだろけどさ…。なんか、脳天気主戦論プロジェクトにちゃんと反対できず、途中で過労死するとかいうバッドエンドが見えるメソッドだぜ。

[雑記]   コーパスをもつかもたないか

at 04:02JST
特徴語抽出だが、いろいろ試したもののなかなか奥が深いね、やっぱ。

精度的にはやはりコーパスをもたせてやったほうが期待できるのだが、いま使っているヒューリスティクス方式(単なる経験則)でもそこそこの成績なので、とりあえずこのままで行くことにした。

単純にMeCabで形態素解析した結果にコーパスからスコアリングすると長い語が抽出できないのが不満だし、かといって我流で熟語の連結アルゴリズムを作ると誤差が出やすかったりして痛し痒しだし。

「純粋に統計的手法によったほうが、総合成績がよくなる」
というのはわかった。おれがガッコでやってたことはなんだったんだろねえ…。まあ、当時から言語学の方向性には異論ありありだったんだけどさ。

あと、解析状況を反映して学習していくとかいうのは、コスト対効果が著しく低いというのもなんとなくわかった。それならネットで大量にクローリングして、定時にバッチで辞書を更新させたほうが絶対いい。検証してないけど。

なんかこう、ぼくのやりかたは学問的でもないし技術者的でもないね。だめやね。

[雑記]   志賀原発の事故は東海村の4ヶ月前だったのか

at 01:56JST
調べてて気付いた。

今や、ろくに覚えていない人も多いだろう、99年10月の東海村で起きた
「ウラン溶液をバケツにどくどく注いでかきまぜてたら、臨界が起きちゃいました」
事故。当時の思い出というと、2ちゃんねらが「建物の屋根が吹き飛んでいる」というデマで踊って、はやくも群盲コミュニティの本性をあらわにしてたことだが…。

北陸電力が隠してた志賀の
「原発停めて点検してたらなんか制御棒がすっぽ抜けて臨界になって、おまけに停止装置も作動しませんでした」
事故は、実はその4ヶ月前に起きていたのだ。

東海村の事故をテレビで見ていて、志賀の関係者はなにを思っていたのだろう。「たいしたことのないレベル」では決してない事故だった。バレたらやばいと、ヒザがガクガクふるえてたんだろうな。

当時きちんと報告がなされていたら…二重奏で原発政策に大打撃になった? そういう考えもあるだろうが、それでマスコミや野党がいっせいに叩いていたら、もしかしたら現場での不備確認が徹底して、東海村の事故は起こらなかった可能性が高いんじゃないかと思う(実際にはあの事故は業界の構造的ゆがみがもたらしたものだが確率は下がったろう)。

ネトウヨがよく「マスコミが叩きすぎる」などと言うが、それはあまりに浅はかだ。やはり多くの力が錯綜し、監視しあってはじめて社会というシステムは回り続ける。自分たちの抱える問題点や危険性をパラノイア的に検証し続けなければ、この巨大な生態系は壊死しかねない。生物器官が情報伝達に神経やホルモンなど、過剰な多様性を備えているのと同じだ。

東海村で死んだ作業員の最後は悲惨だった。NHKのドキュメンタリーで放映されたのだが、彼は病床の数カ月で医師らとともに地獄を体験した。周辺住民らへの被害もそうだが、原子力の安全神話を守ろうという動きが防げたかもしれない人災を引き起こした。

こうした危険性は、他のエネルギー源にはない。火力発電所が爆発しても、せいぜい火事が起こるだけだ。水力? 風力? いずれも長期的にみた場合のリスクは原子力よりはるかに低い。二酸化炭素排出による環境負荷の低減など、万年単位で隔離する必要のある放射性廃棄物の危険性とは比較にならない。維持・管理の作業をするだけで、大量の低レベル放射性廃棄物がたまり続ける。毎日、コントロールできない爆弾を生産しているようなものだ。

感情論どころか、理性的に考えてもおはなしにならないのが原子力産業だと思うが。一度まわりはじめた歯車は、壊れるまで止まらない。

[雑記]   gooのWebOSは独自プロダクト?

at 01:00JST
gooラボで仮想デスクトップ「ウェブデスクトップ」が開始 - CNET Japan
http://japan.cnet.com/news/media/story/0,2000056023,20345287,00.htm

gooラボ ウェブデスクトップ実験
https://desktop.labs.goo.ne.jp:80/

これね(なんで80番ポートが指定されているのかはナゾ)。

ブラウザ内にOSというか、デスクトップメタファーを実現するプロダクトというのは今までもいくつかあったので、
「どうせそれのローカライズ版でしょ?」
と思ったんだけど、そうでもないみたいだ。

たとえば、

スタートフォース〜どこでも使えるブロードバンドデスクトップ
http://www.startforce.jp/

こんなのがあるんだけど、以前試用したときと操作感が違う。どっちがいい、ってほどではないのだが、こう中途半端にいじる必要もなかろうし、もしかしたらgooラボ独自開発なのかもね。

で、実際にさわってみた感想なんだけどさ、

20070316mage2.png


悪くない。作り込みの足りないJavaScriptアプリケーションにありがちな不安定さは感じず、比較的ロバストにできあがっていると思う。そうそうムリな描画もしていないので、1GHz以上のCPUを搭載したWindowsマシンならふつうに使えるだろう。

…が、しかしこれで何をやるのかというと「?」がつくな。

上の画面を見てもわかるんだが、メールをダブルクリックして開く(これはいいデザインとはいえない。ダブルクリックできない人が多いのに、わざわざWebOSでまでダブルクリックを再現する必要はなかったと思う)んだけど…内部ウィンドウでgooメールのブラウザアクセス画面が出るだけなんだわ。

…わざわざこの環境を使わなくても、直接gooメールにアクセスすりゃいいじゃん。

gooのストレージサービスなどに統合アクセスできるようにするための画面としてはいいね! ポータルの新しい方向性かも!─※

…と一瞬思ったが、それって単にgooの従来ポータルトップページのデザインが悪くて、メールやストレージに一元アクセスしやすくできていないってだけじゃね?

まあ、※の路線というのはアリだと思うので、もうちょっと多機能化したらおもしろいとは思うけどね。多機能化すると使い方がわかりにくくなるという両刃の剣。

それと、気がついたもっともダメな点。

このデスクトップウィンドウのonunloadイベントをlistenしていない(せいだよね?)ので、なんかの表紙にウィンドウを閉じてしまうと
「ああっ!」
となってしまう。ふつうはダイアログを出して確認すると思う。試してないけどIEの「ショートカットをブラウザを再利用して開く」を指定している人はもっと悲惨なことになるのではなかろか。

まあ、再ログインすると最後の状態が復元されるというのがウリなんだけど。ぼくがやってみたときはメールウィンドウのサイズ・配置が記憶されてなかった。

いろいろ悪口を書いたが、もし独自開発ならかなりイイ線行ってるスジを感じたのでがんばってほしい。

gooラボ スタッフブログ ウェブデスクトップ実験の開始について
http://blog.goo.ne.jp/labstaff/e/331dc5499ce4ca57dc818ce1c7f4b1d8

2007/03/15

[雑記]   コーパス関連の情報

at 21:50JST
ざらっと「すぐ使えるものがないか」調べてみたのだが、


・北九州市立大学日本語会話データベース
 http://www.env.kitakyu-u.ac.jp/corpus/
・国立国語研究所日本語話し言葉コーパス(有料)
 http://www.kokken.go.jp/katsudo/kenkyu_jyo/corpus/

てな感じで、あと未公開でさっきの

・国立国語研究所日本語書き言葉コーパス
 http://www.tokuteicorpus.jp/

で、これも有料になるのだろう。

どっちにしても用途にあわない。自作するしかないんだ…。

[を] Googleが大規模日本語データを公開するという話
http://chalow.net/2007-03-13-1.html

これも気になるが。

[雑記]   3/17, 18おでかけ

at 21:13JST
ちょっと日本語コーパスのリソースを探していたら、

日本語コーパス -平成18年度公開ワークショップ プログラム
http://www.ilcc.com/corpus/program.html

が見つかった。まだ空きがあるようなので行ってこよう。

…すごく忘れそうな気がするけど。

[雑記]   グルメの拳

at 19:57JST
いきなりデカい音が鳴るので、深夜に最大音量で見ること。

グルメの拳 ホットペッパー.jp
http://www.hotpepper.jp/doc/ken/

ネタ数が多すぎ。

[雑記]   ひとつおとなになった

at 13:42JST
いやー、驚愕の事実。

インスタントコーヒーって、腐るのね。
生まれてはじめて知った。

詳細は描写しない。

2007/03/14

[雑記]   オクラらは

at 22:51JST
(cache) Yahoo!ニュース - 毎日新聞 - 食中毒:チョウセンアサガオ誤って食べ 遠賀郡内の家族3人 /福岡
http://megalodon.jp/?url=http://headlines.yahoo.co.jp/hl%3fa%3d20070314-00000168-mailo-l40&date=20070314224609
チョウセンアサガオの実を、オクラと間違えてかき揚げにして食べ、約2時間後に症状を訴えた


ぼくはオクラがだいっきらいなので、
「それみたことか!」
と思ったんだけど、

有毒植物(東京都福祉保健局健康安全室)チョウセンアサガオ類
http://www.fukushihoken.metro.tokyo.jp/shokuhin//////////dokusou/01.html

似ても似つかないじゃないか、これ。

ししとうの天ぷらを飽きるほど食べたいな。

[雑記]   自宅で活版印刷

at 20:21JST
アダナ・プレス倶楽部:キットのご紹介 活版印刷機械・周辺機材
http://www.robundo.com/adana/kit/kit.html

むほー。一台欲しい〜…と言ってもなんに使うんだよ、おい。単なるインテリアになること間違いなし。

つーか、ぼくが思うに「活版印刷独特の押圧がかかったようなレタッチをするソフト」があったら、別に要らんような。

[雑記]   おさかなたべたいな

at 00:12JST
ひとりぐらししているとさかなは食べられない。

高いし腐るし、料理もめんどうだ。グリルを使って焼いたりするとあとしまつがたいへん。まあ、ぼくはシャケをラップで包んでレンジにかけるパターンで手を抜いてるけど、それでも元手がかかるのはどうしようもない。

久しぶりに、昨日は近所の寿司屋で青いのを食べてきた。ここは値段のわりにおいしいし、回転なのに注文制で気に入ってるんだけど。なんか
「バイト募集」
の貼り紙が出てた。問題はその下に
「外国人不可」
と書いてあったこと。

…一瞬で通う気が失せた。まあ、就労条件とかいろいろあんだろけどさ。気分悪くなった。ちなみにホール係の女性は外国人だった…意味わからん。

しかたなく、今度はコンビニでししゃものパックを買いだめしてきた。もう焼いてあるので、レンジで軽くあっためるだけでいい。にせもののししゃもでもうまい。代替資源を見つけてきた水産庁に感謝。

でもものたりない。

2007/03/13

[雑記]   Yahoo!

at 19:19JST
なんで2年経ってもカテゴリー登録されないのに、Yahoo!ニュースでは紹介するんだっつーの>Yahoo!

(今よりずっとPVの少ないサイトは2,3ヶ月で登録されたのにねえ)

2007/03/12

[雑記]   たまにはおちこむか

at 22:25JST
脳裏にときおり浮かぶともしびをたよりにがんばってはみるものの、やはり長くは続かず、自分の能力のなさや醜さに幻滅して嘆息する。それでも、生きていかねばならない。死ぬのはいや。

はあ、がっくり。

何か自分の外に守り育てるものがほしい、それを糧に生きることほど楽な生き方はないから、そうは思えど自分にはそんな道を歩き幸せを享受する資格はないのだと己に呪詛をかける。

寝るか。

[雑記]   過去の事例から見るとそれは期待できない

at 15:03JST
Bluetooth電子インクプラットフォームblueChute - Engadget Japanese
http://japanese.engadget.com/2007/03/11/e-ink-bluechute-bluetooth/
もともと書き換え時にしか電力を使わないE Inkだけあって(ソフトウェアさえちゃんとしていれば) かなりの長寿命になるとのこと


ぜったい
「E Inkの限界に挑戦!
 30fpsのアニメーションを再生してみたぞ!」
とか言うやつが出てきて、すべての前提が覆る予感。

[雑記]   すばらしいレポートだ

at 08:12JST
筆不精者の雑彙 : 今日の池袋界隈〜「ホワイトデー爆砕デモ」見学記
http://bokukoui.exblog.jp/4823930/

:)
たしかにバレンタインよりも質が向上しているように見える。

しかしまあ、あれだよね。機動隊や公安のバカげた対デモ警戒ぶりには呆れ果てているのだけれど、こういう用途に使うと非常に効果的だね。だって、無料で人数を増やしてくれるうえに警備までやってくれるんだよ。今後は、路上パフォーマンスのイロハとして
「いかに機動隊を動員するか」
が必須事項になるかもしれん。
さらに過去の記事
2009/04 (1)   2008/12 (3)   2008/11 (9)   2008/10 (10)   2008/09 (20)   2008/08 (2)   2008/07 (23)   2008/06 (16)   2008/05 (22)   2008/04 (11)   2008/03 (21)   2008/02 (20)   2008/01 (21)   2007/12 (32)   2007/11 (37)   2007/10 (46)   2007/09 (63)   2007/08 (33)   2007/07 (41)   2007/06 (81)   2007/05 (173)   2007/04 (168)   2007/03 (113)   2007/02 (123)   2007/01 (92)   2006/12 (111)   2006/11 (185)   2006/10 (20)  

広告


この広告は60日以上更新がないブログに表示がされております。

以下のいずれかの方法で非表示にすることが可能です。

・記事の投稿、編集をおこなう
・マイブログの【設定】 > 【広告設定】 より、「60日間更新が無い場合」 の 「広告を表示しない」にチェックを入れて保存する。


×

この広告は1年以上新しい記事の投稿がないブログに表示されております。