Thursday, June 12, 2008

犯罪予告検知のソフトウェア開発

犯罪予告検知のソフトウェア開発にかかる費用は数億円だそうです。
業界関係者によると、ソフト開発には少なくとも数億円の費用が掛かるという。 
とのことですが、その『業界関係者』が何を根拠に数億円と言ったのでしょうか?システムの見積もりってそんなに簡単だったかな?
でもお役所はそんなのやりそうですわ。
僕もお役所関係のお仕事をしたことがありますが、まあお金がかかるやり方しますね。
僕に言わせると、エンドユーザがお役所というだけで大きなリスクファクターです。
要件を抽出するだけで通常の数倍の時間かけちゃったり、全然見ない意味のないドキュメントを山ほど要求したり。
後戻りも多いんですよね。ミーティングほとんど出席しなくてドキュメントも全然読んでない偉い人が突然現れたと思ったら、決まったことを簡単に覆したりする。
さらにお役所の大きな案件を受注するのは、メーカー系などが多いんですが、そういう所って開発プロセスも古い手法で、仕様変更に弱いんですよね。
最初に決まった金額より増額することはないので、最初からそういう後戻りリスク等も含めた見積もりにならざるを得ない。
そして正直な話、元請けはぼったくってるかな~…
まあこのあたりはこんな程度でしか言えませんわ。
発注側(お役所)がもうちょっと勉強すれば、かなりコストを抑えられるんですけどね。
実際、某市役所に勤める元後輩(営業マンだったが、公務員試験を受けて公務員になった)から、
  • システム開発の要求(要件)抽出
  • システム開発に関わる見積もり(入札額)の妥当性チェック
といった仕事をやってくれないかと依頼がありました。
しかも、お金がないからコンサル契約ではなくて嘱託職員として安いギャラでって…
断りました…
「誰か居ませんか?」って言うもんだから「お前が営業だったらその仕事受ける?」って言ったら「そうなんですよね」って。
変なところで根拠なく金額を固定するからやりたいことも出来ない。
成果物がわかりにくいところに予算を投入しにくいんだそうです…

それで、0円で2時間で作ってみたという犯罪予告共有サイト『予告.in』
これはこれで面白いですね。
ただ、打ち合わせもなにもせずに簡単にできることだけで勝手に作ったものなので、コレが数億円のなにがしと置き換わるって思われちゃったらちょっとビックリですが。
総務省が作ろうとしてるのは、
言語技術を応用し、違法・有害情報の検出精度を向上させるもの。通常とは異なる急激な書き込みの増加や、自殺や殺人予告などの言葉を使った議論の流れなどを分析し、犯罪につながるような情報を認知できるようにする。
というものです。『予告.in』とはだいぶ違う。
でもそこそこ役に立つんじゃないでしょうか。
でも、「皆さんに消えていただきたいと思います」って掲示板に書き込んでも恐らく自動では引っかからないでしょうね。
そういう自然言語解析なども含めて開発するとなるとちょっとしたものになるでしょう。
単語、文章から『意味』を抽出するって難しそうです。でもベイジアンフィルターとか既存のテクノロジであるか。
日本語の文脈解析ってどの程度出来るのかな。
どっかでそういう研究してますか?

以前、企業の中傷などを掲示板などから抽出して報告するってサービスがあったと思いますが、今もやってるのかな。
そういうサービスを使うのもいいかと思うんですけど。
書き込みの内容が、当て字などから発展してほとんど暗号みたいになっちゃうと、クロールでは検出できないような気がします。
そこは半自動でやるのがいいのかなって思いますね。
そういう意味は、ネチズンの善意に頼った『予告.in』は、うまくいくと最強かもしれませんね。
悪意も沢山あるでしょうけど…

2 comments:

  1. いまやっているネットゲーム(リネ2)はチャット内の荒しを予防するために特定ワード(エロ、差別語。まん〇・全裸・死ね とか)を禁止にして表示できないようにフィルタリングしていますが、半角カタカナにするとひっかからなかったり、2ch用語などの「氏ね」とかはOKだったりします。

    なので検索システムができれば、みんな引っかからないように隠語を使って回避し始めるワケだし、ネット内での隠語や流行とかにも精通してる人が製作にも携わり、それらもHITするようにしないと意味無さそうですよね・・・


    今回の事件で掲示板を見た人が何人もサーバー側管理者に通報してたとのことですが、会社自体が休みで対応できず。

    この記事を見たときに、警察に直接通報してたら違ったのかな?とかも思いましたが、イタズラかもしれない書き込みを警察などに通報するのも勇気がいると思うし(相手にしてくれなさそう&めんどくさそう)、こういった「予告.in」みたいなサイトに匿名で情報提供して、ワンクッションおいて警察筋に伝わるのであれば情報提供者側も少し気が楽そうだな~ と思いました^^

    ReplyDelete
  2. リュウジ君おひさです。
    そうなんだよね、ある程度常連とか内輪じゃないとわかんない言葉もあるし。
    半角二文字使って一文字を表したりね。
    まあ善意も悪意も束ねることになるから、チェックする人は大変だろうけどね。
    総務省が作ろうとしてる、議論の流れみたいなものも検出するような仕組みがちゃんと動けば大したもんだなとは思います。

    ReplyDelete