google 類似検索 スタート


http://similar-images.googlelabs.com/


思ったより、早く、開始しましたね。
ま、labsでのサービスですが。


品質は高いです。


画像の中の類似するものを、候補としてあげてくれる、
画像検索では、すぐれものです。


いままでgoogleが10年やってきた、
画像の近くのtextによって、
コンテクスト的に、類似するコンテクストがある
画像を候補としてあげる。
という手法と、真逆の手法です。


画像そのものに対して、
何度も、ピクセルレベルで、類似性のポイントを
解析して、データ化し、
そのデータ化した要素どおしを比べることにより
類似の画像を抽出しています。



Similar Searchとしてサービスをするにあたって、
裏のサーバーでやっていることは、
1)画像の中の、主要なオブジェクト抽出を行う(max 3個くらいだろうか)
2)画像の中の、オブジェクト通しの位置関係を記号化しデータ化
3)オブジェクトごとのテクスチャーの色の抽出
4)画像全体の色の抽出


それ以外にもやっているかもしれませんが、
これで、おおよそ似てる画像というものは、
集めることができます。


これにより、何ができるのか?


1)同じ画像を集める。似た画像を集める →これ自体は、どうでもよいこと
2)著作権違反の画像を探し出す。→これは、著作権者にとても、重宝される機能
アイコレ、パクリ画像、偽物ブランド、偽物キャラをサーチできるのです。


たとえば、
ビートルズのアルバムジャケットのパロディ、発見です。


http://similar-images.googlelabs.com/images?q=beatles&prev=%2Fimages%3Fq%3Dbeatles%26hl%3Den&qtype=similar&tprev=%2Fimages%3Fq%3Dbeatles%26hl%3Den&tbnid=oIMvPU6vC07LXM&prev=/imgres%3Fq%3Dbeatles%26qtype%3Dlanding%26tbnid%3DoIMvPU6vC07LXM&tprev=/images%3Fq%3Dbeatles%26hl%3Den


ある製品が、世界各国の販売店によって、間違ったブランディングをされていないかの
チェックもできるかもしれません。


画像の縦横比、壊れてますよ。とか。 画像、勝手にトリミングしないでくださいよ。
とか。 画像の中に、テキスト挿入しないでくださいよ。とか。


http://similar-images.googlelabs.com/images?q=hige&qtype=similar&tbnid=oCp_DTmYJqbBGM&prev=/images%3Fq%3Dhige%26qtype%3Dsimilar%26tbnid%3DBajPKE_nm_IflM&tprev=/images%3Fq%3Dhige




3)人の撮影した画像を、勝手に使用している人を突き止められます。
4)同一の画像を利用しているサイトを発見することにより、blog主同士の、
交遊関係等をあばくことができます。


ま、他にも、「同一画像が、別サイトに使用されている」という事実、
「ある画像をちょっといじった画像が、なんらかの理由で別のサイトに利用されている」という事実を
忠実にネット全体でサーチすることができるので、
そこから、類推され浮かび上がってくる事実をうきぼりにすることができるのです。


これを動画に応用できるようになるのも、
時間の問題です。


画像処理の解析エンジンを開発するのは、優秀な
グラフィックチップ設計のエンジニアがいれば、できることですが、
全体のサービスにおいて、
googleが他社を圧倒するのは、
以下の2点。


1)最大の検索サイトであるため、保有する画像サンプル数の豊富さ
(そして、YouTubeでの動画のサンプル数の豊富さ)
2)画像を分析するに足る、バックエンドで高速に処理できる解析サーバー


この2つにより、
新しく、画像解析エンジンがバージョンアップしたり、
分析ポイントを増やすことが決定した瞬間に、
再度、全画像を、解析しなおすだけの、
解析サーバーを自社でもっているのです。


これは、ものすごいことで、
たぶん、
MSなんて、
足もとの、爪のアカにも及ばないと思われます。(笑)


当然のことながら、一人会社とか、一人研究者なんか、
どうにもなんないです。




なんか、ネットの画像系、全部、googleに持っていかれそうです。


Flickrにバナー広告が入りはじめるのも、時間の問題かもです。




.