2017/05/08 02:45

今回のプロジェクトで製作するwebサイトでは、
商標そのものをキーワード検索する際に、
商標画像のOCR結果を検索対象とする予定です。

この記事では、
サイトで使用する予定のOCRサービスである Google Cloud Vision API を用いて、
実際の標準文字商標の画像に対するテキスト抽出を行い、
その精度を見ていきたいと思います。

標準文字商標以外の商標については、
前回のプロジェクトの活動報告に投稿したこちらの記事を参照してください。

商標画像で Cloud Vision API によるテキスト抽出を試してみた - CAMPFIRE(キャンプファイヤー)

なお、今回のテキスト抽出実験を行ったのは2017年2月です。
Cloud Vision API は継続的にアップデートされているため、
再度、同様の実験を行った場合、異なる結果になる可能性があります。

商願2017-137

商標画像:

これは、インテル・コーポレーションにより出願された標準文字商標の画像です。
この画像に対して Cloud Vision API によるテキスト抽出を行うと、
次のような結果になります。

テキスト検出位置:

抽出されたテキスト:
INTEL GO

この画像に関しては、問題なくテキスト抽出ができています。

 

以降は、様々な標準文字商標画像のOCR結果を見ていきます。

商願2017-279

商標画像:

テキスト検出位置:

抽出されたテキスト:
お茶にすっぺよ
つペ

なぜか一部の文字が二重に抽出されています。

商願2017-477

商標画像:

テキスト検出位置:

抽出されたテキスト:
ポン・デ・ショコラ

商願2017-775

商標画像:

テキスト検出位置:

抽出されたテキスト:
秘書が選んだ至極の逸品

商願2017-892

商標画像:

テキスト検出位置:

抽出されたテキスト:
きぐるみ天国

商願2017-915

商標画像:

テキスト検出位置:

抽出されたテキスト:
いも太とまめ次郎

商願2017-923

商標画像:

テキスト検出位置:

抽出されたテキスト:
CONCEPT

「愛」は抽出できませんでした。

商願2017-960

商標画像:

テキスト検出位置:

抽出されたテキスト:
フリマ出品

商願2017-1224

商標画像:

テキスト検出位置:

抽出されたテキスト:
ゴキファイタープロ

商願2017-1272

商標画像:

テキスト検出位置:

抽出されたテキスト:
スーパーわんにゃん楽園

商願2017-1450

商標画像:

テキスト検出位置:

抽出されたテキスト:
なりきり全身ムービ

末尾の音引き(ー)が抽出できていません。

商願2017-1740

商標画像:

テキスト検出位置:

抽出されたテキスト:
ぐーちよきぱーてぃ

末尾の音引きを抽出するのは苦手なのかもしれません。

商願2017-1816

商標画像:

テキスト検出位置:

抽出されたテキスト:
友チョコ方程式

商願2017-1835

商標画像:

テキスト検出位置:

抽出されたテキスト:
X e n o b a d e C h r o n i c l e s

すべての文字をばらばらに認識してしまっています。
また、"Xenoblade" の "l" が抽出できていません。

商願2017-1839

商標画像:

テキスト検出位置:

抽出されたテキスト:
SUPER MARIO ODYSSEY

商願2017-1853

商標画像:

テキスト検出位置:

抽出されたテキスト:
AMAZON PRIME

商願2017-2314

商標画像:

テキスト検出位置:

抽出されたテキスト:
PUYO PUYO

商願2017-2373

商標画像:

テキスト検出位置:

抽出されたテキスト:
ニンニク好きなだけお食べ

商願2017-2431

商標画像:

テキスト検出位置:

抽出されたテキスト:
CHROME CA ST

"CAST" が "CA" と "ST" に分かれてしまっています。

商願2017-2536

商標画像:

テキスト検出位置:

抽出されたテキスト:
果実まるGOD

商願2017-2546

商標画像:

テキスト検出位置:

抽出されたテキスト:
s a k u r a i o

すべての文字をばらばらに認識してしまっています。
また、"." が抽出できていません。

商願2017-2814

商標画像:

テキスト検出位置:

抽出されたテキスト:
こっち向いてボタン

商願2017-2855

商標画像:

テキスト検出位置:

抽出されたテキスト:
旨み ど!ストライクソース

商願2017-2993

商標画像:

テキスト検出位置:

抽出されたテキスト:
パリピポ

結論

Google Cloud Vision API により、
標準文字商標の画像からテキストを抽出してキーワード検索の対象とすることは、
完璧ではないものの、ある程度有効に機能するように思います。