今回のプロジェクトで製作するwebサイトが、どんな人の役に立つのかを説明します。 業務として商標登録出願をチェックしている方 最新の商標登録出願情報をチェックする手段としては、J-PlatPat 以上の利便性を提供するつもりです。 趣味として商標登録出願をチェックしている方 特定の出願人による商標登録出願をチェックすることで、新商品・新サービスの情報をいち早く知ることができるかもしれません。 業界の動向を知りたい方 業界の各企業による商標登録出願をチェックすることで、業界全体や競合企業の動向を知ることができるはずです。 個人投資家の方 注目している企業による商標登録出願をチェックすることで、その企業の次の一手を知ることができるかもしれません。 少し細かいことを言うと、今回製作するサイトでは、午前0時頃に発行される公報のデータが、遅くとも1~3時間程度でデータベースに反映され、サイト上で閲覧できるようになります。公報発行日の午前9時までに、最新の商標登録出願情報をチェックできるということです。 商標速報botからの大量出願者の排除を望む方 下記の記事に書いた通り、このプロジェクトが成立すれば、商標速報botは大量出願者の商標を投稿しないようになります。 商標速報botにおける大量出願者の扱いについて - CAMPFIRE(キャンプファイヤー) 商標速報botの存続を望む方 現在の商標速報botは、無料サービスを組み合わせた不安定なバックエンドの上で動いています。今回のプロジェクトが成立することにより、バックエンドが安定し、これからも長く商標速報botを運営することができるようになります。 こんなところでしょうか。全力で従事する所存ですので、ご支援のほど、よろしくお願い致します。
今回のプロジェクトに付随することとして、商標速報botにおける大量出願者の扱いの変更について説明します。 大量の商標登録出願を行う者がいる問題についてご存じない方は、下記の記事などを参照してください。 商標乱発、国全体の1割出願 男性「あくまでビジネス」:朝日新聞デジタル 結論から言うと、今回のプロジェクトで製作するwebサイトが一旦完成した際には、大量出願者により出願されている商標を、商標速報botにおいて投稿しないようにします。 大量出願者を看過してきた理由 これまで、商標速報botでは、大量出願者による出願に対して特別な対応を取ってきませんでした。これは、特に価値判断は行わずすべての出願を投稿する、という私の意向によるものです。商標速報botは、情報配信サービス的な側面とネタbot的な側面を持ち合わせていると思いますが、情報配信サービスとして見た場合、中立性は維持した方がいいと考えていました。 一方、大量出願の問題は何らかの形で可視化しておいた方がいいのではないかという考えもありました。ありがたいことに商標速報botには多くのフォロワーがいます。大量出願などの行為があれば、それが多くの人の目につき、問題として認識する人が少しずつ増えていく。広く問題として知られるようになれば、対処法など問題に対する知見を蓄積・共有しやすくなるのでは…と。(一個人がそこまで考える必要は無いのかもしれませんが…。) 現在の状況 結局、大量出願を法的に規制するのは難しいらしく、現在に至るまで問題は解決されていないわけですが、いくつかの動きはありました。特許庁が注意喚起を出したり、朝日新聞がこの問題を取り上げたりしています。 自らの商標を他人に商標登録出願されている皆様へ(ご注意) | 経済産業省 特許庁 商標乱発、国全体の1割出願 男性「あくまでビジネス」:朝日新聞デジタル 問題の解決にこそ至っていないものの、然るべき機関が動く状況になっていると見なすことはできます。そのため、もはや商標速報bot上でこの問題を可視化し続ける必要は無いのでは…と考えています。 フィルタリングの方法 ただ、情報配信サービスとしての中立性を考えると、特定の情報を恣意的にフィルタリングするのは好ましくなく、基準を明示した上でフィルタリングを行うべきだと思います。 例えば、ある年において同一の出願人による商標登録出願が1000件を超えた場合、その出願人を大量出願者と見なし、1000件を超えた時点からその年の終わりまで、その出願人による出願を投稿しない…といった運用を考えています。 このような運用をするためには、各出願人がある年において何件の商標登録出願を行っているかを把握しておく必要があります。実は、現在の商標速報botのバックエンドでは、各出願のデータをツイートの投稿が済み次第削除しています。二度と使わないデータを残しておいても意味が無いためです。つまり、出願データを蓄積しておらず、各出願人の商標登録出願件数を把握する手段は持っていないということです。 今回のプロジェクトで製作するwebサイトでは、当然、出願データを蓄積していくことになります。これにより、各出願人の商標登録出願件数を把握することができるようになり、商標速報botにおいて出願件数に基づいたフィルタリングが可能になります。 まとめ 以上をまとめると、今回のプロジェクトで製作するwebサイトが一旦完成した際には、大量の商標登録出願を行っている出願人により出願されている商標について、明確な基準に基づくフィルタリングを行い、商標速報botにおいて投稿しないようにします。 なお、大量出願者により出願されている商標を確認したいという方には、今回製作するサイトを使っていただくことになります。情報配信サービスとしての中立性は、botではなくサイトの方で確保することになります。
今回のプロジェクトで製作するwebサイトの仕様について簡単に説明します。 「商標登録出願情報を最速でチェックできるwebサイト」と称しているのは、公開商標公報(商標登録出願情報を掲載した公報)のデータを素早く(公報の発行から数時間以内に)データベースへ反映させることで、特許情報プラットフォーム(J-PlatPat)よりも早く商標登録出願情報を検索・参照できることを意味しています。 公式に提供されている公報検索・参照サービスであるJ-PlatPatでは、直近1か月ほどの間に登録出願された商標の公報については、参照はできるものの検索することができません。(なお、J-PlatPatにおいて公報が参照可能になるのは公報の発行から約9時間後です。)今回製作するサイトでは、J-PlatPatでまだ検索対象になっていない公報データについても検索できるようにします。 検索機能の概要 商標登録出願情報を検索する際に、検索条件として使える主なデータは下記の通りです。もちろん、複数の条件を組み合わせた検索も可能です。 商標 当然と言えば当然ですが、まず商標そのものがキーワード検索の対象となります。標準文字商標(文字列として出願された商標)では商標の文字列自体が検索対象となります。それ以外の、画像により出願された商標については、画像のOCR結果が検索対象となります。 OCRの精度については、使用するOCRライブラリ/サービスに依存することになります。使用するOCRサービスの候補としては、Google Cloud Vision API などが挙げられます。Cloud Vision API によるテキスト抽出の精度については、下記の記事を参考にしていただければと思います。 商標画像で Cloud Vision API によるテキスト抽出を試してみた - CAMPFIRE(キャンプファイヤー) 商標のタイプ 立体商標、動き商標、ホログラム商標、色彩のみからなる商標、音商標、位置商標といった、商標のタイプを指定して検索することができます。 商標の詳細な説明 新しいタイプの商標(動き商標、ホログラム商標、色彩のみからなる商標、音商標、位置商標)については、「商標の詳細な説明」もキーワード検索の対象となります。 出願人 特定の出願人による出願のみを検索することができます。 出願日/公開日 出願日や公開日を範囲指定して検索することができます。ある一定の期間に出願/公開された商標を調べることができます。 商品及び役務の区分並びに指定商品又は指定役務 特定の区分を含む出願のみを検索することができます。指定商品・指定役務を対象にキーワード検索することもできます。 代理人 特定の代理人による出願のみを検索することができます。 検索機能に付随する各種機能 ユーザー登録をしていただくことにより、さらに便利な機能が使えるようになります。なお、ユーザー登録により使えるようになる機能の一部は有料とする予定です。・出願人の住所の表示・検索条件の保存・検索条件に合致する商標登録出願がなされた際のメール通知…といった機能を順次実装する予定です。有料・無料の線引きをどこに置くかは思案中ですが、納得感のある形にしたいと思っています。 おわりに 商標速報botにしてもそうなんですが、私自身がユーザーなので、便利そうな機能はどんどん追加していきたいと考えています。こんな機能があれば便利なのでは? といったご意見のある方は、Twitterなどでぜひお伝えください。もちろん、支援者様のご要望には優先的に対応するつもりです。
今回のプロジェクトで製作するwebサイトでは、最新の商標登録出願情報を対象とした強力な検索機能をサイトの中核とする予定です。 画像により出願された商標については、画像のOCR結果が検索対象となります。 この記事では、サイトで使用するOCRサービスの有力候補である Google Cloud Vision API を用いて、実際の商標画像に対するテキスト抽出を行い、その精度を見ていきたいと思います。 商願2016-1547 商標画像: これは、株式会社王将フードサービスにより出願された音商標の画像です。この画像に対して Cloud Vision API によるテキスト抽出を行うと、次のような結果になります。 テキスト検出位置: 抽出されたテキスト:本商標は、「餃子1日200万個」という人の声が聞こえる構成となっており、全体で約1秒間の長さである。 この商標画像に関しては、完璧なテキスト抽出ができています。 以降は、様々な商標画像のOCR結果を見ていきます。 商願2016-59343 商標画像: テキスト検出位置: 抽出されたテキスト:仮面ライダーエグゼイドーーーKAMEN RIDER EX-AID "仮面ライダーエグゼイド" の "ーエ" の部分が、なぜか3つの長音符号(ー)として認識されてしまっているものの、最低限のことはできていると言えます。 商願2016-76824 商標画像: テキスト検出位置: 抽出されたテキスト:SUPER LARIDBB08D これは難しかったようです。 商願2016-76828 商標画像: テキスト検出位置: 抽出されたテキスト:SUPERMARIO WORLD 個人的には、先ほどの商願2016-76824(SUPER MARIO BROS.)で上手くいかなかったので、より特殊なフォントを使っているこれは無理だろうと思っていたのですが、上手くいきました。 商願2016-110792 商標画像: テキスト検出位置: 抽出されたテキスト:ラ453- さすがに難しかったようです。 商願2016-115869 商標画像: テキスト検出位置: 抽出されたテキスト:ジユナイパソユJUNAIPER 商願2016-115870 商標画像: テキスト検出位置: 抽出されたテキスト:ガオガエンGAOGAEN 商願2016-115871 商標画像: テキスト検出位置: 抽出されたテキスト:アシレーメASHIRENE 商願2016-115869(ジュナイパー/JUNAIPER)、2016-115870(ガオガエン/GAOGAEN)、2016-115871(アシレーヌ/ASHIRENE)は、ポケモンシリーズ最新作に登場するポケモンの名前です。つまり最近作られた造語です。登場してから間も無い、非アルファベットの造語は少し苦手という傾向があるのかもしれません。 商願2016-122484 商標画像: テキスト検出位置: 抽出されたテキスト:KirbyCafé 商願2016-127499 商標画像: テキスト検出位置: 抽出されたテキスト:PREMIUMGRANOLAごろっとグラノーラ 商願2016-127600 商標画像: テキスト検出位置: 抽出されたテキスト:宇宙人を漬物にするのが趣味です。 商願2016-128396 商標画像: テキスト検出位置: 抽出されたテキスト:職業イケメン 句読点が無視されてしまっています。 商願2016-128440 商標画像: テキスト検出位置: 抽出されたテキスト:/EONイオンウォレット "AEON" が "/EON" になっていますが、これは仕方ないでしょう。 商願2016-128543 商標画像: テキスト検出位置: 抽出されたテキスト:スポ-"KL 商願2016-128658 商標画像: テキスト検出位置: 抽出されたテキスト:はろうきてい茶寮 商願2016-128850 商標画像: テキスト検出位置: 抽出されたテキスト:黒字たまねぎたまが 抽出結果には余計なものも含まれていますが、手書き風の文字もある程度認識できるようです。 商願2016-131135 商標画像: テキスト検出位置: 抽出されたテキスト:STRAIN 商願2016-131491 商標画像: テキスト検出位置: 抽出されたテキスト:背中すっきり5歳をめざすブラ 商願2016-132082 商標画像: テキスト検出位置: 抽出されたテキスト:くまもとふるさと食の名人とと人もさ名まるのくふ食 横書きか縦書きかを判別できなかったのか、抽出結果には両方のパターンが含まれています。 商願2016-133338 商標画像: テキスト検出位置: 抽出されたテキスト:Qもぎたてフレッシュ キュアピーチ!! と言わざるを得ません。それはともかく、ヒヨコマークが"Q"と認識されています。 商願2016-133393 商標画像: テキスト検出位置: 抽出されたテキスト:ひんやりもも 縦書きも問題なく認識しています。 結論 完璧とまでは言えませんが、Google Cloud Vision API によるOCRは、そこそこ実用的な精度を持っているように思います。