「研究」のススメ(6)~データの分析~

 

こんにちは、知財実務情報Lab. 専門家チームの田中 研二(弁理士)です。

 

前回は「データの集め方」について説明したので、今回は集めたデータの分析方法について紹介します。

 

筆者は、体系的研究を行う場合、データ分析は概ね以下の流れで行っているので、ステップごとに説明します。

 

 

なお、前提として、収集したデータがどのような母集団から抽出されたものなのか、どのような条件で除外・選別されているのかは認識しておく必要があります。こうした前提によって、分析結果から言えることが変わってくるためです。

 

この辺りは前回までの記事で説明したので、以下では分析対象データの確認は済んでいる前提で、具体的な分析手順を紹介します。

 

 

1.類型化する

集めたデータを体系的に分析するのであれば、一番大事なのはこの「類型化」(パターン分け)です。

 

たとえば、サポート要件の反論の有効性を調べたいのであれば、少なくとも以下の(a)(b)を整理する必要があります。

 

(a)どのようなパターンのサポート要件違反があるか

(b)それに対してどのようなパターンの反論があるか

 

そうしたパターンが整理できて初めて、「パターンAのサポート要件違反に対してはパターンXの反論が有効そうだ」といった分析をすることができます。

 

それではどうやって類型化すればよいのでしょうか?

 

(1)類型化手法1:経験と仮説

ある程度の経験があれば、だいたいどのような反論パターンがあるかは理解できているでしょうし、「このような反論が有効なのではないか」といった仮説を立てて分析に臨んでいると思います。まずは、こうした経験則と仮説に基づいて類型化してみることになります。

 

なお、「(a)どのようなパターンのサポート要件違反があるか」については、審査基準で既に類型化されているので、その分類だけで十分なのであればラクですね。ただし、仮説次第ではもっと細かな(または別観点の)類型化が必要になることも多いです。

 

 

(2)類型化手法2:生成AIによる類型化

このようなパターン化は生成AIがかなり得意とするところですので、集めたデータ一式を生成AIに読ませて類型化させることも非常に有効です。

 

生成AIを使う場合、私は以下のようなCSVデータを読ませることが多いです。

 

 

これで、大まかには拒絶理由も反論もパターン化してくれます。

 

ただし、いずれの手法を取るにせよ最初の類型化はあくまで仮置きであり、後述のタグ付けや集計結果の確認を通じて、類型の追加・統合・修正が必要になることもあります。

 

 

2.タグ付けをする

類型化したら、案件ごとにタグ付けをしていきます。作業としてはここが一番大変。

 

以下のように、「拒絶理由の類型」と「反論の類型」欄を追加して、一件一件拒絶理由と意見書の内容を確認し、該当する類型にタグ付けをしていくことになります。

 

 

実際にタグ付けを行っていく中で、当初の類型だけでは足りず、さらなる類型を追加することもあります(この場合、それまでに見てきた案件も見直さないといけなくなりますが・・・)。

 

タグ付けは生成AIに手伝ってもらうこともできますが、最終的には正しくタグ付けできているかの目視確認が必要になります。

 

 

3.集計する

無事にタグ付けが完了したら、集計作業を行います。

 

まずはExcelのピボットテーブルを使ったり、集計結果を生成AIに読ませて集計させたりすることで、全体像を把握します。

 

まずは反論類型ごとの成功率を確認した後、たとえば技術分野別、拒絶理由の類型別などに細分化して各反論類型の成功率を見てみましょう(下図は、拒絶理由の類型×反論の類型のクロス集計で反論成功率を算出した表の例です)。

 

 

生成AIはこの集計作業が非常に得意なので、一通りの集計結果の概観を把握するだけなら、生成AIとのチャットで完結できるかもしれません。

 

とはいえ、生成AIの計算ミスチェックやその後のグラフ加工なども考えると、最終的にはcountifs関数などを使ってちゃんと再現可能な形で集計する必要があります。

 

また、もう一つ重要なのは、件数や成功率などの数字はあくまで以下の考察の出発点に過ぎないという点です。たとえば、「反論成功率80%」といっても5件中4件成功なのか100件中80件成功なのかで誤差の大きさが全く違いますし、そもそも母集団自体が成功しやすい事例のみの集合となっている可能性もあります。数字だけを見て結論を出すのではなく、「前提条件」や「個別事例の考察」もセットで考えるべきです。

 

 

4.個別事例を見ながら考察する

一通り集計が完了したら、集計結果を考察してみましょう。

 

たとえば、特定の技術分野や特定の拒絶理由類型だけに有効な反論類型があったとしたら、それはなぜなのか?

 

こうした考察は、単に集計の数字だけ見ても深まりません。その類型に該当する個別事例を具体的に確認することで、必ず何かの気づきが得られるはずです。

 

この個別事例の確認フェーズが、実務的には一番勉強になるところです。反論の研究であれば、自分では絶対に思いつかないような反論手法で権利化している事例がたくさん見つかると思いますよ。

 

なお、この段階で最初の類型化がイマイチだったな~と気づくこともままあります。自分一人の研究ならもう一度やり直せばいいのですが、委員会などの大規模チームで研究している場合はなかなかツライものがあります。

 

 

5.実務上の示唆を得る

考察ができれば、後はそれを実務上の留意点としてまとめるだけです。

 

自分の実務用であれば、拒絶理由応答や明細書作成のためのシンプルなチェックリスト形式や判断フローの形にまとめてもよいですし、論文として発表するならもう少し詳細に整理するとよいでしょう。

 

また、成功パターンだけでなく、拒絶査定の内容まで確認して失敗パターンを整理するのも、実務的に意義のある研究成果になりそうです。

 

 

6.まとめ

今回は、典型的な分析手法をできるだけ具体的にイメージできるように説明してみました。

 

もちろん今回の流れとは異なるやり方もたくさんあります(特に今回は、大量のデータから全体的な傾向を見出すための体系的な分析手法を取り上げています)が、一つの分析例として、ご自身で研究をする際の参考にしていただければ幸いです!

 

 

田中 研二(弁理士)

専門分野:特許権利化(主に機械系、材料系)、訴訟