判決を予測する人工知能は実用化するか
2016年10月23日のBBCニュースは、人工知能がヨーロッパ人権裁判所の判決を予測し、8割近くの高確率で的中させたと報じた。
将来、人工知能が弁護士や裁判所の仕事を奪うという予測は多い。現に、米国の法律事務所では、裁判例や証拠の分析を行う人工知能が実用化されはじめているという報道もある。だが、少なくともわが国では、人工知能が発達しても、裁判所や弁護士の業務を代替することは当面起きないし、裁判の結果を予測することも(後述する少数の例外を除き)、実現しない。
その理由はとても簡単だ。わが国では、判決を人工知能に読み込ませることが、とても難しいからである。
現代の人工知能は、深層学習(ディープラーニング)技術の実用化により、自ら経験知を高める能力と、経験知に基づき予測を行う能力とを身につけつつある。但し、そのためには、膨大な基礎知識を学ばせなければならない。たとえば、離婚を認める判決が出た場合の慰謝料を人工知能に予測させるためには、数十万件の判決書を読ませなければならない。
人工知能に判決を読み込ませるためには、判決のデジタルデータ化が必要だ。ちなみに裁判統計によると、地方裁判所の民事・行政訴訟新受件数は昭和40年以来年10万件から20万件で推移している、平均年15万件であるとして、約50年で750万件となる。仮にその半分について判決が出ているとすれば約375万件だ。同様に刑事事件の判決数を推定すると50年で350万件、刑事の方は事件が途中で終了することがまずなく、大半の事件について判決が書かれるから、行政と民刑事を合計すると、昭和40年以降約725万件の判決が出ている計算になる。
一方、判例検索ソフトで最大手と思われる第一法規の収録裁裁判例数は平成28年11月現在で24万2060件。推定される上記判決数に比べると3%に過ぎない。この中には離婚や相続、交通事故や特許紛争など、あらゆる事例が含まれることからすれば、離婚など特定のジャンルの裁判例は、せいぜい数百から数千といったレベルだろう。これでは、人工知能に学ばせる事例の数としては、圧倒的に足りない。
しかも、判例雑誌や判例検索ソフトに収録される裁判例は、比較的珍しい事例や、新規性のある事案に偏っている。ごくありふれた事例についての判決文は収録されていない。だが、人工知能に正確な予測をさせるためには、まずもって、ごくありふれた事例を大量に読み込ませなければならない。言い換えると、判例雑誌や判例検索ソフトに掲載されている裁判例ばかり読み込ませてしまうと、人工知能は、間違った予測をしてしまうことになる。
これは推測だが、おそらく米国では、判例法国であることもあって、ごく普通の裁判例を含め、膨大な量の裁判例がデジタル化されて蓄積されているのではないだろうか。そもそも提起される裁判の母数が日本とは桁違いに多いということもある。すべて英語の横書きだから(当たり前だが)、スキャンしてデジタルデータ化するのは比較的容易だろう。しかしわが国では、デジタル化されている裁判例はおそらく全体の数パーセントであり、残りは紙のまま各地の裁判所に保管され、あるいは廃棄されている。生き残った判決書を人工知能に読み込ませるためには、すべてをスキャンしてOCRにかけ、デジタルデータ化しなければならない。
それだけでも大変な手間だが、わが国の場合、さらに困難な問題がある。判決書に記載された個人名の処理も大問題だが、おそらく最も大きな問題は、古い判決書が薄葉紙に和文タイプで打った代物で、しかも罫線があるという点だ。昭和40年代生まれまでなら記憶にあるだろうが、薄葉紙とは、半紙より薄く、向こうが透けて見えるほど薄い紙で、判決書のほか、遺言書や公正証書など、格式の求められる書類に使われていた。非常に薄いから、重ねてスキャンすることができないし、シートフィーダーにかければ破れてしまう。一枚一枚細心の注意を払ってスキャンするしかないが、それを数百万件分行うのは、費用面でも時間面でも、およそ不可能だ。ちなみに、それ以前の判決書は手書きになるので、現在の技術水準では、OCRは不可能となる。
このようなわけで、わが国の過去の裁判例を人工知能に読み込ませるのが不可能である以上、人工知能による判決の予測も不可能、という結論になる。デジタルの世界を論じるとき、忘れられがちだが最も大切なことは、デジタルとアナログの境目に存在するのだ。
もっとも、ごく限られた領域、たとえば交通事故における過失相殺割合や、損害賠償額については、ここ2~30年だけでも相当数の判決の集積があるし、事例のバリエーションも限定されているから、労を惜しまずスキャンして人工知能に教え込めば、判決の予測は可能になるだろう。商標や音楽の類似性についても、人工知能による判決予測が可能になると思われる。ただし、これらの限定された分野では、市場が限られているから、人工知能を育てるコストは、高止まりするだろう。コスト的に弁護士に対抗しうるほどの人工知能が登場するのは、難しいかもしれない。いいかえるなら、判決を予測する人工知能を開発するのであれば、今後日本中の裁判所で出される判決を、効率的にデジタルデータに変換しておく仕組みの整備が必要である。
| 固定リンク
| コメント (0)
| トラックバック (0)
最近のコメント