
2023年10月11日
(丸の内中央法律事務所報No.43, 2023.8.1)
現在、AI技術が世界中で急速な進化・普及を遂げております。
その中でも、「生成AI(あるいは生成系AI)」と呼ばれるサービスが新たに注目されるようになっており、対話型AIの「Chat GPT」や、画像生成AIの「Midjourney」などのサービスが続々と登場し、世界中で利用者が急激に増加しています。
今回は、画像生成AIの活用の仕方をご紹介しつつ、生成AIの利活用におけるリスクの問題についてご説明したいと思います。
生成AIは、文章、画像、音声、イラストなどのさまざまなコンテンツを「創造」することが出来るという点に大きな特徴を有しております。
従来のAI技術は、データの整理・分類や、情報の特定・予測することなどを得意とし、一定の数値データや、テキストデータなどの構造化された形で結果が出力されるものがほとんどでした。
しかし、生成AIの場合は、情報の整理や特定だけではなく、与えられた命令・指示(プロンプト)に基づいて、新たなコンテンツ(文章、画像、音声など)を創造することが出来るという点に大きな特徴を有しております。
そして、生成AIは学習に使用したデータ量や学習のさせ方によってアルゴリズムが大きく異なってくるため、AIサービスごとに様々な「画風」が生まれることになります。
例えば、ホームページ掲載用の素材として、画像生成AIを使って、弁護士に関する画像・イラストを生成してみましょう。
無料で公開されている画像生成AIをいくつか使って、「丸の内」、「弁護士」、「東京」などの命令・指示を入力すると、以下のような画像を入手することが出来ました。
使用するAIサービスによって「画風」に随分と違いがありますが、そのほとんどでスーツ姿の人物が描かれていることから、やはり弁護士といえばスーツというイメージが持たれており、AIもそうした特徴を画像に反映しているものと思われます。
表情や服装に不自然さが残っているものもありますが(無料版ということも影響してるいるかもしれません)、今後ますます技術が進んでいけば、より自然な人物画像が出力されるようになるものと思われます。
◆「Deep AI」という画像生成AIサービスで「Marunouchi, Japan, Lawyer」というキーワードから出力された画像
出典:Deep AI
◆「Microsoft Bing イメージクリエーター」という画像生成AIサービスで「丸の内、東京、弁護士」というキーワードから出力された画像
出典:Microsoft Bing イメージクリエーター
◆「お絵描きばりぐっどくん」という画像生成AIサービスで「丸の内 東京 弁護士」というキーワードから出力された画像
出典:お絵描きばりぐっどくん
このように、短時間で多種多様なコンテンツを作成出来るという点で大きな魅力を有する生成AIですが、サービス提供者、ユーザー側のいずれの立場であっても、生成AIを利活用していくうえで一定のリスクがあります。
①生成AIの学習データとして第三者の知的財産権(著作物、商標等)を利用して良いかどうか
AIを開発する際には学習データが欠かせません。画像生成系AIを開発するためには、膨大な量の画像を学習させる必要があるため、この際に第三者の知的財産権や、ロゴなどの商標が含まれる可能性があります。
AIに学習させるために他者の著作物を利用する行為については、「情報解析」(著作権法第30条の4第2号)に該当すると考えられているため、学習データとして利用することについて著作権法上は問題ないと考えられております。
商標の問題についても、学習データとして利用する行為については、商標法で定める「使用」(商標法第2条第3項)あるいは商標的使用(商標法第26条第1項第6号)に該当しないと考えられていることから、学習データに使用する限りでは商標権も侵害しないと考えられております。
ただし、これらはあくまで学習データとして利用する限りで認められているということに注意が必要です。
次項で説明するように、作成された生成物と既存の著作物・登録商標との間に同一性・類似性が認めら、依拠性も認められるような場合は、生成物を使用することについて著作権等の侵害となる可能性があるので、注意が必要です。
②生成AIを利用して生成した画像や文章等を事業等に使用することの可否
たとえ画像生成AIが生成した画像であっても、第三者の著作物と同一・類似し、かつ、他人の著作物に依拠して作成されたものである場合は、著作権侵害となる可能性があります。
「類似性がある」「既存の他人の著作物と同一、又は類似している」とするには、他人の著作物の「表現上の本質的な特徴を直接感得できること」が必要とされ、「創作的表現」が共通していることが必要だとされております。
また、「依拠」とは、「既存の著作物に接して、それを自己の作品の中に用いること」をいい、既存の著作物を知らず偶然に一致した場合などには、依拠性はないとされております。
これまでの裁判例では、後発作品の制作者が、既存の著作物を知っていたかどうか、また、同一性の程度、後発作品の制作経緯などから総合的に判断されてきました。
しかし、生成AIに関しては画像を創造するのがAIであるため、従前の判断枠組みとは異なる判断枠組みをする必要があるでしょう。
具体的には、❶AIの学習データに当該著作物を用いているかどうか、❷AIの利用者が当該著作物を学習データに使用されていることを認識しているかどうか(現実的には、AI利用者が学習データの対象を把握することは困難かと思われます)、❸AIの利用者が既存著作物と同一・類似したものを作成するために、あえて既存著作物に類似した画像が生成されるような指示・命令を入力したかどうかなどを踏まえて検討する必要があります。
画像生成AIを利用して画像を生成した場合は、利用者は、当該画像を用いて行おうとしている利用行為(公衆送信・譲渡等)について、既存の著作物と類似性していないかどうかなどを注意するとともに、どのような過程を経て生成された画像なのか(どのようなAIを利用したのか、入力した指示・命令内容、出力された内容など)について、作成経緯を記録しておくと良いでしょう。
生成AIの利活用をするうえで、秘密情報・個人情報の扱いについても注意が必要です。
Chat GPTなどの文章作成系AIは、文章の要約や議事録の作成などが可能であるところ、実際に、海外の大手精密機械メーカーの従業員が、システムのソースコードや会議の音声をAIにそのまま入力して、議事録を作成しようとしたという事件も起きております。
一見すると、AIに入力するだけなら問題ないかのようにも見えますが、AIによっては、入力した情報(プロンプト)を利用して再学習をしているものもあるため、単にAIを利用する意図で入力したつもりでも、AIが当該入力情報を学習データとして取り込んでしまい、第三者への回答の際にこうした秘密情報・個人情報が含まれた回答をしてしまう可能性も否めません。
このように、単にAIを利用しようと思っただけでも、場合によっては秘密情報・個人情報の漏洩に繋がりかねないリスクがあるため、こうした点についても注意が必要です。
生成AIが抱える問題として、特に文章生成AIにおいて、虚偽の情報を生成してしまうという問題があります。
私が以前、文章生成AIに対して「重富智雄について教えて」と入力したところ、とある地方の政治家であったり、日本を代表するアパレル企業の社長であるなどという、全く事実と異なる結果が出力されたこともあります(なお、現在は「重富智雄について十分な情報がありません」と表示されるようになりました)。
Chat GPTのような文章生成AIは、それらしい内容がとても自然な文章で回答されてくるため、虚偽だと気付けなければ、AIの示した虚偽の回答を盲信してしまう可能性もあります。
実際、アメリカでは弁護士が訴訟の資料作成にChat GPTを利用した結果、存在しない判例を引用してしまったという出来事がありました。
生成AIは業務を効率化するうえで非常に有益なツールとなる可能性を秘めた新技術ですが、その利活用をしていくうえでは本稿でご紹介したようなリスクがあることに注意が必要です。
以上