物凄い大げさなタイトルになってしまいましたが、内容はそんな大したことはないです。いつものことですが。
ある日 ChatGPT を使っているときに、参考として Qiita の記事の URL を貼ったんですよ。ChatGTP に内容を読んでもらおうと思って。ところが ChatGPT はエラーになって読めませんでしたと返してきたんですね。手元のブラウザで同じ URL にアクセスすると正常に記事は表示されますから、システムトラブルということではなさそうです。おそらく Qiita が ChatGPT からのアクセスをブロックしているんだろうと想像します。あくまでも想像ですが。真相は Qiita の中の人でないと分かりませんからね。
なお、私はもしも Qiita が ChatGPT を含む生成 AI からのアクセスをブロックしていたとしても、それを非難したいとは思いません。2026年の現時点において、生成 AI のコンテンツ学習の倫理に答えは出ていません。フリーライドであるという批判はありますし、中には著作権無視の学習を行っている生成 AI もあるそうですから、これは倫理の問題ではなく犯罪ですよね。そもそも、自社の持っているコンテンツをどのように扱わせるかという決定権を持っているのは事業者自身です。他者にとやかく言われる筋合いはありません。
現実として分かっているのは、ChatGPT から Qiita 記事にアクセスが出来ない事象があった。これから推測するに、Qiita の全ての記事は ChatGPT(他の生成 AI も含む)の学習には使われていないと思われる。つまり、ChatGPT などの生成 AI で技術的な質問をしても、その回答には Qiita の記事にある内容は含まれないだろうということですね。
問題視したいのは私の気持ちなんですよ。気持ちというか、Qiita に記事を書いた目的というか。私としては自分の持っている知見を他の人にも共有したいというのが目的です。役に立ちたいと思って、記事を書いているわけですね。凄く大げさに言うと、人類の知に貢献したいと思って記事を書いています。記事を読む方法は Qiita で検索してでも構いませんし、検索エンジン経由でたどり着いてでも構いません。なんなら記事の内容だけ生成 AI に学習されて、Qiita 記事にアクセスされることなく内容だけ参照されても一向に構いません。目的は他者の役に立つことですから、生成 AI 上で提供されても目的は果たせますからね。でも現実には Qiita に書いた内容は生成 AI では利用されませんから、最後の方法では私の目的は実現できないわけです。これどうしましょうかねという話です。
繰り返しますが Qiita を非難したいわけではありません。ちゃんと読んでませんが、Qiita の利用規約にもそのような内容は書かれているでしょうし、その利用規約に私は同意して Qiita を利用しているので、反論も出来ません。嫌なら Qiita を利用しなければいいだけのことです。
対応法としては、生成 AI アクセスフリーをうたっているサービスに乗り換えることですかね。そんなサービスがあるかどうかは知りませんが。ここのサイトのルールを決めているのは私なので、ここに移動させるというのも方法ですが、こんな場末のサイトを生成 AI がクロールしてくれるかどうかっていう別の問題が発生しますけれども。Google のクローラーですら滅多に来ない過疎サイトですからねぇ。
ちょっと話は飛びますが、古代ギリシアでは他の文献を参照する場合、元の文章をまるまま書き写すことが主流だったと聞いたことがあります。引用ではなく、事実上の転載ですね。現代の著作権の常識からすると考えられないことですが、当時はそれが当たり前であったし、合理的でもあった。なぜかというと、当時は書籍を複製する手段は手作業による書き写ししかありませんでした。せっかく書籍を書いても、それを大量生産して広く普及させることが出来なかったわけです。書籍の複製が限られることから、年月とともに失われる書籍も多かったそうです。そうしたなかで、書籍そのものは失われたとしても、書いた文章の一部だけであっても他者の書籍の中で生き続けることを狙って、大量の転載が行われたそうです。実際、そうした転載文でしか知られていない古代ギリシアの書籍や学者も居るそうですからね。こうした慣習はおそらく印刷技術の発達とともになくなったんだろうと思われます。印刷技術によって書籍を大量生産することが出来るようになり、広く普及させることも、長く残すことも実現できるようになりましたからね。
何が言いたいかというと、コンテンツの扱い方って時代によって変わるということです。社会背景とか技術要素とか様々な要因が絡んでくるわけですね。現代の著作権の概念は印刷技術の発達以降に成立したものですが、その頃にはコンピュータやインターネットは存在しませんでした。著作権法をつぎはぎで対処してなんとかデジタル技術には対応していますが、生成 AI が登場して事情がまたガラッと変わってきました。そろそろ著作権法を含む、コンテンツの扱い方に関する考え方を大幅にアップデートする必要があるのではないかなと思うのです。
生成 AI の学習を禁止するのは、あくまでも現在の著作権の概念や、ウェブサービスのビジネスモデルに基づいた行動です。これらの背景が変われば、生成 AI に学習させるかどうかという判断も変わってくるのではないでしょうかね。
個人的には全てのコンテンツは将来的には AI の学習素材になると思っています。なぜなら人類の知識の総量は既に人間に扱えるボリュームを超えてしまっていて、AI を使わないと取り扱えないからです。全ての知的アクセスの起点が AI になったとき、AI に学習されていないコンテンツは存在しないのと同じことになるでしょう。そうなると困るのはコンテンツ提供者の方ですから、むしろ進んで AI にコンテンツを差し出すようになると思われます。
かつて検索エンジンに拾われていないコンテンツは世の中に存在しないのと同等と言われた時代がありました。その前には検索エンジンがフリーライダーだからとアクセスブロックしていたこともありましたね。今の生成 AI に対する態度と同じ構図です。その後、検索エンジンを使ってアクセスを誘導した方がビジネス的に有利だということになって検索エンジンクロールは自由になりました。生成 AI に対しても同じような変化が現れる可能性は高いと個人的には思っています。