MENU

無料相談

  1. HOME
  2.  > 
  3. サイト職人スタッフブログ
  4.  > 
  5. AIサービスからのサイト学習を拒否する設定方法

サイト職人スタッフブログ

AIサービスからのサイト学習を拒否する設定方法

d_eye_20231128

近年大きく技術が発展し、AIに関する話題は次から次へと登場しています。2023年も引き
続きChatGPTのAPI連携によるサービスが多数発表され、熱が冷める様子はありません
。Google BardやBing AIも対抗してAIサービスを次々と発表し、AI躍進の一年となりまし
た。

 

しかし、これらAIサービスはどこで様々な物事を学習し、サービスとしての完成度を高め
ているのでしょうか。なかには、自社のサイト情報がAI学習に使われることを快く思わな
い方もいるでしょう。AI学習を放置していると知らないうちに、自社コンテンツと類似す
るコンテンツ(例えば自社商品名やブログ)が文章として出力され、Webサイトで公開され
るといった事態にもなりかねません。

 

今回は、AIサービスはどこで学習を行っているのか、サイト学習を拒否する具体的な方法
についてわかりやすく解説していきます。

 

AIはどこで学習しているの?

Googleのポリシーでは「例えば、インターネットに一般公開されている情報やその他の公
開情報源からの情報を収集し、GoogleのAIモデルのトレーニングのほか、Google翻訳
、Bard、CloudのAI機能などのサービスや機能の構築に役立てることがあります」と明記
されています。

 

その他、Chat GPT、Bing等のAIサービスでも同様に情報が収集されています。特に
、Chat GPTのようなチャット型の場合は、ユーザーとの会話からも学習のための情報が収
集されています。そのため、企業で利用する場合は学習を拒否する設定を行うなど、対策
が必要となります。

 

AI学習を拒否する方法

コンテンツマーケティングを実践している会社は、AI学習を拒否する方法について、最低
でも手順くらいは知っておきましょう。実際にAI学習を拒否する方法についてご紹介しま
す。

 

Chat GPTのチャット学習の拒否方法

まずは、Chat GPTの履歴とAI学習を無効化する方法についてご説明します。具体的な手順
は、次のとおりです。

 

Chat GPT
https://chat.openai.com/

 

・ステップ1:公式Webサイトにアクセスしてチャットページを開く。
・ステップ2:画面左下の個人的に設定されている名称をクリックする。
・ステップ3:Settingsをクリックする。
・ステップ4:Showをクリックする。
・ステップ5:Chat History&Trainingをクリックしてスイッチをオフにする。

 

これによってChat GPTの履歴表示がオフになれば作業が正しく完了しています。ただし、
完全に監視されないというわけではなく、会話は30日間は保管・維持され、完璧に削除さ
れてしまう前に、不正防止に必要な場合に限り、確認される点に注意しておきましょう。

 

Chat GPT,Googleのサイト学習の拒否方法

次に、Chat GPTやGoogleのサイト学習の拒否方法についてご説明します。基本的には
、AIのサイト学習に使われたくなければrobots.txtでGoogle-Extendedを拒否指定すると良
いとのことです。

 

このようにルートディレクトリ内のrobots.txtに拒否する記述を行います。具体的には、下
記の記述どおりに作業を進めてください。

 

(*エディタ風にお願いします。*)
User-agent:GPTBot
Disallow:/

 

Use-Agent:Google-Extended
Disallow:/
(*エディタ風に*)

 

上記の記述によって、ChatGPTが自社コンテンツを学習することができなくなり、同時に
Googleのサイト学習も拒否している状態となります。Google-Extendedは、Google Bard
による自社コンテンツの学習を拒否することにもつながるため、学習拒否を希望する場合
は、設定を忘れないようにしましょう。

 

現在、ニューヨークタイムズやアマゾンなどのメジャーなサイトでもこのように拒否の記
述をしており、特にChat GPTの拒否設定はメジャーなサイトでも多く見られるようになり
ました。もし、学習されたくない場合は設定を行っておくことをおすすめします。

 

まとめ

もし、AIサービスによる学習をすべて拒否できるのなら、今すぐ対策したいという方もい
るかもしれません。現状、Bingの拒否方法は現段階で発表されておらず、完璧にAI学習か
ら逃れる方法というのは存在していません。

 

また、Googleは自社のAIツールのトレーニングにネット上に一般公開されている情報をす
べて使っているとしており、今回ご紹介した対策を実施していても全ての学習を防ぐのは
難しいといえるでしょう。自社コンテンツがAI学習されると聞くと嫌な気持ちになる方も
いるかもしれませんが、逆に学習されたからといって自社の価値が減るわけではありませ
ん。

 

今後も、自社だからこそ実現できる価値を継続的に公開していれば、AI学習によって高度
なコンテンツライティングが可能になっても、検索結果上での上位表示を維持できるでし
ょう。

PAGETOP