テストツール
more
テストケース生成ツール
テスト自動化ツール
実機テストのクラウドサービス
テスト管理ツール
Facebook x

ジャンル

SEOの次はAIO!AI時代のWebサイト施策・LLMs.txtとは
開発に役立つ生成AI
開発に役立つ生成AI 更新日 2025.10.08
x hatenabookmark
0

SEOの次はAIO!AI時代のWebサイト施策・LLMs.txtとは

執筆: Qbook編集部

ライター

これまでは、Googleなどの検索エンジンで上位表示を目指すSEO(検索エンジン最適化)がWebマーケティングの主流でした。しかし、近年では生成AIの普及により、AIをターゲットとした対策を図る「AIO(AI最適化)」という考え方が広まりつつあります。

AIOの一環として注目されているのが「LLMs.txt」です。本稿では、AIOとは何かという基礎から、LLMs.txtの基本概念・実用性・書き方まで、Web開発者の視点で実践的に解説します。Webサイトの制作・開発に携わっている方は、ぜひ参考にしてください。

もくじ
  1. AIOとLLMs.txtに関する基礎知識
    1. AIO(AI最適化)とは
    2. LLM(大規模言語モデル)とは
    3. LLMs.txtとは
  2. LLMs.txtはAIO対策として効果的なのか
    1. Pre-Training(事前トレーニング)への有効性
    2. RAG(検索拡張生成)への有効性
  3. LLMs.txtとrobots.txtの違い
  4. LLMs.txtの基本的な書き方
    1. 分かりやすい場所に配置する
    2. Markdown形式で構造化する
    3. 「AIに伝えたい情報」を簡潔に記述する
  5. まとめ

1. AIOとLLMs.txtに関する基礎知識

LLMs.txtについて理解するためには、前提として「AIO」や「LLM」について知っておく必要があります。まずは、AIOやLLMの基本を整理したうえで、LLMs.txtについて見ていきましょう。

1-1. AIO(AI最適化)とは

AIO(AI最適化)とは、AIがWebサイトの情報を正しく参照・評価できるように、構造やコンテンツを最適化する手法です。従来のSEOがGoogleなどの検索エンジン向けであるのに対し、AIOはAI(厳密には、後述のLLM)に向けた対策となります。

AIOは、生成AIの普及にともない注目されるようになりました。生成AIは、Webサイト上の情報から学習し、その知識を踏まえて回答を生成します。一部の生成AIでは、Webサイトをリアルタイムに検索し、その内容を直接参照することも可能です(例:ChatGPTのブラウジング機能やGeminiなど)。

そのため、WebサイトをAIが理解しやすく最適化しておくことで、生成AIの回答に採用される確率を高められます。出典URLを明記する生成AIであれば、そこから自社サイトへの流入も期待できます。

「AIに参照されないように対策する」ではなく、「AIに参照されることを前提に対策する」のが、AIOの基本的な考え方です。

1-2. LLM(大規模言語モデル)とは

Webサイトの内容を参照・評価するのは、生成AIそのものではなく、内部に搭載されている「LLM(大規模言語モデル)」です。LLMとは、大量のテキストデータを学習し、言語の理解・生成能力を身につけたAIモデルを指します。

LLMは、入力された文章の意味や文脈を解析し、それに適したテキストを出力します。たとえば「日本の首都を教えてください」という質問を与えると、「日本の首都は東京です」といった自然な回答を生成できます。このように質問応答や要約、翻訳など多様な用途に対応しています。

このように、LLMは人間の言葉を解釈し、それに応じて反応できるのが特徴です。そして、LLMが回答を組み立てる際の根拠となるのが、インターネット上にあるWebサイトの情報です。

そのため、Webサイトの内容をLLMにとって分かりやすく整理しておけば、AIによる回答の中で自社の情報が使われるチャンスを高められます。

1-3. LLMs.txtとは

LLMがWebサイトの情報を参照するうえで、大きな課題があります。LLMは、検索エンジンのクローラー(Webサイトを巡回して情報収集するプログラム)とは違うため、Webサイトの情報を効率的かつ高精度には収集できません。

たとえば、Webサイト内に配置された広告がノイズとなり、LLMが伝えたい情報を正しく理解できないかもしれません。そこで登場するのが「LLMs.txt」です。

LLMs.txtとは、Webサイトの提供者が、AIに伝えたい情報を明示的に記述するための新しいファイル形式です。たとえば、Anthropic社が設置しているLLMs.txtでは、自社のAIモデル「Claude」に関する技術情報や、参照してほしいWebページのリンクなどが記載されています。AIが内容を把握しやすいよう、構造的に整理された形式です。

このように、LLMs.txtを用いることで、Webサイト上の重要な情報をAIに向けて明確に提示できます。

2. LLMs.txtはAIO対策として効果的なのか

LLMs.txtは比較的新しいファイル形式であり、「本当にAIO対策として効果があるのか」と疑問に感じる方もいるでしょう。実際、現時点ではその有効性について明確な結論は出ていません。

ここでは、LLMs.txtの有効性について、2つの観点から考えてみましょう。

2-1. Pre-Training(事前トレーニング)への有効性

Pre-Training(事前トレーニング)とは、LLMがあらかじめ大量のテキストデータを学習する工程を指します。Webサイトの情報がLLMの知識に含まれるかどうかは、この過程で決まります。

しかし2025年8月時点では、主要なLLM開発元が「LLMs.txtを学習データとして使用する」と明言している事例はありません。つまり、LLMs.txtを設置したとしても、Pre-Trainingによって情報が学習される保証はないのが現状です。

ただし、Anthropic社のようなLLMの権威がLLMs.txtを実際に公開していることは、今後の技術展開に大きな影響を与えるかもしれません。将来的には、LLMs.txtをLLMの学習データに含める動きが一般的となる可能性もあります。

現時点だと有効性は限定的ですが、今後の技術標準として位置づけられる可能性はあるでしょう。

2-2. RAG(検索拡張生成)への有効性

RAG(検索拡張生成)とは、AIが外部のWebサイトをリアルタイムで検索・参照し、その情報を踏まえて回答を生成する手法です。ChatGPTやGeminiのリアルタイム検索機能やDeep Research機能、AI検索エンジンのPerplexityなどが該当します。

RAGでは、AIがWebサイトの構造や内容をその場で読み取り、回答に反映します。情報が整理されていれば、それだけ出力の精度や信頼性も高まりやすくなります。

LLMs.txtを通して、取得してほしい情報の位置や優先度を明示できれば、AIが効率的にWebサイトの情報を参照できます。特にWebページを直接参照する場面では、その効果がはっきりと表れるでしょう。

Pre-Trainingでは意図的に対象外となるケースがありますが、RAGでは公開情報がそのまま活用されます。出典URLが明記されることも多いため、Webサイトへの流入にもつながりやすいです。

そのため、現時点ではRAGのほうがLLMs.txtを設置する効果が見込めるでしょう。

3. LLMs.txtとrobots.txtの違い

AIに関する対策ファイルとしては、LLMs.txtのほかに「robots.txt」もあります。いずれもWebサイトに設置されるテキストファイルですが、役割が異なります。

robots.txtは、検索エンジンのクローラーに対し、アクセスを制限するためのファイルです。Webサイトの提供者が、クローラーに「このWebページにはアクセスしないでほしい」といった指示を伝えるために使われます。

一方でLLMs.txtは、生成AIにWebページの情報を積極的に伝えるためのファイルです。どのWebページを参照してほしい、優先的に扱ってほしい、といった情報を明示します。

robots.txtが「見せたくない情報を制限する」ものであるのに対し、LLMs.txtは「見てほしい情報を整理して示す」ものだといえるでしょう。

4. LLMs.txtの基本的な書き方

ここでは、LLMs.txtの基本的な書き方について、3つのポイントを紹介します。LLMs.txtは新しいファイル形式であり、まだ標準化されているわけではありません。あくまで参考例としてご覧ください。

4-1. 分かりやすい場所に配置する

AIがLLMs.txtを発見しやすくするために、分かりやすい場所に配置しましょう。具体的には、Webサイトのルートディレクトリ(トップ階層)に設置するのが理想です。多くのAIクローラーやBotがルート直下のテキストファイルを探しやすいためです。

たとえば、WebサイトのURLがhttps://example.com/の場合、https://example.com/llms.txtのような場所に配置すると良いでしょう。あまり深い階層に設置すると、AIがファイルを見つけづらくなります。

4-2. Markdown形式で構造化する

LLMs.txtには、Markdown形式を使って情報を整理しましょう。Markdownとは、「#」や「-」といった記号を用いて情報を構造化する記法です。たとえば、以下のような書き方が考えられます。このように、情報をMarkdown形式で構造化することで、AIが理解しやすくなります。

# Webサイト名
補足説明文

## セクション名1
- [リンクタイトル1](https://example.com/link1): 補足説明

## セクション名2
- [リンクタイトル2](https://example.com/link2): 補足説明

4-3. 「AIに伝えたい情報」を簡潔に記述する

LLMs.txtでは、「AIに伝えたい情報」を簡潔に記述しましょう。AIに参照してほしいWebページのURLや、その概要などを記載します。たとえば、以下のような記述例が考えられます。このように、必要な情報を簡潔に盛り込みましょう。

# Example Corp.
自社サービスに関する信頼性の高い情報を生成AI向けに整理しています。参照対象として適切なWebページの一覧を記載しています。

## 製品・サービス
- [サービス紹介](https://example.com/service): 提供中の主なサービス内容や機能をまとめています。
- [料金案内](https://example.com/pricing): プランごとの料金と契約内容を掲載しています。

## サポート情報
- [よくある質問](https://example.com/faq): サービス利用に関する基本的な質問と回答を紹介しています。
- [お問い合わせ](https://example.com/contact): 質問やサポート依頼を受け付ける窓口です。

## 基本情報
- [会社概要](https://example.com/about)
- [採用情報](https://example.com/careers)

5. まとめ

LLMs.txtは、Webサイトの提供者がAIに対して正確な情報を伝えるための新しい手段です。従来のrobots.txtとは異なり、AIに伝えたい情報を積極的に提示できる特徴があります。

今後は検索だけでなく、生成AIを通した情報取得が増えると見られており、AIOの重要性も高まっています。LLMs.txtは、その対策として押さえておきたい施策の1つです。LLMs.txtを取り入れる際には、本稿の内容をぜひ参考にしてください。なお、LLMs.txtやAIOを取り巻く状況は急速に変化しています。最新動向も随時チェックしながら、適切な対応を行うよう心がけましょう。

開発に役立つ生成AI
x hatenabookmark
0

執筆: Qbook編集部

ライター

バルテス株式会社 Qbook編集部。 ソフトウェアテストや品質向上に関する記事を執筆しています。